以下の指標の中から、二つを選択して、データの概要(description)を記録し、データを WDI で取得し、以下の分析をする。
それぞれについて考察(気づいたこと、疑問など)を記す
CO2 emissions (metric tons per capita) :EN.ATM.CO2E.PC [Link] (co2pcap)
Forest area (% of land area):AG.LND.FRST.ZS [Link] (forest)
Renewable electricity output (% of total electricity output):EG.ELC.RNEW.ZS [Link] (renewable)
Electricity production from oil, gas and coal sources (% of total):EG.ELC.FOSL.ZS [Link] (fossil)
Electricity production from nuclear sources (% of total):EG.ELC.NUCL.ZS [Link] (nuclear)
データ1:名前、コード、変数名、リンク
概要:
データ2:名前、コード、変数名、リンク
概要:
library(tidyverse)
library(WDI)
データのダウンロードと保存:コードと変数名を指定。
データの名前は、変えたほうがよいので、例でも、df_w6eda_2 や、df_w6_2 に変えてあります。自分で決めたものを使うと、より練習になります。
df_w6eda_2 <- WDI(indicator = c(co2pcap = "EN.ATM.CO2E.PC",
forest = "AG.LND.FRST.ZS"),
extra = TRUE)
2回目からは、data から読み込めるようにしておく ファイル (Rmd) の保存場所に data フォルダがあることを確認
write_csv(df_w6eda_2, "data/w6eda_1.csv")
df_w6eda_2 <- read_csv("data/w6eda_2.csv")
df_w6eda_2
str(df_w6eda_2)
df_w6_2 <- df_w6eda_2 |>
select(country, iso2c, year, co2pcap, forest, region, income)
df_w6_2
df_w6eda_2 |> drop_na(co2pcap, forest) |>
ggplot(aes(year)) + geom_bar()
country には、国と地域両方が入っています。地域の iso2c は以下のものです。
REGION <- c("1A", "1W", "4E", "6F", "6N", "6X", "7E", "8S", "A4", "A5",
"A9", "B1", "B2", "B3", "B4", "B6", "B7", "B8", "C4", "C5", "C6",
"C7", "C8", "C9", "D2", "D3", "D4", "D5", "D6", "D7", "EU", "F1",
"F6", "M1", "M2", "N6", "OE", "R6", "S1", "S2", "S3", "S4", "T2",
"T3", "T4", "T5", "T6", "T7", "V1", "V2", "V3", "V4", "XC", "XD",
"XE", "XF", "XG", "XH", "XI", "XJ", "XL", "XM", "XN", "XO", "XP",
"XQ", "XT", "XU", "XY", "Z4", "Z7", "ZB", "ZF", "ZG", "ZH", "ZI",
"ZJ", "ZQ", "ZT")
df_w6eda_2 |> filter(iso2c %in% REGION) |> distinct(country, iso2c)
df_w6eda_2 |> filter(!(iso2c %in% REGION)) |> distinct(country, iso2c, region, income)
BRICS <- c("Brazil", "Russian Federation", "India", "China", "South Africa")
df_w6_2 |> drop_na(co2pcap) |> filter(country == "Japan") |>
ggplot(aes(year, co2pcap)) + geom_line() +
labs(title = "日本の一人当たりの二酸化炭素排出量")
気づいたこと・疑問
df_w6_2 |> drop_na(forest) |> filter(country == "Japan") |>
ggplot(aes(year, forest)) + geom_line() +
labs(title = "日本の森林面積(%)")
気づいたこと・疑問
df_w6_2 |> drop_na(co2pcap) |> filter(country %in% BRICS) |>
ggplot(aes(year, co2pcap, col = country)) + geom_line() +
labs(title = "BRICS の一人当たりの二酸化炭素排出量")
気づいたこと・疑問
df_w6_2 |> drop_na(forest) |> filter(country %in% BRICS) |>
ggplot(aes(year, forest, col = country)) + geom_line() +
labs(title = "BRICSの森林面積(%)")
気づいたこと・疑問
必要に応じて log10 スケール
df_w6_2 |> ggplot(aes(forest, co2pcap, col = region)) + geom_point()
df_w6_2 |> drop_na(co2pcap, forest) |>
ggplot(aes(forest, co2pcap)) + geom_point(aes(col = region)) +
geom_smooth(formula = 'y~x', method = "lm", se = FALSE)
df_w6_2 |> filter(!(iso2c %in% REGION)) |> drop_na(co2pcap, forest) |>
ggplot(aes(forest, co2pcap)) + geom_point(aes(col = region)) +
geom_smooth(formula = 'y~x', method = "lm", se = FALSE)
df_w6_2 |> filter(!(iso2c %in% REGION)) |> filter(year == 2020) |> drop_na(co2pcap, forest) |>
ggplot(aes(forest, co2pcap)) + geom_point(aes(col = region)) +
geom_smooth(formula = 'y~x', method = "lm", se = FALSE)
気づいたこと・疑問
df_w6_2 |> filter(!(iso2c %in% REGION)) |> filter(year == 2020) |> drop_na(co2pcap, forest) |>
select(co2pcap, forest) |> cor()
気づいたこと・疑問