以下の指標の中から、一つを選択して、データの概要(description)を記録し、データを WDI で取得し、以下の分析をする。
それぞれについて考察(気づいたこと、疑問など)を記す
2023.1.27. 23:59 までに Moodle の演習の課題ボックスに提出したものについては、なるべく、早く見て、フィードバックを書きます。それ以降に提出されたものも見ますが、フィードバックは遅くなると思ってください。
School enrollment, primary (% gross):SE.PRM.ENRR [Link]
変数名:primary
School enrollment, secondary (% gross):SE.SEC.ENRR [Link]
変数名:secondary
School enrollment, tertiary (% gross):SE.TER.ENRR [Link]
変数名:tertiary
Mortality rate, under-5 (per 1,000 live births):SH.DYN.MORT [Link]
変数名:under5
Incidence of HIV (% of uninfected population ages
15-49):SH.HIV.INCD.ZS [Link]
変数名:hiv
School enrollment, primary and secondary (gross), gender parity
index (GPI):SE.ENR.PRSC.FM.ZS [Link]
変数名:school_gpi
Ratio of female to male labor force participation rate (%)
(modeled ILO estimate):SL.TLF.CACT.FM.ZS [Link]
変数名:job_gpi
Unemployment, female (% of female labor force) (modeled ILO
estimate):SL.UEM.TOTL.FE.ZS [Link]
変数名:female_unemploy
Unemployment, male (% of male labor force) (modeled ILO
estimate):SL.UEM.TOTL.MA.ZS [Link]
変数名:male_unemploy
Net official development assistance and official aid received
(current US$) DT.ODA.ALLD.CD [Link]
変数名:oda
概要:
データ名:
データコード:
変数名:
概要:
library(tidyverse)
library(WDI)
WDI パッケージを使って、直接データをダウンロード
REGION <- c("1A", "1W", "4E", "7E", "8S", "B8", "EU", "F1", "OE", "S1",
"S2", "S3", "S4", "T2", "T3", "T4", "T5", "T6", "T7", "V1", "V2",
"V3", "V4", "XC", "XD", "XE", "XF", "XG", "XH", "XI", "XJ", "XL",
"XM", "XN", "XO", "XP", "XQ", "XT", "XU", "XY", "Z4", "Z7", "ZF",
"ZG", "ZH", "ZI", "ZJ", "ZQ", "ZT")
SOUTH_AFRICA_FIVE <- c("South Africa", "Namibia", "Eswatini", "Botswana", "Lesotho")
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
参考:平均的な値を曲線で表すことも可能です。loess を使うと滑らかな曲線で近似してくれます。
気づいたこと・疑問
気づいたこと・疑問
参考:平均的な値を曲線で表すことも可能です。loess を使うと滑らかな曲線で近似してくれます。
df_under_6.85 |> filter(country %in% CHOSEN_COUNTRIES) |> drop_na(under_6.85) |>
ggplot(aes(year, under_6.85)) + geom_line(aes(col = country)) +
geom_smooth(formula = 'y~x', method = "loess", se = FALSE)
気づいたこと・疑問
データの数から、まずは、2020年について見てみる。
気づいたこと・疑問
参考:SACU の5カ国の値を縦線で書き込むには下のようにします。
df_under_6.85 |> filter(year == 2010) |> filter(country %in% SOUTH_AFRICA_FIVE)
参考:日本とSACU の5カ国の値を縦線で書き込むには下のようにします。
JP <- 0.5
SAF <- df_under_6.85 |> filter(year == 2010) |> filter(country %in% SOUTH_AFRICA_FIVE) |> pull(under_6.85)
df_under_6.85 |> filter(year == 2010) |> filter(!(country %in% REGION))|>
drop_na(under_6.85) |>
ggplot() + geom_histogram(aes(under_6.85), binwidth = 1) +
geom_vline(xintercept = SAF, col = "red") + geom_vline(xintercept = JP, col = "blue") +labs(title = "貧困率(1日6.85ドル以下)", subtitle = "日本:青、SACU:赤")
気づいたこと・疑問
df_under_6.85 |> filter(year == 2019) |> drop_na(under_6.85) |>
filter(!(iso2c %in% REGION))|>
arrange(desc(under_6.85)) |> head(10) |>
ggplot(aes(fct_reorder(country, under_6.85), ed_exp)) + geom_col() +
coord_flip() + labs(title = "Top 10 Countries", x = "country", y = "poverty rate (under $6.85 per day)")
気づいたこと・疑問
df_under_6.85 |> filter(year == 2019) |> drop_na(under_6.85) |>
filter(!(iso2c %in% REGION))|>
arrange(under_6.85) |> head(10) |>
ggplot(aes(fct_rev(fct_reorder(country, under_6.85)), under_6.85)) + geom_col() +
coord_flip() + labs(title = "Lowest 10 Countries", x = "country", y = "poverty rate (under $6.85 per day))
気づいたこと・疑問