以下の指標の中から、二つ以上(複数)を選択して、データの概要(description)を記録し、データを WDI で取得し、以下の分析をする。
それぞれについて考察(気づいたこと、疑問など)を記す
これは、課題1と課題2の合わせたものです。課題1も課題2も終わった人は、挑戦してください。
2023.2.17.23:59 までに Moodle の課題2追加提出ボックスに提出してくださればフィードバックを書きます。。
Refugee population by country or territory of asylum:SM.POP.REFG [Link]
Refugee population by country or territory of origin:SM.POP.REFG.OR [Link]
Net ODA received (% of GNI):DT.ODA.ODAT.GN.ZS [Link]
Net official development assistance and official aid received (current US$):DT.ODA.ALLD.CD [Link]
Net ODA received (% of central government expense):DT.ODA.ODAT.XP.ZS [Link]
Military expenditure (current USD):MS.MIL.XPND.CD [Link]
Military expenditure (% of general government expenditure):MS.MIL.XPND.ZS [Link]
Arms imports (SIPRI trend indicator values):MS.MIL.MPRT.KD [Link]
Arms exports (SIPRI trend indicator values):MS.MIL.XPRT.KD [Link]
Description:
概要:
これまでとも同じように二つのパッケージを読み込み(load)ます。
変数名を指定します。なるべくわかりやすい名前にします。
この変数名は、今後使いますから、重要です。一応、例として、わたしが使った、変数名を書いてあります。他の変数名を使っても構いません。extra = TRUE
とすると、地域名(region)や、収入レベル(income)などが追加されます。
data ディレクトリに書き込んでおきます。
データ名で、中身を表示できます。head(df_refugee)
とすると、6行表示されます。
変数の情報を得ることができます。
データには country
のところに、国だけでなく、地域も入っているので、地域のリストを、iso2c
で REGION
に入れておきます。
REGION <- c("1A", "1W", "4E", "6F", "6N", "6X", "7E", "8S", "A4", "A5",
"A9", "B1", "B2", "B3", "B4", "B6", "B7", "B8", "C4", "C5", "C6",
"C7", "C8", "C9", "D2", "D3", "D4", "D5", "D6", "D7", "EU", "F1",
"F6", "M1", "M2", "N6", "OE", "R6", "S1", "S2", "S3", "S4", "T2",
"T3", "T4", "T5", "T6", "T7", "V1", "V2", "V3", "V4", "XC", "XD",
"XE", "XF", "XG", "XH", "XI", "XJ", "XL", "XM", "XN", "XO", "XP",
"XQ", "XT", "XU", "XY", "Z4", "Z7", "ZB", "ZF", "ZG", "ZH", "ZI",
"ZJ", "ZQ", "ZT")
地域名にはどのようなものがあるか見ておきます。
国名も、地域(region)と、所得レベル(income)と共に、表示しておきます。
まずは、NA
の値を削除します。そのあとで、国の情報の数を数えたいので、!(iso2c %in% REGION)
で、上でおいた、地域の iso2c を選択し、!
は否定でしたから、地域ではないものを選択し、その数を棒グラフにしています。
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
cols = c(refugee_asylum, refugee_origin)
と、一つの指標にまとめるものをリストすると、name
に指標名が入り、value
に、その値が入る。書式は、pivot_longer(cols = ..., names_to = ..., values_to = ...)
で、初期設定では、names_to = "name", values_to = "value"
となっているので、指定しないと、下のようになる。Help 参照。
col = name
と指定すると、色で区別して、一つのグラフに描ける
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
それぞれのデータが十分ある最近の年の値のヒストグラム(度数分布)
分け方の数 bins や、幅 binwidth を適切に変更
必要に応じて、log10 スケール(scale_x_log10())を使う。
気づいたこと・疑問点
データが十分ある最近の年の値の10カ国の値の棒グラフ
必要に応じて、LOG10 (scale_x_log10(), scale_y_log10()) スケールを使う。
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
必要時応じて、ログスケール(scale_y_log10())
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問
気づいたこと・疑問