はじめに
まずは、謝るところから始めないといけません。テンプレートをそのまま、使うと、エラーが出てしまいます。問題なかったかたもおられると思いますが、それは、今回の授業の作業をしたプロジェイウトに続けて、作業をしたからだと思われます。スクリプトの中で、wdi_cache
をもう一度読み込むことを忘れていました。それが、どこに保存されているかも確認していなかったので、テンプレートには、最初の、setup
と書いてある、コードチャンクの次に、wdi_cache <- WDIcache()
をしておかないといけませんでした。それを追加した上で、コメントを書きます。
気づいて、しっかり読み込んでくださった方もおられました。申し訳ありません。
まだ、data
フォルダを作成していなければ、次のコード・チャンクを実行します。作成してあれば不要です。
dir.create("./data")
次も、もし、data
フォルダーに、wdi_cache.RData
が入っていれば実行する必要はありません。
wdi_cache <- WDIcache()
write_rds(wdi_cache, "./data/wdi_cache.RData")
おそらく、すでに、wdi_cache.RData
は、data
フォルダにあると思うのでこの下のコードだけで十分なはずです。
wdi_cache <- read_rds("./data/wdi_cache.RData")
本来は、皆さんが課題で取り組んでくださったことに対して、しっかりと応答を書くべきところですが、しばらく、時間が取れないので、皆さんが、調べてくださった、WDI
コードのリストだけ、書いておきたいと思います。ひょっとすると、漏れているものもあるかと思いますが、それは、お許しください。最初のリストは、コピー・ペーストをしたので、見落とした可能性は大です。しかし、他のクラスメートがどんな指標について調べたのかを知ることは、勉強になると思います。
実は、わたし自身、非常に感銘を受けました。流石に、中級マクロの受講生ですね。調べたい、インディケータをたくさん持っておられる。それを、わたしも確認したいということも、このリストを作った、目的です。
最初のリストを作ってから、やはり、WDI Name
と言われる名前や、概要などの情報も欲しいですよね。それをつけたものを、下で作成しています。今回は、そこまでとして、応答は、また時間があればとさせてください。
実は、テンプレートからコピーをするときに、最初の行が落ちているために、Preview
ができていなかった人。Notebook ではなく、R Markdown から、HTML
を作ったために、コードをみることができなかったもの。
また、OECD
などから、データを取ってきて調べてくださった方もおられましたが、そのサイトの
URL
が書いてなかったので、わたしは、探せなかったものなどもありました。
まあ、それも、練習ですし、今回が最初ですから、そのようなことが起こることは、織り込み済みですから、気にしないでください。少しずつ、質が上がると良いですね。最初の始めてみようには、R
Markdown の説明もビデオとともに付けてあります。
そのようなものも見てみると良いでしょう。
海蔵寺先生も言っておられましたが、基本は、
身近なデータを取ってきて図にする。一連の作業を文書化する。
だと、思っています。Posit Primers も最初は、Visualization
から始めています。わたしも、それがよいと思っています。そして、再現性
(Reproducibility)
と、コードチャンクで実行していることを、説明していく、Literate
Programming のためのものが、この RNotebook
です。再現性は、とても、大切です。自分のためにも。特に、データをどのように取得するかは、丁寧に、書いておいてください。WDI
の場合は、コードだけで十分ですが、本来は、取得した日にちも必要です。ただ、それは、上の、Date
のところに書いてあり、自動的に、更新されます。
少しずつ進んでいっていただけると嬉しいです。
みなさんが、選んでくださった、WDI コード
url_indicators <- "https://ds-sl.github.io/intro2r/data/indicators.csv"
df_indicators <- read_csv(url_indicators) %>% left_join(wdi_cache$series)
Rows: 89 Columns: 1── Column specification ───────────────────────────────────────────────────
Delimiter: ","
chr (1): indicator
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.Joining with `by = join_by(indicator)`
write_csv(df_indicators, "./data/indicators.csv")
df_indicators
下のコードを実行してもみることができます。
View(df_indicators)
この続きは、いずれ時間があればと、させてください。
課題 1 - Assignment
1
下に4種類、6個のテンプレートがあります。指標 indicator
と、略称 short_name
と、いくつかの国名
chosen_countries
を、入れ替えて、試してみてください。
コピー・ペーストしてもっと増やしても構いません。最低4種類、4個。テンプレートと同じものは不可。
<!- - indicator は、WDI コード、short_name は、WDI
コードの簡単な名前(英数のみスペースもない方がよい。underscore _
は可。chosen_country はデータに含まれる country 名。wdi_cache
でも確認可能) –>
テンプレート Templates
一つの国についての、一つの指標(WDI)と、その略称から、折線グラフ
Line Plot with one indicator with abbreviation and one country
chosen_indicator <- "SL.UEM.TOTL.NE.ZS"
short_name <- "unemployment"
chosen_country <- "United States"
WDI(country = "all", indicator = c(short_name = chosen_indicator), extra=TRUE, cache=wdi_cache) %>%
filter(country == chosen_country) %>%
ggplot(aes(year, short_name)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator, ": ", short_name, " - ", chosen_country),
y = short_name)
いくつかの国についての、一つの指標(WDI)と、その略称から、折線グラフ
Line Plot with one indicator with abbreviation and several
countries
chosen_indicator <- "SL.UEM.TOTL.NE.ZS"
short_name <- "unemployment"
chosen_countries <- c("United States","United Kingdom", "Japan")
WDI(country = "all", indicator = c(short_name = chosen_indicator), extra=TRUE, cache=wdi_cache) %>% drop_na(short_name) %>%
filter(country %in% chosen_countries) %>%
ggplot(aes(year, short_name, col = country)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator, ": ", short_name), y = short_name)
一つの国についての、二つの指標(WDI)と、その略称から、折線グラフ
Line Plot with two indicators with abbreviation and one country
chosen_indicator_1 <- "NY.GDP.DEFL.KD.ZG"
short_name_1 <- "gdp_deflator"
chosen_indicator_2 <- "CPTOTSAXNZGY"
short_name_2 <- "cpi_price"
chosen_country <- "United States"
WDI(country = "all", indicator = c(short_name_1 = chosen_indicator_1, short_name_2 = chosen_indicator_2), extra=TRUE, cache=wdi_cache) %>%
filter(country == chosen_country) %>%
pivot_longer(c(short_name_1, short_name_2), names_to = "class", values_to = "value") %>% drop_na(value) %>%
ggplot(aes(year, value, col = class)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator_1, ": ", short_name_1, "\n", chosen_indicator_2, ": ", short_name_2, " - ", chosen_country)) +
scale_color_manual(labels = c(short_name_1, short_name_2), values = scales::hue_pal()(2))
chosen_indicator_1 <- "SL.TLF.CACT.MA.NE.ZS"
short_name_1 <- "male"
chosen_indicator_2 <- "SL.TLF.CACT.FE.NE.ZS"
short_name_2 <- "female"
chosen_country <- "United States"
WDI(country = "all", indicator = c(short_name_1 = chosen_indicator_1, short_name_2 = chosen_indicator_2), extra=TRUE, cache=wdi_cache) %>%
filter(country == chosen_country) %>%
pivot_longer(c(short_name_1, short_name_2), names_to = "class", values_to = "value") %>% drop_na(value) %>%
ggplot(aes(year, value, col = class)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator_1, ": ", short_name_1, "\n", chosen_indicator_2, ": ", short_name_2, " - ", chosen_country)) +
scale_color_manual(labels = c(short_name_1, short_name_2), values = scales::hue_pal()(2))
いくつかの国についての、二つの指標(WDI)と、その略称から、折線グラフ
Line Plot with two indicators with abbreviation and several
countries
chosen_indicator_1 <- "NY.GDP.DEFL.KD.ZG"
short_name_1 <- "gdp_deflator"
chosen_indicator_2 <- "CPTOTSAXNZGY"
short_name_2 <- "cpi_price"
chosen_countries <- c("United States", "France", "Japan")
WDI(country = "all", indicator = c(short_name_1 = chosen_indicator_1, short_name_2 = chosen_indicator_2), extra=TRUE, cache=wdi_cache) %>%
filter(country %in% chosen_countries) %>%
pivot_longer(c(short_name_1, short_name_2), names_to = "class", values_to = "value") %>% drop_na(value) %>%
ggplot(aes(year, value, linetype = class, col = country)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator_1, ": ", short_name_1, "\n", chosen_indicator_2, ": ", short_name_2)) +
scale_linetype_manual(labels = c(short_name_1, short_name_2), values = c("solid", "dashed"))
chosen_indicator_1 <- "SL.TLF.CACT.MA.NE.ZS"
short_name_1 <- "male"
chosen_indicator_2 <- "SL.TLF.CACT.FE.NE.ZS"
short_name_2 <- "female"
chosen_countries <- c("United States", "France", "Japan")
WDI(country = "all", indicator = c(short_name_1 = chosen_indicator_1, short_name_2 = chosen_indicator_2), extra=TRUE, cache=wdi_cache) %>%
filter(country %in% chosen_countries) %>%
pivot_longer(c(short_name_1, short_name_2), names_to = "class", values_to = "value") %>% drop_na(value) %>%
ggplot(aes(year, value, linetype = class, col = country)) + geom_line() +
labs(title = paste("WDI ", chosen_indicator_1, ": ", short_name_1, "\n", chosen_indicator_2, ": ", short_name_2)) +
scale_linetype_manual(labels = c(short_name_1, short_name_2), values = c("solid", "dashed"))
