Rによる自動データ収集 読書めも1

estis2018/05/10 (木) 21:32 に投稿

p.6 の
yend_clean <- unlist(str_extract_all(danger_table$yend, "[[:digit:]]{4}$")) は、
現在の https://en.wikipedia.org/wiki/List_of_World_Heritage_in_Danger から読み込んだデータだと、
str_extract_all(danger_table$yend, "[[:digit:]]{4}$") で期待する値が取れない。
2001–
のように、「–」があるためだ。
なので、

> yend_clean  <- str_extract_all(danger_table$yend, "[[:digit:]]{4}–$")
> danger_table$yend <- as.numeric(str_sub(yend_clean, 1, 4))

した。