Rによる自動データ収集 読書めも1

estis2018/05/10 (木) 21:32 に投稿

p.6 の
yend_clean <- unlist(str_extract_all(danger_table$yend, "[[:digit:]]{4}$")) は、
現在の https://en.wikipedia.org/wiki/List_of_World_Heritage_in_Danger から読み込んだデータだと、
str_extract_all(danger_table$yend, "[[:digit:]]{4}$") で期待する値が取れない。
2001–
のように、「–」があるためだ。
なので、

> yend_clean  <- str_extract_all(danger_table$yend, "[[:digit:]]{4}–$")
> danger_table$yend <- as.numeric(str_sub(yend_clean, 1, 4))

した。

HTTPSプロトコルでのWebページ読み込み R

estis2018/05/09 (水) 22:28 に投稿

『Rによる自動データ収集』p.4 では、
htmlParse 関数によるWebページの読み込みが記載されているが、訳注にあるようにHTTPSに対応していない。
翻訳サポートサイトでは、RCurl パッケージを用い、
htmlParse(getURL("https://~"))
としているが、
rvest パッケージを用い、
htmlParse(read_html("https://~"))
とすることもできる。

RStudio Server インストール

estis2018/04/16 (月) 17:46 に投稿

CentOS 7にインストール。

https://www.rstudio.com/products/rstudio/download-server/
を参考に、
wget https://download2.rstudio.org/rstudio-server-rhel-1.1.442-x86_64.rpm
yum install rstudio-server-rhel-1.1.442-x86_64.rpm
した。

これで、
http://[server-ip]:8787
で、接続できるはずだけれど、だめな場合は、
rstudio-server verify-installation
で確認する。

起動は、
systemctl start rstudio-server

R ソースインストール

estis2018/04/16 (月) 17:11 に投稿

CentOS7 で、 RStudio https://www.rstudio.com/products/RStudio/ を使用するために、 R をソースからインストールしてみた。
いろいろ失敗を重ね、ネット上の情報を参考にした結果、 CentOS7 ミニマム インストール後に、 以下を実行する必要があるようだ。

pandoc インストール

estis2018/03/24 (土) 21:54 に投稿

エラー: pandoc version 1.12.3 or higher is required and was not found (see the help page ?rmarkdown::pandoc_available).
と、表示された。
よく調べたら、pandoc がインストールされていなかった。

2016年1月のネット上の記事では、できないって書いてあったけど、今は、
brew install pandoc
で、インストールできた。

WARN[0000] Request Failed error="Get https://example.net: x509: certificate signed by unknown authority"

estis2018/03/18 (日) 23:28 に投稿

k6 でテストしたときに、
WARN[0000] Request Failed error="Get https://example.net: x509: certificate signed by unknown authority"
といったエラーが出る場合は、
k6 run --insecure-skip-tls-verify script.js
のように実行するか、

export let options = {
insecureSkipTLSVerify: true
};

を、script.js に書き加えれば、回避できる。