データ分析でRを使うことが増えたのでメモ
Rの癖
大体の感じ
- コマンドライン型のツール
- データを読み込ませてコマンドで数学的な処理ができる
- 結果はグラフに表示したり数式で表示したり。
- パッケージを追加インストールするとできることが増える
- パッケージをインストールする時はrootでRを起動する(/usr/libにインストールしてくれる)
インストールと起動
$ sudo apt install r-base ←インストール
$ R ←起動
CSVから3dグラフを作る
パッケージをインストール
> install.packages("rgl") 3D処理が得意なパッケージ > install.packages("scatterplot3d") 色を付けたりするのが得意な3Dパッケージ
CSVデータを読み込む
注意点
- 先頭列にも列名を付けること
- 列名は英数字にすること
- 列数は3つ以上あっても大丈夫
変数Dにa.csvの中身を読み込む > D <- read.table("./a.csv",header=TRUE,sep=",",na.strings="NA",dec="."); sep : セパレータ。普通は, na.strings : NAという文字を空白として扱う dec : 小数点。普通は.
x,y,z軸を指定して3Dグラフを書く > library(rgl) > plot3d(x=D$M5, y=D$M25, z=D$FST) DのM5列はD$M5と表現する → 3Dグラフが表示される