csvファイルでデータを読み込むなら、ここを参考に。
私はtxtファイルなので、ここを参考にした。
データも配布しているので、試すのも簡単。
ただ、私のシンプルなデータ形式(↓)
class x1 x2 x3 ... 1 0.1 0.2 0.3 ... 2 0.2 0.1 0.4 ... ...
と比べて、参考サイトではデータ1行ごとに名前をつけている。
その違いがあるので、私のデータ形式では以下の用に実行した。
tr<-read.table("~~.txt",header=T) tr$"class" <- as.factor( tr$"class" ) ←ここ! rf <- randomForest( ~~ )
そうしないとclassificationではなくて
regressionになってしまう。
最後に、自分用の具体例。
> library('randomForest') randomForest 4.5-30 Type rfNews() to see new features/changes/bug fixes. > tr <- read.table("mixedFeature.scld.train.forest", header=T) > tr$"class" <- as.factor( tr$"class" ) > rf <- randomForest( class~., data=tr, importance=T, proximity=T, ntree=1000)