python クラスタリング cluster 3.0 pycluster

f:id:peroon:20091112074021g:image
http://bonsai.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/software.htm


pythonクラスタリングが必要になったので
open sourceのcluster 3.0を導入した。
それ自体はCで書かれたもので、
python bindingであるpyclusterもあり、
pythonから使えると考え、これに決めた。


結果、コマンドとして実行することはできたが、
pyclusterの導入は失敗した。
コマンドとして実行できるのならば、
pythonからos.system('command')でコマンドを
実行すればいいので、一応問題はない。


以下は導入方法である。環境はubuntu linux.

  • URLからLinux/Unix source codeをDLする
  • synapticでlibmotif-devをインストール
  • GUIなしでcluster3.0を入れるので不要っぽい)
  • DLしたフォルダで
./configure --without-x
make
make install

とする。うまくいかないならsuになっておく。
(./configureの意味は、そのディレクトリにある
configureファイルを実行せよ)


これでコマンドラインでclusterと打てばhelpが表示される。
usr/local/bin/にclusterの実行ファイルがある。
linuxだとコマンドラインよりターミナルって言う?)


以上でclusterの導入は完了。
pyclusterの導入として

python setup.py install

としたがundeclaredと大量に言われ、失敗する。
コマンドからの使い方で覚えておけば
RubyでもRでも使えるだろうからよしとする。//

集合知プログラミング k-means clustering python

ソースコードやデータはここで公開されている。
http://kiwitobes.com/PCI_Code.zip
http://examples.oreilly.com/9780596529321/PCI_Code.zip


こういうブログデータ(ブログ内の単語の頻度を特徴とする)を
clusters.pyでクラスタリングし、
似たブロガーを探したりできる。//




小嶋陽菜写真集 こじはる AKB48

こじまはるな、って読みます。
私は今日初めて知りました。AKB48の1人すら名前を知らないので、
こじまはるなだけは覚えてみます。


なぜこの人を知ったかというと、楽天のランキングを見たからです。
10代男性ランキングでこの写真集を見つけました。
10代、20代だと服が多くランクインしていました。
それより上になると、カニが多くランクインしていました。
食べる、あのカニです。


AKB48は多すぎるって思っていたけれど、今は成功しているみたいです。
浜崎あゆみや倖田來未より売れていたと記憶しています。
ニーズの多様化に合わせたグループなのでしょう。
AKB48の中でも主力メンバーがいるそうで、
それが小嶋陽菜こと、こじはるです。
現在流行っている歌も知らないので、
こじまはるなくらいは覚えてみます。