もう時間ないけどLet's Hadoop

元々Nutchの一部だったようだけど,独立してHadoopとなったらしい.
とりあえず,
http://lucene.apache.org/hadoop/docs/api/
http://wildduck.ivory.ne.jp/diary/search.rb?q=mapreduce
を参照にしながら,Grepのサンプルを動かしたけど,
こんなに簡単なのかとびっくりした.

ただし,さすがにできたばかりなので,若干間違っているところがあった.
まあ,Nutchのドキュメントそのままコピーしたんだろうな.
パッケージ名が org.apache.hadoop.mapred.demo.Grepのまんまだ.
まあそのうち修正されるだろうけど,
org.apache.hadoop.examples.Grep が正解

とりあえず,128台で試そう


と思ったら,HUBが死んで16台ほどアウト.ってか
10個ぐらいディスク死にかけてるから,これも怖いけど.