Leopard搭載のMeCabを使ってみた

ML上で「Leopardになってから、AppleScriptのword parsing機能がおかしいぞ」という議論をしていたら、Appleの担当が「ASのword parsingでunix shellの実行結果をparseすんじゃねえ、自然言語のparsingをしやがれ」的な発言を……。


しばらく笑い転げて、


「そんな使い物にならないパーサーなんか誰も使わん! 日本語パースさせて正しい結果が返ってくると思ってんのか!」

(英語ではもうちょっと控えめだが、日本語で書くとこうなる)


一気に議論終了……あれほど勇ましかった担当者がしおしおになって平謝りモードになっているよ(汗)


そんなこともあって、(ひそかに)Leopardに入っているMeCabを日本語パーサーに使え、といった話もしだしたので、「Laopardに入っているMeCabが本当に使い物になるのかどうか」一応確認しておくことにした。


Mac OS X標準で入っていてSpotlightのインデックス作成用に使ってるんだから、ことえりの辞書ぐらいは参照していることは期待したい。


http://chasen.org/~taku/blog/archives/2008/07/mac_os_x_leropa.html


ここをまるまる参考にして、AppleScript StudioでMeCabのフロントエンドを即席で作ってみた。このぐらいなら10分ぐらいでできる。GUI上にタイプしたパラメータをコマンドラインのプログラムに投げて、結果をGUIにフィードバックしているだけだ。


899534398_77


試してみたところ…………結果はあまり思わしくない。「長野谷」が「長」「野谷」に分解されてしまっている。どうも、ことえりの辞書学習内容とはリンクしてなさそうな雰囲気……。

Copyright By Piyomaru Software. All Rights Reserved