2013年8月31日土曜日

PHPからMecabを使う

読み・品詞などを取得する場合はこのように。



単純に文字列を配列として取得する場合は下記のようにする。


ここでいくつか問題が。
電話番号など連続した数字をわかち書きすると「0」「1」など1文字ずつ分かれてしまいます。
設定ファイルを変更すればいいようなのですが、現状それができない状態です。

正規表現でやろうかなあ。

参考URL
http://d.hatena.ne.jp/knaka20blue/20110704/1309767917

0 件のコメント:

コメントを投稿