> > そこで大事なのが単語の切れ目を見分ける方法。 > > 俺が作ったやつでは、ただ単に助詞になりそうなひらがなを切れ目にしてたよ。 > > そんなやり方だとろくなデータが取りだせないから、このデータは決して誰にも見せない。 > > プログラムの内部だけで使うデータとした。 > Kakashiとかchasenとかがそのあたりを作ってくれるプログラムだったりするな > 漏れは詳しく見てないんだが、もしかしたら参考になるかな kakashiはたしかにみるべきだね、 それにあれにはたしかそういった切り分け用の辞書があったから利用するといい。 その辞書を使ってるソフトとして全文検索エンジンのNAMAZUがある、 これも内部で単語きりわけをやってるからみてみるといい、ソース公開されてるし。 参考:2001/10/13(土)03時12分16秒