• 本当は、田舎に庵を建てて隠遁生活したいけど、先立つものも無いので自宅で..。

和文Bot、ほぼ完成

結構時間がかかったけど、和文の暗記受信練習用のロボットがようやく完成した。 といっても、まだバグ取りしないといけないけど、骨格は完成した。

辞書の語彙が少ないので、同じような返事しか返ってこないけど、使っているうちに辞書が学習していくので、返事のバリエーションも増えてくると思う。

形態素解析にNuGetで提供されているLibNMeCabをつかっているんだけど、辞書の追加方法とかが不明なので、無線専用用語とか一般的でない単語には読みが解析できないという問題がある。

どんな風に解析されているかをまとめると、左図のようだった。

半角の数字や英字はそれぞれまとめて名詞と解析され、読みがないけど、全角の英数字は1文字ずつ記号と解析され読みがある。 「FT991A」という単語は、一つの単語で名詞としたいので、解析を行った後でまとめる処理を追加した。

本当は、自前の辞書で形態素解析できればもっとスマートにできると思うけど、そこまでのスキルがない。

とはいえ、一応完成したので、これから和文聞き取りの練習をしながら辞書の育成とこまかいバグ取りをやっていこうと思う。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA