欧文混じりの文章に対応できるように改良。
表示には表れていないけど、欧文の単語の前後には括弧が発生するようになっている。
NMeCabで形態素解析すると、文字型の情報も得られるのでそれを利用した。 ただ、ハイフンが混じると「FT」が名詞、「-」が記号、「991」が数字と解析されるので、辞書を学習させるときに変なことになっているかも。
NMeCabの辞書に単語が追加できるといいのだけど、今のところそこまでの知識がない。 もう少し工夫すればなんとかなるかなぁ。
和文練習用のChatBotは、もう少し簡単にできるかと思っていたけど、いろいろ制約があってなかなか進まない。
画像には出ていないけど、テンプレート辞書も何か変な日本語吐いてくるので、もうちょっとデバッグしないとな..