mecab (Vibrato)の出力に対する前処理
MeCab の文節処理は、かな漢字変換に使うと考えると細かすぎる。
例えば以下のようになる。
養子となっている
養子 名詞,一般,*,*,*,*,養子,ヨウシ,ヨーシ
と 助詞,格助詞,一般,*,*,*,と,ト,ト
なっ 動詞,自立,*,*,五段・ラ行,連用タ接続,なる,ナッ,ナッ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる 動詞,非自立,*,*,一段,基本形,いる,イル,イル
EOS
これは形態素解析機としては妥当なのだけれど、かな漢字変換器として考えた場合には少しこまかくちぎりすぎである。 よって、これを少し、調整していく。
具体的には、「養子/ようし と/と なって/なって いる/いる」ぐらいになっていると自然かなぁ。