まだまだ使えんやん - Quasi

「鉄腕 DASH」で青森と茨城の人がニュース原稿を「標準語」発音で読むっていう企画をやってて、ちゃんと読めているか確かめるために VoiceATOK を使って正しく入力されているかどうかを見てたんだけど、「ちゃんと」読めてなかったときの変換がかなり酷い。

「ひしひしと」の部分がいくら不明瞭な発音だからって「日CCC」って、言語モデル使ってないんだろうか(使っててもコストのチューニング悪すぎ)。

それに「標準語」発音以外の発音の認識率があんなに低いっていうのはどーかと思うんだけど(それとも各地の発音でトレーニングした HMM データも一緒に売ってるのかしら)。

あれを見た JUSTSYSTEM と IBM の担当者どー思ったんだろう?