きょうのよしなしごと
「検索システム 実務者のための開発改善ガイドブック」P.46のipadicが朝日新聞をもとにしているという話はどこからきてるんだろう。パラメータの推定はRWCコーパス(を大幅に改変したもの)なので毎日新聞ベースなはず。(収録語の収集元はまた別だけど) https://t.co/i3Y2eTV9ZH
— 高岡一馬 (@klmquasi) 2022年5月19日
あとipadicの最終更新は2003年(2.7.0)でMeCab辞書にコンバートされたのが2007年。ipadic単体での初出は1998年の1.0bなはず。
— 高岡一馬 (@klmquasi) 2022年5月19日
ipadicとRWCコーパスの関係は工藤さんの「形態素解析の理論と実装」のP.35にありました(他にも松本先生が書かれた記事があったはずですが見つからない)。ipadicの更新履歴は茶筌の方のipadicパッケージに書いてあります。
— 高岡一馬 (@klmquasi) 2022年5月19日
あ、コンバートじゃなくて、CRFによる再学習。
— 高岡一馬 (@klmquasi) 2022年5月19日