きょうのよしなしごと
ワークス徳島研&国立国語研から、日本語の単語分散表現が公開されました!約1億のウェブページを含む大規模コーパス「NWJC」を利用し、形態素解析器「Sudachi」の複数粒度分割をもとに、word2vec(gensim)とfastTextで学習。ライセンスはApache2.0。先日の年次大会に詳細有〼 https://t.co/A2PwlvLK8H
— Sorami Hisamoto (@sorami) 2019年4月2日
うちにある万葉集の本っていったらこれだけなんだけど、おうふう、品切れしてるし。https://t.co/ELYYPTrPDchttps://t.co/I6Q0uo72kp
— 高岡一馬 (@klmquasi) 2019年4月2日
日本語NLPライブラリGiNZAをリリースしました👍国語研との共同研究成果としてUD-Japanese BCCWJ由来のモデルを搭載しています!https://t.co/Gmaabc3iElhttps://t.co/CDumSLJb6o
— hiroshi matsuda (@hmtd223) 2019年4月2日