2007-07-26 きょうのテキスト処理 コーパスが XML で書かれていて、あまつさえ濁点、半濁点をわざわざ U+3099 や U+309A をつかって別文字で記述しているっていうのは、呪っていいですか?