「できる!」ビジネスマンの雑学
2015年07月06日
[087]くずし字の自動判別に成功。凸版印刷

 大学時代は文学部日本文学科に籍を置いていた筆者は、江戸文学の講義が楽しみの一つでした。それは、古文書の素読が中心だったからです。教科書を広げるとミミズが這ったような墨書き文字が跳ね回っています。これこそ江戸時代に読まれていた誌面に他ならず、江戸にいるかのような気分で(東京ですから江戸に違いありませんが)読書に浸れるのです。
 西鶴、芭蕉、近松などの代表作を「原書」で読める幸せは、いま思い返しても貴重な物でした。
 しかし、恩師が言うに、やはり西鶴は関西弁で読まないと味が出ない、とのことでした。

20150706.jpg
『井原西鶴 日本永代蔵 6巻』
(国立国会図書館ウェブサイト・コンテンツより転載 インターネット公開(保護期間満了))


 昔話はこのくらいにして、古文書を自動判読する技術が実用化されたそうです。

古文書の「くずし字」、精度8割で判読 凸版印刷
 凸版印刷は江戸時代までに書かれた書物や古文書の「くずし字」を自動で判読し、電子テキストデータに置き換える技術を開発した。8割以上の精度で判読することができるという。今夏から試験的な解読サービスを始め、2016年度中に大学や博物館などに本格的に売り込む。
 くずし字は楷書とは異なり簡略化した文字を連ねていくため、一文字のみでは判読できないことが多い。
日本経済新聞 電子版・企業 2015年7月3日掲出)

 自動判読プログラムが実用化されても、古文書の解読者が失業することはなさそうです。プログラムが正しく解読したかを確認するには、人間も「くずし字」を読める必要がありますし、また読み取れなかった残り2割の難字を解明する経験や勘も求められます。
 大量にある古文書をプログラムでざっと読み下して、まとめを人間がやる。こういうスタイルが確立すると、江戸時代研究がさらに進みそうですね。
 ただし、古文書を一枚一枚ひろげてスキャンする、地道な作業は人間の手に頼るほかなさそうです。(水)

コメントを書く
お名前
URL
コメント
書籍購入はこちら 語学音声アプリ 公開中 閉じる