国文学
2018年01月07日
AIと日本語学

前回、古典籍のくずし字のAI解読の話を書いたが、
「日本語学」や「日本語文法」も、AIと非常に深い関係がある。
VRアプリ開発やAI技術研究をおこなっています。という「Vrai Blog」の、
「物語テキストから動画自動生成テストの技術的解説」
桃太郎の物語(テキスト)から、AIを作って動画を作る説明。
課程としては、
■テキストの準備
■テキストの分割(1文単位)
■述語項構造解析(述語項構造を解析)
(日本語構文・格・照応解析システム KNP - 京都大学 黒橋・河原研究室
http://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP を利用)
■実行時処理(登場人物のキャラクタを用意し、テキスト一文毎に、登場人物の登場や動きに合わせて、キャラクタを動かす)
↓
動画作成・動作確認
↓
■問題の原因・形態素解析
■問題の原因・主語の省略
■問題の原因・常識による判断
という流れと認識しました。
以上が前提ですが、
私が「面白い」と思ったのは、
AIに、”正しく”処理(キャラクタの動き)をさせるためには、
テキストについて、日本語の品詞分解を行い、
正しく名詞あるいは、助詞等としてAIに認識させるようにしなければ
ならないということ。
もちろん、AIですから学習をしていくのだと思いますが、
その過程において、日本語の特性(主語を省くことが多い)など、
気が付かねばならない、気をつけなければならないことがあるわけだ。
そうであれば、「日本語文法」の研究や、学習の動機付けに利用できそうだけど、
当分、普通の中学校とかは、そんなことには手を出さないだろう。
「N高等学校」とかで、「ゲーマー」になりたい子たちだったら、
そういうアプローチをしているかもしれないなぁ。
ま、ともかく、上のブログに張り付けてある動画、面白いので見てみてください。
neco5959 at 17:16|Permalink│Comments(0)
2017年11月30日
国文学研究とAI

先日、データサイエンスの学部新設の話を書いた。
そこで思い出したのは、私の大学学部時代の話。
私は、国文学科で、中世文学ゼミで、西行を研究した。
国文学の研究の仕方というのは、
関連研究書を読んだり、テキスト(原文)をあたったりすると
言ったら簡単な話のように聞こえるのだが、
仮説を実証する必要があるわけで、
その実証方法というのは、まさに統計学。
しかし、30年前は、用語別に並んだ辞典から、
気になる用語をもとに、凡例をカードに手で抜書きして、その用例数を数えたり、
別の用語の事例数を比較したり、
または、ある凡例に出されている原文をあたってみたり、、、
という超地味な作業を繰り返す。
国文学が好きなんだから、楽しい作業ともいえるが、
仮説が導き出す資料を見つけられない、見いだせないときの徒労感と言ったらなかった。
また、指導する教員(研究者)は、その辞典が結構、頭に入っているんではないかと
思えるような記憶力で、
「あの事例は、あそこにあったんじゃなかったっけ。。。」という勘が働く。
しかし、学生の私は、全くそういう勘は働かず、
”やみくも”に、辞典を探すしかない。
でも、最近のビッグデータを検索するシステムとか
AIとかあれば、国文学の研究は全然変わってきているんじゃないかと
思える今日のこの頃。
国文学研究からは全く離れてしまっているんだけれど、
そこはいまどうなんだろう?
ちょっと探してみたら、こんな記事が出てきた。
スケッチや画像から古典籍画像を検索できる最新AIシステムを開発/国立情報学研究所と国文学研究資料館による共同研究 (国立情報学研究所 プレスリリース 2017/6/8)
スケッチで画像検索ができるんだそうだ。
検索窓に手描きでスケッチをすると、似ている形状を含んだ古典籍画像をデータベースから検索します。検索にかかる時間は1ミリ秒以下で、画像中の検索対象領域が計百万まで増えても1ミリ秒程度で検索が可能です。検索結果の画像を検索窓にドラッグ&ドロップすると、その画像をもとに再検索が可能です。現在は「絵本和歌浦」「絵本時世粧」「絵本姫小松」「絵本玉かつら」「十二類絵巻」「絵本徒然草」の古典籍6冊のデータベースに含まれる計178枚の画像(1309領域(*4))を対象に検索を行うことができます。今後は、現在開発中の領域指定検索機能も組み込む予定です。
研究がいち早く進んだり、
別の視点が与えられたりしそうで、面白そう。
若手研究者が面白い発見をしそう。
こういうことを私立大学ブランディング事業で提案したら、
人文学も注目されるかもしれないけど、どこかでやっていないかしら。
neco5959 at 23:43|Permalink│Comments(0)