人工知能

2020年02月23日

シン・ニホン感想と大学DS/AI教育のゆくえ

sinnihon

話題のシン・ニホン読了。
AI・DS教育、統計やら、その基礎となる算数・数学教育などを
仕事の一つにしていることもあり、内閣府等のAI戦略を牽引している、
第一人者の新刊は、必読と思ったからだ。

これからの教育系のイベントを開催したり、参加していることもあり、
大きな衝撃というより、教育関係については、ある程度の納得感を
持って読了した。

ただ、おおいに賛同するか、というと8割程度だろうか。
実際のデータに基づく、かなり過激な提案をされているので、
うなってしまう、というところか。

そこはさておき、趣旨としては、日本が将来、生き残るために
「データ×AI」のスキルまたはリテラシーを子どもたちはもちろん、
現役世代も身につけよう、それでもう一度、日本がブレイクの波に乗り、
日本の経済力や景気を、GDPを押し上げよう。
本当にそれが叶うと、いいなとは思う。



ただ、DS・AI教育をリテラシーとして、日本の大学に普及させるにあたり、気掛かりなことはある。

というのは、DS・AI教育というのは、今までの日本のアカデミアにない分野。
DS・AIを使って、いかにドメインの専門分野に生かすかということで、
安宅氏も言われているように「研究者」を作ることが目的ではない。

となると、学問としては少し扱いづらい分野になるような気がする。
実際、DSの新学部を作っていても、いろいろな専門分野の教員の寄せ集めになっている。
いくら受験生の人気のある新学部になったとしても、
DSの専門研究者というのは出にくいわけで、そうなると一時の流行の学部になってしまう気もする。


新学部を作らないにしても、
大学としては、全体予算を大幅に増加するわけにはいかないのだから、
(文科省から特別なプロジェクト予算の応募はあるにはしても)
既存の教員があまりこの新分野について、よく思う気はしない。

誰が、この分野の本当の推進者になるのか。
DS・AI教育を成功させる場合には、学内的には、既存の学部への何らかの配慮が
あえて必要かもしれない。(ジャマをされないように)

また、内閣府も国家プロジェクトとして、支援しつづけたり、
企業側も、就職等でDS・AIスキルの優位性を裏付けるような実績を生み出し続けることも必要だろう。

日本に、アメリカと違い、統計学部が作られなかったような歴史も思い出す。
また根本的に、日本のアカデミアの構造なども、見直しすることも必要かもしれない。

いずれにしても、大学は、特に幹部層は
「これからの学生に大切な教育は、本当はなんなのだろうか」という視点で
それぞれの大学のあるべき姿を考えてほしい。
文科省が、内閣府が言っているから、というのではなく。

そして、政府も、これからの日本のありようを真摯に考えてほしい。



neco5959 at 19:29|PermalinkComments(0)

2018年01月07日

AIと日本語学

illust3607
前回、古典籍のくずし字のAI解読の話を書いたが、
「日本語学」や「日本語文法」も、AIと非常に深い関係がある。

VRアプリ開発やAI技術研究をおこなっています。という「Vrai Blog」の、
物語テキストから動画自動生成テストの技術的解説

桃太郎の物語(テキスト)から、AIを作って動画を作る説明。
課程としては、

■テキストの準備
■テキストの分割(1文単位)
■述語項構造解析(述語項構造を解析)
(日本語構文・格・照応解析システム KNP - 京都大学 黒橋・河原研究室
http://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP を利用)

■実行時処理(登場人物のキャラクタを用意し、テキスト一文毎に、登場人物の登場や動きに合わせて、キャラクタを動かす)


動画作成・動作確認

■問題の原因・形態素解析
■問題の原因・主語の省略
■問題の原因・常識による判断

という流れと認識しました。

以上が前提ですが、
私が「面白い」と思ったのは、
AIに、”正しく”処理(キャラクタの動き)をさせるためには、
テキストについて、日本語の品詞分解を行い、
正しく名詞あるいは、助詞等としてAIに認識させるようにしなければ
ならないということ。

もちろん、AIですから学習をしていくのだと思いますが、
その過程において、日本語の特性(主語を省くことが多い)など、
気が付かねばならない、気をつけなければならないことがあるわけだ。

そうであれば、「日本語文法」の研究や、学習の動機付けに利用できそうだけど、
当分、普通の中学校とかは、そんなことには手を出さないだろう。

「N高等学校」とかで、「ゲーマー」になりたい子たちだったら、
そういうアプローチをしているかもしれないなぁ。


ま、ともかく、上のブログに張り付けてある動画、面白いので見てみてください。



neco5959 at 17:16|PermalinkComments(0)

2018年01月04日

古典のくずし字をAIで判読する時代

20171211_01_03

昨年、東京農工大学関連のニュースで、日経に下記のような記事が掲載された。

東京農工大学、古文書の崩し書き AI、精度よく認識

 ■東京農工大学 中川正樹教授らは、古文書の崩し書きのひらがなを精度よく認識する人工知能(AI)を開発した。大量のデータから特徴を見つける深層学習を使い、3文字連なる場合でも88%の精度で判読する。古文書研究が進めやすくなるほか、記述式答案の採点の負担も減らすのに役立つとみている。

(2017年12月18日付)

これで、大学で国文学を専攻した私が、
感慨深く思ったのは、
「文系(文学)の研究領域だと思っていたことも、
全く異なる専門領域の、AI、データサイエンスなどの分野の研究から、
新しい発見が生まれる時代になっている。
文学系は、理系の融合なんて、別世界だと思っていた研究者もいたかもしれないが、
その常識も覆されている」ということ。

20日ほど経ったいま、この記事の元になった、プレスリリースは、
古典籍のくずし字をAIが認識
(東京農工大学)。

担当は留学生2名。この二人が、
電子情報通信学会 パターン認識・メディア理解研究会(PRMU)が主催する
「第21回アルゴリズムコンテスト」に最優勝したというという輝かしい結果の
発表だったのだ。



もう一歩、突っ込んでみて、このコンテストの元になっている、古典籍、
くずし字は、「人文学オープンデータ共同利用センター」から提供されている
ことがわかる。

さてこの古典籍のデータは、結構公開モードのようだ。
(昔は、古典の辞典と首っ引きで、用例カードを作るところから
研究が始まったものだが、、)
「日本古典籍データセット」を大幅に拡充/日本文化を楽しめる料理本や伊勢物語、「武鑑」、絵本を多数公開
(国立情報学研究所 プレスリリース 2017/12/26)


そして、そのデータセットは、「人文学オープンデータ共同利用センター」にある。

日本古典籍データセット(人文学オープンデータ共同利用センター)

紹介文として、ご丁寧に、
現在、『源氏物語』『徒然草』『伊勢物語』など、一度は耳にしたことがある日本古典の名作を一挙に公開しています。これは、小・中・高校の教育用教材や、年賀状の作成などにも自由に活用できます。特に注目すべきデータを見てみましょう。

とまで、書いてあり、
 源氏物語 徒然草 伊勢物語 日本古典文学史 貴重書 奈良絵本 武鑑
のリンクが貼ってある。
(来年の年賀状は、これかな?)

文学研究はもちろん、学校の古典授業も、やろうとするといろんなアプローチが
可能になった。
古典の授業が、いつまでも古典文法、古典の鑑賞、文学史だけだと、
もう生徒が着いてこない気がするのは、私だけ?

(参考)
以前の記事:国文学研究とAI



neco5959 at 21:17|PermalinkComments(0)

一昨年の陰の努力がなんと書籍『ベイズ統計学』に!

25508063_1497256113676165_4465957236825706617_n
一昨年は学校に在籍していたのですが、その際、これまでの業務の流れで、

松原望先生のスクーでのベイズ統計学の10回オンライン講座をサポートしていました

(パワポ10回分製作、2016年12月に終了)。



それがきっかけとなり、なんと、創元社から書籍が発行されました。

(2017年12月21日、八重洲ブックセンターで平積みになっていました、
あとがきには私の名前まで、、、)

25551911_1497256100342833_4092723909881993560_n


我がことのように、うれしいです。
スクー10回分終わった時もうれしかったですが、1年後の今もまた、実感しています。
「あの苦労は決して無駄ではなかったのだと」。


神様の計画されることはわかりませんね、やっぱり。

「ベイズ統計学」は大人気の、AIやディープラーニングの研究の基本となる統計学です。

先生は、統計学?数学?の人でも分かるように、と丁寧に、スクーで講義をしてくれました。


「最初は、分からなくてもいいんですよ」と、まず興味を持つ、

「面白そうだな」というスタートでよいと。


最初、プレゼンをすべて私が作るということが決まったとき、

「ええ!専門でもないのに~」と途方にくれましたが、
むしろ、全然わからない人が作ることに意味があったのかと、

10回分うれし泣きで勉強させていただきました。


あるときには、準備として、ワイン講座を

ワイン好きのYさんにしていただき、
あるときはお花屋さん
あるときには、
男子の高校の生物のM先生に、遺伝子の模型をお借りしたり、
これがどうして、「ベイズ」につながるのかわからないまま、用意したこともありました。


さて、そういう意味で、書籍も、工夫が凝らしてあります。

話が細かく、かわいいイラスト、図解つきで、

しかも、さらなる、楽しい具体例もバージョンアップ。


「社会人、大学生、好奇心のある高校生」にぴったりの書籍です。


そして、あとがきに、
昨今のデータ・サイエンス学部の設立の時流にも、
「しっかりした学問的な統計学理論がないままでは、
・・・統計学は決して大量、高速の効率的データ処理学ではない」
と警鐘を鳴らします。

ぜひ、皆さんもお手にお取りください。
眺めるだけでも楽しいです。

松原望著『ベイズ統計学 やさしく知りたい先端科学シリーズ』

neco5959 at 16:18|PermalinkComments(0)

2017年11月29日

データサイエンスの学部が続々と新設ww

matsu

私が所属していた大学は、オール文系学部だったが、、
昨年は、期せずして、松原望先生(!)の、統計学の講義の授業録画(1時間×10回)に
関わることになった。
(それも、プレゼン用スライド作成w)

統計学、それも、ベイズ統計学である。
ベイズ統計学といえば、人工知能(AI)や、フィンテックなどの
基礎になった学問。

よく聞く技術でいえば、
メールのスパム判定システム
商品購入サイトのリコメンドシステム(amazonとかに出るあれ)
自動車の自動運転
コンピュータ対戦ゲーム(チェスとか、将棋とか)
医療新薬開発  などなど。

様々な大学で、昨年あたりから、”データサイエンス”なるキーワードが
フューチャーされてきている。
来年も、広島大学、京都産業大学、横浜市立大学、大阪府立大学etc・・・

理工学系、医療系の専売特許というわけではなく、
文系学部も社会学の分析にもビックデータを利用するとあって、
百花繚乱の様相を呈している(武蔵大学、津田塾大学)。
↓↓↓↓↓↓↓↓↓

データサイエンスが学べる日本の大学

今日、他にもないかと調べていたけれど、まだまだあるので、
これは、まとめて、いずれ別のサイトにまとめてみる予定。


もっとも、海外の動きに比べると、あまりに遅れすぎているので
(日本企業がAIで周回遅れになった理由(日経ビジネス))
どれくらい追いつけるのか、という気がしないでもないが、
日本の生き残りのためにも、
「やらない」という選択肢はないらしい。

これから、国内外で、データサイエンスでどんどん異彩を放つ人材は、
自分で、you tube とかで、調べている、、、よね?
若者におおいに期待したい。

で。

最初の話に戻ると、その授業録画がきっかけとなって
松原望先生が、ベイズ統計学入門の本を12月出版されることに。
なんとも、うれしい話。(これが画像)
コンセプトを作るとき、ちょっと出版社にお邪魔させていただいたが、
イラストも結構あって、研究書籍を出し続けてきた先生には意欲作だと
思う。楽しみ♪


neco5959 at 00:03|PermalinkComments(0)