どうも、カタミチです。
さて、今日で「人工知能分野の問題」の章は最後ですね。引き続き「ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版」(以降、『当書』)を使ってやっていきたいと思います。
知識獲得のボトルネック
最初の話は、日本人は特にお世話になる事が多い機械翻訳の話です。
機械翻訳が難しいのは、コンピュータが「意味」を理解していない事が最大の理由と言われています。例えば、
He saw a woman in the garden with a telescope.
という文。どう訳しますか?
…
…
…
実はこれは3つの意味に取れます。
1. 彼は望遠鏡で「庭にいる女性」を見た。
2. 彼は庭で望遠鏡で「女性」を見た。
3. 彼は「庭で望遠鏡を持っている女性」を見た。
うん、1と2はヤバいやつですね。望遠鏡で女性を見るなよ、と(ツッコミ)
…まぁともかく、修飾関係がボンヤリしているので、いくつかの意味に取れるわけですね。ただ、人間は「望遠鏡を持っているのは男性の方が多い」「庭にいるのは女性の方が多い」という知識があるため、
1. 彼は望遠鏡で「庭にいる女性」を見た。
と解釈する人が多い、と言います。…やっぱり彼はヤバいやつでしたね。
このように、1つの文を訳すにも一般常識が無ければ訳せない。しかし、Cycプロジェクトの時の話にもありましたが、一般知識は膨大であるため、獲得が難しい…。これが知識獲得のボトルネックというわけです。
修飾関係がハッキリしないのって日本語という言語の問題なのかと思ってましたが、少なくとも英語にもあるんですね。まぁ、今回のような文の場合、人間でも間違える事がありますし、一般常識というのも変わりますしね…。
しかし今の世の中「望遠鏡持ってるのは男でしょ」なんて決めつけたら、それはそれで非難されそう。
ちなみに、最近になってディープラーニングを使ったニューラル機械翻訳という技術の採用により、機械翻訳の品質が格段に向上したそうです。2016年11月にGoogleが発表したGoogle翻訳で利用されていたみたいですが、そういえば確かにそのくらいの時期に話題になってましたねー。
つまり、この「知識獲得のボトルネック」の問題は、解決されつつあるって事ですかねー。いやはやすごい。
特徴量設計
さて、ついに来ました。ディープラーニングに関係するところですね。
特徴量というのは、注目すべきデータを量的に表したもの…だそうです。例として上げられていたのは、ビールの売り上げ予測。特徴量として「気温」を選ぶのは筋が良いと言えそうです。なぜなら、気温が上がれば上がるほどビールが売れるからです。一方、特徴量として「出荷先の店舗の壁の色」を選ぶのは筋が悪そうです。まぁ、あんまり関係なさそうですね(とか言って、壁の色がピンクだと売り上げ上がるとかあったりして…)
いずれにせよ、特徴量の選択は人間が行います。ビールと気温みたいな分かりやすいものならいいですが、そうでないものも多いので、いわゆる職人芸の世界ですね。
で、そんな特徴量を機械学習自身に発見させようという考え方が特徴表現学習です。
ディープラーニングはこの「特徴表現学習」を行う機械学習アルゴリズムの1つで、与えられたデータの特徴量を階層化し、それらを組み合わせることで問題を解きます。
ディープラーニングで抽出される特徴量がどのようなものなのか、ある程度イメージすることはできますが、本当の意味で理解することはできません。つまり、ブラックボックスになってしまう…ということですね。
なるほど。これはディープラーニングを不気味に感じる派が出てきてもおかしくないかもしれないですね。人間には説明できない、よく分からない理屈で答えを導く…という事ですから。しかし本書にもありますが、この性質自体、人間と似てるかもしれませんね。
シンギュラリティー
最後の問題です。
シンギュラリティー…この言葉は当然聞いた事がありますよ、ええ。
技術的特異点。人工知能が十分に賢くなり、自分自身よりも賢い人工知能を作るようになった瞬間、無限に知能の高い存在を作るようになり、人間の想像力の及ばない超越的な知性が誕生する、という仮説です。
SFの世界の話…とは思うのですが、人工知能の研究を進めている企業からもAIの研究は慎重に進めるべきと声が上がっているようなので、実は鼻で笑って終わる時代ではなくなってきているのかもしれませんね。
ということで
9つの「人工知能分野の問題」について見てきました。
最近かなり解決に近づいている問題もあれば、まだまだ糸口がつかめない問題もありましたね。また、最後のシンギュラリティーの話はむしろ、究極のAIが完成することによって起こる問題…と言ってもいいでしょう。
今回の章で、AIはまだまだ未開の地なんだなー、ということを感じましたね。
ではまた。
勉強に使ってる書籍はこちら↓
深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版