【G検定】人工知能分野の問題その3

どうも、カタミチです。

さて、今日で「人工知能分野の問題」の章は最後ですね。引き続き「ディープラーニング G検定（ジェネラリスト）公式テキスト第2版」(以降、『当書』)を使ってやっていきたいと思います。

f:id:feh_asama:20220113190052j:image

知識獲得のボトルネック

最初の話は、日本人は特にお世話になる事が多い機械翻訳の話です。

機械翻訳が難しいのは、コンピュータが「意味」を理解していない事が最大の理由と言われています。例えば、

He saw a woman in the garden with a telescope.

という文。どう訳しますか？

…

実はこれは3つの意味に取れます。

1. 彼は望遠鏡で「庭にいる女性」を見た。
2. 彼は庭で望遠鏡で「女性」を見た。
3. 彼は「庭で望遠鏡を持っている女性」を見た。

うん、1と2はヤバいやつですね。望遠鏡で女性を見るなよ、と（ツッコミ）

…まぁともかく、修飾関係がボンヤリしているので、いくつかの意味に取れるわけですね。ただ、人間は「望遠鏡を持っているのは男性の方が多い」「庭にいるのは女性の方が多い」という知識があるため、

1. 彼は望遠鏡で「庭にいる女性」を見た。

と解釈する人が多い、と言います。…やっぱり彼はヤバいやつでしたね。

このように、1つの文を訳すにも一般常識が無ければ訳せない。しかし、Cycプロジェクトの時の話にもありましたが、一般知識は膨大であるため、獲得が難しい…。これが知識獲得のボトルネックというわけです。

修飾関係がハッキリしないのって日本語という言語の問題なのかと思ってましたが、少なくとも英語にもあるんですね。まぁ、今回のような文の場合、人間でも間違える事がありますし、一般常識というのも変わりますしね…。

しかし今の世の中「望遠鏡持ってるのは男でしょ」なんて決めつけたら、それはそれで非難されそう。

ちなみに、最近になってディープラーニングを使ったニューラル機械翻訳という技術の採用により、機械翻訳の品質が格段に向上したそうです。2016年11月にGoogleが発表したGoogle翻訳で利用されていたみたいですが、そういえば確かにそのくらいの時期に話題になってましたねー。

つまり、この「知識獲得のボトルネック」の問題は、解決されつつあるって事ですかねー。いやはやすごい。

特徴量設計

さて、ついに来ました。ディープラーニングに関係するところですね。

特徴量というのは、注目すべきデータを量的に表したもの…だそうです。例として上げられていたのは、ビールの売り上げ予測。特徴量として「気温」を選ぶのは筋が良いと言えそうです。なぜなら、気温が上がれば上がるほどビールが売れるからです。一方、特徴量として「出荷先の店舗の壁の色」を選ぶのは筋が悪そうです。まぁ、あんまり関係なさそうですね（とか言って、壁の色がピンクだと売り上げ上がるとかあったりして…）

いずれにせよ、特徴量の選択は人間が行います。ビールと気温みたいな分かりやすいものならいいですが、そうでないものも多いので、いわゆる職人芸の世界ですね。

で、そんな特徴量を機械学習自身に発見させようという考え方が特徴表現学習です。

ディープラーニングはこの「特徴表現学習」を行う機械学習アルゴリズムの1つで、与えられたデータの特徴量を階層化し、それらを組み合わせることで問題を解きます。

ディープラーニングで抽出される特徴量がどのようなものなのか、ある程度イメージすることはできますが、本当の意味で理解することはできません。つまり、ブラックボックスになってしまう…ということですね。

なるほど。これはディープラーニングを不気味に感じる派が出てきてもおかしくないかもしれないですね。人間には説明できない、よく分からない理屈で答えを導く…という事ですから。しかし本書にもありますが、この性質自体、人間と似てるかもしれませんね。