まったりAI勉強記

AI(人工知能)について、特にゆかりがあるわけでもない社会人が、まったりとAIについて勉強していく勉強日記です。

Cycプロジェクトは今…?

どうも、カタミチです。

Cyc(サイク)プロジェクト

「一般常識をデータベース化する」という壮大な計画のもと、ダグラス・レナートによって1984年に開始され、今なお続いているというこのプロジェクト。

現在が2022年ですから、38年目に突入していることになりますかね。この取り組みが今どうなっているのか?ちょっと調べてみました。まず、Wikipediaを見てみたんですが…

Cycプロジェクト - Wikipedia

うーん、全然ちゃんと書かれてないですね。で、他の日本語のページも少し探ってみたんですが、あんまり書かれていませんでした。英語版のWikipediaならどうかなー、と思って見てみたんですが…

Cyc - Wikipedia

お、割と書いてありますね。ちょっとかいつまんでみましょう。…ただ私、英語が得意ってわけではないので、DeepLの翻訳に頼ることにします。(人類の英知)

Cycとは

Cyc(発音:/ˈsaɪ/ SYKE)は、世界の仕組みに関する基本的な概念やルールにまたがる包括的なオントロジーと知識ベースを構築することを目的とした、長期にわたる人工知能プロジェクトである。Cycは、他のAIプラットフォームが当然と考えるような暗黙知に着目し、常識的な知識を獲得することを目的としています。これは、インターネット上のどこかで見つけたり、検索エンジンウィキペディアで検索したりするような事実とは対照的です。Cycは、意味論的推論者が人間のような推論を行うことを可能にし、新しい状況に直面したときに「もろい」ことが少なくなるようにします。

…DeepLすげぇ。自然言語をカンペキに解析ってますねぇ。しかし、ウィキペディアに「ウィキペディアで検索したりするような事実とは対照的です。」って書かれてるのは、ちょっとおもしろい。

ダグラス・レナートは1984年から1994年にかけては、MCCという組織でプロジェクトを進めていたようですが、1995年からは自身がCEOを務めるCycorp社で開発を進めたようです。

レナートひとりで細々と始めたのかなぁ、と勝手にイメージしていたんですが、400人規模のMCCで、しっかり組織的にやってたみたいです。最初の10年間で約10万語に達し、2017年時点で150万語を含むようですね。ルールやアサーションのCyc知識ベースは約2450万にまでなっており、1,000人年をはるかに超える労力がかかっているらしいです。…1,000人年ってヤバいですね。仮に、月単価が100万円の人たちが作業に当たったんだとすると、120億円っ!そういえば、ナレッジエンジニアとか言う専門の職種が生まれたんでしたね。月単価100万円じゃ効かないか(遠い目)

Cycのコアな部分はCycorpが独占的に持っているようですね。有償ライセンスで提供されるようです。そらそうだ。2008年に、Cycのリソースの多くはWikipediaの記事とマッピングされたようです。うまく集合知を取り込んでる感じなんですかねー。

ちなみにMCCって組織は、2000年に事業を停止し、2004年に解散したようです。

OpenCyc

2001年からはOpenCycという試みもなされているようです。Cycプロジェクトの知識ベースの一部が公開されている!と聞いて、アクセスしてみました。どんな感じで使えるのかなー(ワクワク)

http://www.opencyc.org/

よし、ここですね。いくぜ!アクセスっ!!

リンク切れ!(泣)

どうやら、2017年に公開をやめてしまったようです。「色んな人が好き勝手に手を加えたOpenCycが、本家のCycのものと勘違いされたら困るからね」みたいな理由っぽいです。まぁ、分からんでもないですが、集合知を活用しないとなると、知識のたまり具合は直線的にしか伸びないでしょうねー。人間の手でヒューリスティックにやってますからね。果たしてあと何年でプロジェクトは終わるのか…。

しかし、どっかにアーカイブとして残ってないかなー、と探してて見つけたのがココ。

OpenCyc 日本語情報トップページ - OSDN

何かがダウンロードできそうなのでダウンロードしてみることに。

えい!

f:id:feh_asama:20220227185409p:plain

おー、184MBだー。デカい。

Last Updateは2017年3月13日とありますね。しかし、今週9件のダウンロードがあるということは、同じように「ちょっと見てみたい」という人が居たってことですかねー。

…ちなみに、無事にダウンロードできたんですが、ローカルで実行環境を構築することはできませんでした。「windows版」をダウンロードしておきながら、実は私chromebook使ってるので(汗)。しかし「README.txt」を見る限り、頑張れば動かすことができそうな感じではありました。

f:id:feh_asama:20220228072836p:plain

ResearchCyc

ResearchCycという取り組みは2006年から始まったようです。研究者コミュニティのための無償公開バージョンです。研究と分野の発展に賭ける思いは強いんでしょうねー。600の研究グループが非営利の研究目的のために無償ライセンスを利用していましたが、残念ながら2019年にはサポートは終了してしまっているようです。

アプリケーション

Cycでは、100以上のアプリケーションを出しているようです。専門領域のものが多いようですね。医療、製薬といった分野や、教育分野、面白いところでは、テロに関する関連知識の知識ベースであるテロリズム知識ベースといったものもあるようです。テロリズムの本質に迫ろうとする取り組みだと思いますが、「争いをやめない『人間』とはなにか?」ということを突き詰めていく一端を担っているかもしれませんね。

いずれにせよ、エキスパートシステムと呼ばれていただけあって、専門特化した部分が主になっていますね。

評価

「第2次AIブームは、専門家の知識が膨大であり、定式化が難しかったことから、やがて終焉した」と勉強しました。

「有効な結果を出すのに必要なデータの量が際限なく多く、Cyc自身が進化することができなかった。このプロジェクトは大失敗だ」と評する科学者が居る一方で、「IBMのWatsonの前身プロジェクトだ」という評価があったり、「どこかから始めなければならなかったし、ここまで大きなソースは他にない」といった評価や、「これまでニュースになってきたディープラーニングとは全く異なるアプローチを示している」ということで可能性を引き続き感じているような評価もあります。

また、ダートマス会議の発起人のひとりであるマーヴィン・ミンスキーは「法律や医学のような厳密に定義された分野での人間の専門知識を模倣したもので、ほとんどの子供が3歳までに知っている概念を学習することができなかった」と評していました。

いずれにしても、数多くの賛否両論があるということは、それだけ世界に与えたインパクトは大きかった…ということでしょうねー。

現在のCycorp社

さて、現在のCycorp社はどんなかなー、と思って調べてみたら、Webサイトがありました。

Cyc | The Next Generation of Enterprise AI

f:id:feh_asama:20220227184340p:plain

どうやら、病院のアドバイザー的なことや、サプライチェーンのアドバイザー的なことをやっているみたいです。また、AIの活用アドバイザー、ナレッジ管理、そしてCycプラットフォームを活用したサービスもやってますね。

Cycプラットフォーム(CYC PLATFORM)の絵があったので貼ります。ぺた。

f:id:feh_asama:20220227200052p:plain

左にある「The Knowledge Base」が、30年以上作り上げてきた「秘伝のタレ」であることは間違いなさそうです。謳い文句は「世界で最も広く、そして最も深い常識の知識ベース」でした。確かにそのとおりなんでしょうねー。今なおどのくらい育っているのかは分かりませんが、少なくともビジネスで活用されているのは確かなようですね。

真ん中にある「Inference Engine」は、推論エンジンってやつですね。エキスパートシステムの頭脳にあたる部分です。右にある「Intelligent Data Selection」ってのは何者かよく分かりませんが、見た感じ、データ抽出に関する周辺技術ですかねー。

ということで

ざっと見てきましたが、紆余曲折を経つつ、今も頑張ってるようですね。この先のAI最前線に再び合流してくることはあるのか?見守っていきたいところですねー。

ではまた。