人間を破った人工知能をつくったDeepMindとは何者か?
foreign-press-room-commentators-2















2016.3.12 SAT  http://wired.jp/2016/03/12/deepmind/
「ついにAIが囲碁で人間を負かした。あと10年はかかるといわれていたその偉業を成し遂げたのは、グーグルが4億ドルで買収したロンドンのAIスタートアップ・DeepMindだ。彼らの軌跡を振り返ってみよう。

そして彼らは、3月には公の場で、AlphaGoが世界最高峰の棋士のひとり、イ・セドルと対局することを宣言。冒頭に記した通り、AlphaGoが勝利を収めたのである。
果たしてこの勝利は何を意味するのだろうか? 囲碁という複雑なゲームにおいて、AIが人間を超える次元でふるまったという事実は、“対立”、あるいは“戦略が求められるもの”すべてにおけるAIの可能性を示している(「これには戦争やビジネス、金融取引も含まれる」とディープラーニング研究を行うスタートアップSkymind創業者のクリス・ニコルソンは言う)。」

画像 世紀の囲碁決戦に際して、イ・セドル九段(写真左)とともにポーズを取るDeepMindのCEO、デミス・ハサビス。

2016年3月9日は、人工知能(AI)の歴史において重要な日となった。世界最高の棋士のひとり、イ・セドルが囲碁AIソフトウェア「AlphaGo」に敗れたのだ。
関連記事:グーグルの囲碁AI「AlphaGo」が最強の棋士を破った日
AlphaGoをつくったのは、DeepMind(ディープマインド)というロンドンのスタートアップ。2014年にグーグルが4億ドルで買収した、最注目のAIカンパニーである。
知性を解明すること

DeepMindの創業は2010年。彼らのウェブサイトには「知性を解明すること、それにより世界をよりよくすること」というミッションが掲げられている。彼らはディープ・ニューラルネットワークと強化学習アルゴリズムの2つの研究領域を統合することで、そのミッションに挑んでいる。
設立時には、ピーター・ティールやイーロン・マスク、Skype共同創業者ジャン・タリン、ホライゾン・ヴェンチャーズの李嘉誠(リ・カシン)らがDeepMindに投資をしている。創業から約3年後にはグーグルが同社を4億ドルで買収した(ちなみにこの金額は、グーグルにとってヨーロッパ地域での過去最大の投資だった)。

2015年2月、DeepMindは「DQN」(Deep Q-Network)と呼ばれる彼らのAIが、Atari2600用の49本のTVゲームをほとんど何も教えることなくプレイすることができたという内容の論文を『Nature』に提出。ブロック崩しを行うDQNの動画が話題となった。はじめは素人のような動きだったDQNは、数時間のうちにゲームのコツを学んでいき、ついには人間が思いつかなかったような裏技まで発明してしまったのだ。
関連記事:ゲーム攻略で人間を超えた人工知能、その名は「DQN」
3人のブレイン
DeepMindは、まさにAI研究を行うために生まれてきたようなデミス・ハサビスら3人によって創業されている。
まず、CEOのデミス・ハサビスだ。1976年ロンドンに生まれたハサビスは、4歳のときからチェスに没頭し、始めて2週間も経たないうちに大人を負かすようになったという。6歳でロンドンのU-8大会のチャンピオンになり、9歳で英国のU-11チームのキャプテンを務めている。13歳のときに、同年代で世界第2位のチェスプレーヤーになった。

14歳でGCSE(英国の一般中等教育修了証)を獲得、15歳で数学のAレヴェル、16歳で高等数学・物理学・化学の単位を取得。15歳のときにケンブリッジ大学コンピューターサイエンス学部の試験に合格する(入学は16歳になってからという条件を出された)。ケンブリッジをダブル・ファースト(卒業試験での2科目優等生)で卒業すると、ライオンヘッド・スタジオというゲーム会社に就職。1年後には自身のスタジオ、エリクサーを立ち上げている。

その後、認知神経科学の博士号を取るためにロンドン大学ユニヴァーシティカレッジで記憶と想像の研究を行う。彼の論文は2007年、『Science』誌が選ぶ10大ブレークスルーに選ばれている。ハサビスは同大学のギャツビー計算神経科学ユニットで計算神経科学を学びながら、MITとハーヴァードで客員研究員としても働いていた。
つぎに、AI応用部門ヘッドを務めるムスタファ・スレイマンは、オックスフォードで哲学と神学を専攻したが、2年生のときにドロップアウトし、ビジネスや政治の世界で働き始めることになる(ハサビスの弟とは親友だった)。グーグルによる買収を経た現在では、DeepMindのAI技術をグーグルの製品に統合する仕事を担っている。

最後に、シェーン・レグ。現在チーフサイエンティストを務める人物だ。彼はニュージーランドの大学で複雑系の理論を学んだあと、スイスのIDSIA(Dalle Molle Institute for Artificial Intelligence)に入り、機械知能の計測方法に関する研究で博士号を取得する。その後、神経科学を学ぶためにユニバーシティカレッジのギャツビー計算神経科学ユニットに移り、ハサビスと出会った。

20年の梯子

2016年1月下旬、DeepMindはグーグルによる買収から再び世界を驚かせた。「AlphaGo」と呼ばれる彼らの囲碁ソフトが、15年10月、秘密裏に現欧州チャンピオンであるファン・フイと対局しており、5局すべてでフイを破ったというのだ。
関連記事:「囲碁の謎」を解いたグーグルの超知能は、人工知能の進化を10年早めた
そして彼らは、3月には公の場で、AlphaGoが世界最高峰の棋士のひとり、イ・セドルと大局することを宣言。冒頭に記した通り、AlphaGoが勝利を収めたのである。
果たしてこの勝利は何を意味するのだろうか? 囲碁という複雑なゲームにおいて、AIが人間を超える次元でふるまったという事実は、“対立”、あるいは“戦略が求められるもの”すべてにおけるAIの可能性を示している(「これには戦争やビジネス、金融取引も含まれる」とディープラーニング研究を行うスタートアップSkymind創業者のクリス・ニコルソンは言う)。

ハサビスにとっては、今回の勝利も「小さな一歩」にすぎないのかもしれない。AI研究を現代の「アポロ計画」になぞらえる彼によれば、ディープマインドは「20年ロードマップ」に従っているのだから。
『WIRED』vol.20「人工知能」特集で掲載したディープマインドについての記事でも、ハサビスは「人間と同等の汎用人工知能ができるのは、まだ何十年も先の話です」と語っている。「ぼくたちはいま、梯子の1段目に登ったところです。この先10や20のブレークスルーを起こさなければ、その梯子が全部でいったい何段あるのか、そして『知性とは何か』を解明することはできないでしょう」

AIの進化は、まだまだ序章にすぎないのだろう。だが少なくとも、ぼくらはその梯子のひとつが登られた瞬間を目にしたのである。
 
google


【対戦は3/15まで】もし、AIが囲碁で人間を打ち負かしたなら
2016.3.9 WED wired 

1月下旬、グーグルのブレイン集団・ディープマインドの人工知能が囲碁の欧州チャンピオンを負かしたことが明らかとなった。そして3月9日、そのマシンは世界チャンピオンと対決する。AI研究者たちは、なぜかくも囲碁に夢中なのか。囲碁マシンの進化は何を意味するのか。

グーグルの人工知能(AI)は、チェスよりもはるかに複雑な戦略と知性を要する、2,500年の歴史をもつ競技、囲碁の勝負でついに人間の名人を破った。それでも、ニック・ボストロムはさして感銘を受けていない。

ボストロムはスウェーデン生まれのオックスフォード大学哲学教授で、ベストセラー『Superintelligence: Paths, Dangers, Strategies』で注目を集めた人物だ。この本で彼は、知性をもつコンピューターが本当に人類の絶滅を早める可能性があるとしている。そして、彼はグーグルの囲碁マシンの力を軽視しているわけではないが、それは必ずしも大きな飛躍を指すものではないと主張しているのだ。
ボストロムによれば、グーグルのシステムの背景にあるテクノロジーは数年にわたって着実によくなっており、そこにはディープラーニング(深層学習)やリインフォースメントラーニング(強化学習)のような、重ねて議論されてきたAI技術が含まれている。囲碁の名人を負かしたグーグルでさえ、非常に大きな弧の一部にすぎない。それはずっと昔に始まり、今後数年にわたり続いていく弧である。

「AIにはこれまで多くの進展があり、いまでも進化しています」とボストロムは言う。「グーグルの根底にあるテクノロジーは、この数年続いてきた開発の延長線上にあるのです」
しかし見方を変えれば、それこそグーグルの勝利がとても刺激的であると同時に、少し怖くもある理由だ。彼らの勝利は、このテクノロジーがどれくらい進歩してきたのか、そしてどこへ向かうのかを立ち止まって考えてみるいいきっかけになると、ボストロムですら言っている。研究者たちは少し前まで、AIが囲碁で人間に勝利するには少なくともあと10年はかかるだろうと考えていた。しかしいまでは、それがかつて到達できないと思われていたところへと向かっている。少なくとも能力と資本をもつ大勢が、その場所へ到達しようと躍起になっている。

これはグーグルに限った話ではない。フェイスブックとマイクロソフトについての話でもあり、その他多くのテック企業の話なのだ。AI開発というレースにはいま、地球上で最もパワフルで裕福な人々が参加している。
戦略と競争を含む、すべてのことに
「AlphaGo」という名で知られるグーグルのAIシステムは、グーグルが2014年に4億ドルで買収したAIスタートアップ、DeepMind(ディープマインド)が開発した。ディープマインドはディープラーニングとリインフォースメントラーニングの両方を専門としており、その技術はマシンが自ら、広範囲に学ぶことができるようにするものだ。
創設者デミス・ハサビスと彼のチームは、これらの技術を使用して「ポン」「ブロック崩し」「スペース・インヴェーダー」のような古典的なアタリ社のヴィデオゲームをプレイするシステムをつくった。これらのシステムは、プロのゲームプレーヤーを上回っただけではない。それは人間が決してしない、あるいはできない方法でゲームを攻略したのだ。この力こそが、ラリー・ペイジがディープマインドを買収した理由である。

ディープマインドのAIが「ブロック崩し」をする様子。600ゲームをこなしたころ、AIはブロックにトンネルを空けてポイントを稼ぐ方法を発見する。
ニューラルネットワークを利用して、ディープラーニングは『Googleフォト』に非常に効果的なイメージ検索ツールを組み込もうとしている──そしてこの技術は、Facebookの顔認証サーヴィスはもちろん、Skypeに組み込まれた言語翻訳ツールとなり、Twitter上ではポルノを認識するシステムとなる。何百万ものゲームの動きをニューラルネットに与えば、ゲームの遊び方を教えることができる。別の大きなデータセットを用いれば、別の仕事をするようにニューラルネットに教えることができる。検索エンジンの結果を出すことからコンピューターウイルスを認識することまで、ニューラルネットは行うことができるのだ。

リインフォースメントラーニングが、その能力をさらに伸ばすことになる。上手にゲームをプレーするニューラルネットをひとたび構築したならば、それ同士を戦わせることができる。2つのニューラルネットが何千回も試合をこなすことで、そのシステムはどの動きが最も高い報酬(=スコア)をもたらすかを追い求めるのだ。こうして、システムはさらに高いレヴェルでゲームをすることを学んでいく。これもまた、ゲームに限った話ではない。ゲームに似たすべてのことに当てはまるのだ。戦略と競争を含む、すべてのことに。

ハサビスと彼のチームはさらに、AlphaGoにひとつ上のレヴェルの「ディープ・リインフォースメント・ラーニング」、つまり各々の動きの長期的な結果を見通す力を与えた。一方で彼らは、モンテカルロ法といった囲碁を打つAIをつくるための従来の技術にも頼っている。
このように新しい技術と古い技術の双方を用いて、彼らはプロの棋士を打ち負かすことができるシステムを構築したのだ。2015年10月、AlphaGoは現欧州囲碁チャンピオンとの無観客試合をした。試合は5回行われ、5回ともAlphaGoが勝った。

囲碁を制する者は、世界を制す

この勝利以前は、多くのAIの専門家は、AIが人間のプレーヤーを打ち負かすことができると思っていなかった。少なくともこれほどすぐには。
ディープマインドほどの多くの研究者を投入してはいないが、ここ数カ月でフェイスブックも自前の囲碁AIシステムに着手している(グーグルの発表がある前の週に、ディープラーニングの生みの親のひとりであり現在はフェイスブックのAI研究を率いるヤン・ルカンに「グーグルが囲碁の名人を密かに負かしたかもしれない」とわれわれが訊いたとき、彼はそれはないだろうと答えた)。

囲碁の問題は、それがとてつもなく複雑であるということだ。チェスの平均的な手数はおよそ35通りだが、囲碁のそれは250通りである。それぞれの手のあとには、さらに250の選択肢がある。そのため最も強力なスーパーコンピューターでさえ、すべての手の可能性を見通すことはできない。ハサビスが言うように「宇宙の原子の数よりも囲碁の打ち手の数の方が多い」のだ。ゲームで勝つためには、計算以上のことができるAIを必要とする。人間の視力や直観力、学ぶことができる何かを模倣する必要があるのだ。

だからこそ、グーグルとフェイスブックは囲碁の問題に取り組んでいる。AIがそのような巨大で複雑な問題を解決できるならば、現実世界でより実際的な仕事を行うAIシステムをつくる足がかりとして、彼らが囲碁から学んだことを使うことができるからだ。
これらのテクノロジーはロボティクスにフィットすると、ハサビスは言う。彼らは、ロボットによりうまく環境を理解させ、その環境の思いがけない変化に対応させることができるだろう。食器を洗うことができるマシンがいい例だ。しかしハサビスは、これらのテクノロジーが、研究者を次の大きなブレークスルーに向かわせるためのAIアシスタントを提供することで科学を加速させることができるとも考えている。

そしてAIはすぐに、日常生活を変えるアプリケーションとなるだろう。ディープマインドの技術によって、スマートフォンは画像や言葉を認識したり翻訳したりするだけでなく、言語自体を理解するようになるのである。
フェイスブックの“深層”
グーグルが密かに名人を打ち負かしたことを明らかにする数時間前、マーク・ザッカーバーグがなぜFacebook上であれほど囲碁について語りたがっていたのか、以下を読めばその理由がわかる。

グーグルの発表は、学術誌『Nature』で発表される研究報告として届いたのだが、その公式リリースの前に、フェイスブックの社員はその内容を入手していた(それは秘密保持契約のもと、2日前に記者たちに共有されていた)。その結果、ザッカーバーグやほかの社員から、一種の“プレ・ダメージコントロール・キャンペーン”が行われることになった。
グーグルの発表の前夜、フェイスブックのAI研究者は、囲碁に関する彼らの研究について詳述している新しい研究報告を発表した(それ自体まぎれもなく印象的な研究である)。そしてザッカーバーグは、彼のFacebookアカウントからその研究を喧伝した。

「われわれは過去6カ月で、0.1秒の速さで動くAIを構築しました。それは、つくるのに何年もかかった前のシステムと同じくらい、いい出来です」と彼は言った。「これに取り組む研究者ヤンドン・チャンは、わたしの机から約20フィートのところに座っています。わtしはAIチームを、自分の側に置いておくようにしています。そうすれば、彼らが取り組んでいることからわたしも学ぶことができますから」
フェイスブックの囲碁AIがグーグルのAlphaGoほど進んでいないことを、ザッカーバーグは気にしていないという。ルカンが指摘したように、フェイスブックは囲碁問題にディープマインドほど多くのリソースを投入してこなかったし、その問題に取り組むことにさほどの時間を費やしてこなかった。だが本当のところ、フェイスブックは(特にザッカーバーグは)AIに非常に大きな重要性を感じている。彼らは最大のビジネスライヴァルであるグーグルと、AI研究においても激しく競い合っているのだ。

フェイスブックのAI研究を率いるヤン・ルカンが、彼らのAI技術を説明する動画。
しかしこのAI競争は、どちらの会社がより強い囲碁マシンをつくれるかが問題なわけではない。どちらが最高のAI技術者を惹きつけることができるかが問題なのだ。ザッカーバーグとルカンは、自分の会社がこの問題に関して真剣だということを、比較的小さなAIコミュニティーに示さなければいけないとわかっている。

それが彼らにとってどれほど重大なのかは、ザッカーバーグとチャンとのデスクの距離が物語っている。フェイスブックの社内では、どれほどザッカーバーグの近くに座っているかでその人物の重要性が判断されるという。だから、そう、ザッカーバーグはこの問題に個人的に関与しているのだ。とても深く。
ちなみにザッカーバーグは、2016年の個人的な挑戦は「家と仕事の両方で役に立つAIシステムを構築すること」だと語っている。

シンギュラリティへの序曲

グーグルとフェイスブックは、人間の知性をさまざまな点で上回るAIをつくろうとしている。彼ら2社だけではない。マイクロソフトやツイッター、そしてイーロン・マスク、そのほか実に多くの者が同じ方向に向かって進んでいるのだ。それはAI研究にとって重要なことである。そしてニック・ボストロムのような人々にとっては(イーロン・マスクにとっても)、同時に怖いものである。

ディープラーニング研究を行うスタートアップ「Skymind」の創設者兼CEOのクリス・ニコルソンが語るように、囲碁を行うことのできるAIは、戦略が重要なゲームのように考えることのできるほとんどすべての問題に適用できる。これには金融取引や戦争を含む、と彼は言う。

金融取引にしても戦争にしても、AIに学ばせるためにはもっと多くの作業とデータが必要だ。しかし、そうしたコンセプトを耳にするだけでも不安になる。ボストロムはその著書で、AIは核兵器より危険かもしれないと述べている。AIは、人間が悪用できるというだけでなく、人間がコントロールできないAIシステムを構築しうるからだ。

AlphaGoのようなシステムでは、そんなAIをつくり出すことはできない。AlphaGoは単独で学び、(囲碁において)大部分の人間を上回ることができる。しかし、囲碁がいくら複雑といっても限られた宇宙だ。本物の宇宙ほど複雑なわけではない。だからディープマインドの研究者たちは、このシステムを完全に制御できると言う。彼らはシステムを自由に変えることができるし、シャットダウンすることもできる。この特殊なマシンを危険であると考えることは、まったくのナンセンスである。

本当の懸念は、研究者がAIシステムの改善を続けて、知らず知らずのうちに「世界の終末」が現実のものとなり始める境界線を越えてしまうことだ。ボストロムが言うには、彼を含む「Future of Humanity Institute」の人々は、リインフォースメント・ラーニングシステムが研究者の管理を逃れる方法を見つけられるかどうかを見ているという。
「より高度なシステムに起こる問題に似たものを、わたしたちはこのシステムにも見ることができます」と彼は言う。つまり、リインフォースメント・ラーニングシステムによって、マシンがシャットダウンされることに抵抗したことを示す兆しがあったのだ。

しかし、これらは非常に小さな兆しである。ボストロムは、そのような危険がやって来るとしてもまだ遠い先のことだと認めている。彼の努力やイーロン・マスクのような影響力のあるテクノロジストのおかげで、産業界は、その必要が生じるずっと前からAIの潜在的な危険性に気づいている。これらの懸念が示すのは、ディープマインドで開発中のこうしたテクノロジーが、ものすごく強力であるということだ。

グーグルの囲碁における勝利は、同じことを示している。しかしその勝利は、ほんの序曲にすぎない。3月にAlphaGoは、過去10年における世界最高の囲碁棋士イ・セドルに挑戦する。世界ランク5位のセドルは、AIに敗れた欧州チャンピオン、世界ランク633位のファン・フイよりかなり優秀だ。
多くの専門家は、このヘヴィー級の試合でもAlphaGoが勝つと考えている。もしそうなったとしても、それもほんの序曲である。

観戦速報・グーグルの囲碁AI「AlphaGo」が最強の棋士を破った日
グーグルの人工知能(AI)と、世界最強棋士のひとりとの5連戦。接戦となったその第1戦は、人がAIに敗れるという結果に終わった。2016年3月9日は、これからのAIを語るうえで重要な日となる。
かつてカスパロフ、そしていまイ・セドルの名前が、コンピューターに敗北を喫した人間の名前として歴史に刻まれることになった。
3月9日13時(日本時間)に始まった「Google DeepMind Challenge Match」の第1戦は、16時30分頃にイ・セドル九段が投了し、人工知能(AI)が人に勝利するという結果に終わった。
グーグルが2014年1月に買収した英国の“人工知能スタートアップ”DeepMind(ディープマインド)。彼らのテクノロジーが、何をもって革新的とされるのかを説明するのは、同社CEOのデミス・ハサビスらにインタヴューした『WIRED』VOL.20の特集記事に譲りたい。だが、この日DeepMindの囲碁プログラム「AlphaGo」(アルファ碁)が手にした勝利が、テクノロジーの歴史において大きなマイルストーンとなったことは、ここでしっかりと記しておきたい。
関連記事:「囲碁の謎」を解いたグーグルの超知能は、人工知能の進化を10年早めた(2016.1.31)
この勝利に向けられた人々の感情は、対局直後からソーシャルメディアに溢れている。そして、コンピューターと人が差し交わした一手一手についても、すでにして多くの解説がネット上に公開され始めている。
本記事では、ひとつだけ、本対局を振り返って記しておきたい。それは、AIは人らしく指したと同時に、AIだからこその打ち手も見せた、ということだ。
この日、『WIRED』日本版では、対局が中継されたYouTubeライヴストリーミングを、日本が誇るコンピューター囲碁研究に携わる研究者・開発者らとともに見届けた。

終局後の彼らとの対話の内容を抜き出してみよう。曰く、「DeepMindが打った手には『人であれば打たないだろう』と思えるものもあった」「その瞬間は、その手が有効だとは思えなかった」「しかし終わってみれば、それがあったからこそDeepMindは勝てたのかも知れない」「あるいは、勝敗とは関係ないのかも知れない」…。
AIは、人が盤上に見出せていない何かを見ているのかもしれない──。過剰な思い入れとも言われそうだが、その進化には期待せずにはいられない。
さて、戦いはまだ終わっていない。第2戦は3月10日(木)に行われる。そして、5回にわたって開催される決戦の詳細については、4月9日に発売となる雑誌『WIRED』VOL.22にてレポートをする予定なので、誌面をぜひご期待いただきたい。
(記事引用)