李セドル九段対アルファ碁…「1対1202」


「1対1202」。李セドルは一人で彼らは1202だ。人工知能囲碁プログラムの「アルファ碁」に搭載された1202個のコンピュータの「中央処理装置(CPU)」のことだ。

アルファ碁はあわせて1202個のCPUと176個のグラフィックス処理ユニット(GPU)を搭載して、1000台のサーバーを活用するシステムで動く。 CPU一台あたり1秒に1000回以上のシミュレーションを行う。サーバーは数台がネットワーク接続されて分散処理を行う方法(クラスタ)だ。インテルとNVIDIAの製品を使ったが、最終的な実装のための設計はディープマインドが直接行った。大企業の研究所でこそ見ることができる「スーパーコンピュータ」に匹敵する性能だ。アルファ碁が千年ぶんの棋譜を覚えたのもこのおかげだ。李セドル九段はプロと準プロ棋士を合わせて総1202人の協業プレイヤーを相手にしていると考えればいい。

世界の主要な情報技術(IT)企業や名門私大でも囲碁プログラムを作るが、そのレベルはアマチュアを超えない。これらとアルファ碁の根本的な違いは学習時間の差だ。

ネイチャーに発表された論文によると、監督学習による高手の「次の手の読み」学習過程で、アルファ碁は55%の精度を示した。これに動員された問題が3000万ということは、いうなれば250手ほどの対局を初手から当てたとしてすでに12万局の学習を終えたわけだ。ひとつの対局を20分で終えるわけだが、一日中対局したならば72局をこなす。

ファン・フイと試合を行ってから5ヶ月の間、李セドル九段の対局を準備しながらアルファ碁は1万800局を既存の12万局に加えた。追加された部分だけでも人間のプロの棋士の1年以上の対局数に匹敵する。アルファ碁の初期にCPUは48個だった。この時も他の人工知能の囲碁プログラムと500回以上の実力比べを終えた後だった。デミス・ハサビスGoogleディープマインド最高経営責任者(CEO)は、去る8日の懇談会で「アルファ碁はクレイジーストーンやジェンなどの他の囲碁プログラムと4手おいて試合をする時も勝率75%以上を記録した」と自慢した。

もちろん、対等な位置で試合を行うと勝率は99.8%に上がる。人間との対決準備を行いつつ、コンピューティングパワーを大幅に伸ばした。 1900個のCPUを搭載したが、むしろ計算能力は低下した。数多くの試行錯誤を経て、1202個という最適の数字が出てきた。昨年10月の対局の後に2段を完敗させ、そしていまや李セドル九段を窮地に追い込んでアルファ碁だ。アルファ碁は碁盤の上で1秒あたり10万回の手を考える。それが平均1~2分程度かかる。囲碁をたしなむ人間よりもはるかに速い。

176個のGPUも、「怪物」アルファ碁を作った重要な要素だ。デビッド・シルバー グーグルディープマインド開発総責任は、これをアルファ碁ブレインとまで言う。 CPUにGPUを一緒に構成すると、CPUのみを搭載したものよりも数十倍演算速度が速くなり発熱も少ない。 GPUの機能はGoogleが先行しているが、おそらくアルファ碁のCPU能力を爆発的に向上させただろう。

ディープマインドチームがアルファ碁を連れてきたが、実物を連れて来たわけではない。すべてのインフラスは米国西部のマウンテンビューにあるGoogleのデータセンターに設けられている。

アルファ碁は「Googleのクラウド・プラットフォーム」を通じて、ソウル市の対局場のラップトップとモニターに接続された。 Googleの関係者は、「韓国ではインターネットのインフラがうまく機能していることをだけを確認した」と語った。 Googleディープマインドは、アルファ碁の細部技術は徹底的に秘密にした。亜洲大学のカム・ドングン電子工学科教授は、「アルファ碁の論文からは中身が抜けている」とし、「アルファ碁の人工知能を作動させるポリシーとニューラルネットワークをどのように接続したのか、再現が不可能だ」と語った。
  • 毎日経済_ウォン・ホソプ記者/イ・ギョンジン記者 | (C) mk.co.kr
  • 入力 2016-03-12 08:32:31.0