AlphaGo対李世ドル

出典: フリー百科事典『ウィキペディア(Wikipedia)』

AlphaGo対李世乭(アルファご・たい・イ・セドル)は、韓国プロ棋士である李世乭と、Google DeepMindが開発したコンピュータ囲碁プログラムAlphaGoの五番勝負である。

対局はコミ7目半の中国ルールで、持ち時間は2時間で、切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある[1]

勝者(勝ち越し者)は100万米ドルの賞金を得る。もしAlphaGoが勝利すれば、賞金はUNICEFを含むチャリティーへ寄付される[2]。賞金に加えて、李世乭は全5戦の対局料として15万米ドル、1勝につき2万米ドルを得る[1]

概要[編集]

囲碁は長い間、AIの分野における難問と見なされており、チェス将棋でコンピュータがプロ相手に勝利を収めているなか、2015年の時点でもプロ棋士の棋力には遠く及ばず、AlphaGo以外の囲碁プログラムは3子のハンディキャップを貰った置き碁でも勝ったことがなかった。しかし2015年10月、AlphaGoヨーロッパ碁コングレスで優勝経験のあるプロ棋士である樊麾と非公開の五番勝負を行い、5勝0敗で破っていた。

そして2016年、今度はトッププロ棋士との対局を企画されたのがこの対戦である。

対局の模様は中国語、日本語、朝鮮語、英語の解説付きでライブ配信された。朝鮮語の配信はBaduk TVを通じて行われた[3]。英語のオンライン配信はマイケル・レドモンドとアメリカ囲碁協会副会長のChris Garlockによって行われ、平均視聴者は8万人、第1局の終局近くには視聴者が10万人に達し、古力柯潔が解説を行った中国語での第1局の配信はテンセントLeEcoによって提供され、視聴者は約6千万人に達する[4]など大いに注目を集めた[5]

この対局は1997年に行われたディープ・ブルーとガルリ・カスパロフとの間の歴史的なチェス対局と比較されている。

対局者[編集]

AlphaGoはGoogle DeepMindによって開発された、囲碁を打つためのコンピュータプログラムである。AlphaGoのアルゴリズムは機械学習モンテカルロ木探索の組み合わせを用いており、人間の棋譜による教師あり学習と、自己対戦による強化の組み合わせで成り立っている。まずAlphaGoは、ネット対局場KGSの6段以上のアマ高段者の棋譜約16万局、約3000万手を教師にして[6][7]人間の打つ手を模倣できるように訓練され[8]、実際に打たれた手を57%の確率で模倣できるようになった[9]。次に旧バージョンのAlphaGo自身と考慮時間が極端に短い対局を繰り返す強化学習を行った[10]。その結果、他の囲碁プログラムと500戦し499勝を収めるまでの棋力に至った[9]

李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー(1,202 CPU、176 GPU)を使う[11]。システムは着手の「データベース」は活用しない。AlphaGoの作成者の一人は次のように説明した[12]

我々はAlphaGoに囲碁を打つようプログラムしたが、どんな手を思い付くのかは全く分からない。AlphaGoの手は訓練からの創発現象である。我々は単にデータセットと訓練アルゴリズムを作成しただけだ。しかし、AlphaGoが思い付く手は我々の手を離れており — そして碁打ちとして我々が思い付くものよりもずっと優れている。
李世乭(2012年)

李世乭韓国棋院に所属する[13]。1996年に12歳でプロに昇段し、それ以降に18回の世界王者となっている[14]。李は出身の韓国において「国民的英雄」と呼ばれており、型にはまらない創造的なプレーでも知られている[15]。李世乭は当初AlphaGoを「大勝」で破るだろうと予測した[15]。対局の数週間前、李は韓国の名人戦で勝利した[15]

ルール[編集]

対局は五番勝負で行われ、賞金は100万米ドルである[2]。中国ルールでコミは7目半。持ち時間は2時間で切れると1手1分の秒読み、ただし1分単位で合計3回の考慮時間がある[1]。対局は3月9日から15日までの1週間で行われ、13時(日本・韓国標準時)から始まる[16]

対局[編集]

この対局は韓国ソウルフォーシーズンズホテル2016年3月に行われ、ライブでストリーミング配信される[17][18][19]。DeepMindチームのメンバーでアマチュア6段の黄士傑 がAlphaGoの代わりに盤面に着手する。AlphaGoはアメリカ合衆国に位置するサーバを使ったGoogleのクラウドコンピューティングによって動作する[20]

概要[編集]

対局
日付 黒番 白番 結果 手数
第1局 2016年3月9日 李世乭 AlphaGo AlphaGo中押し勝ち 186
第2局 2016年3月10日 AlphaGo 李世乭 AlphaGo中押し勝ち 211
第3局 2016年3月12日 李世乭 AlphaGo AlphaGo中押し勝ち 176
第4局 2016年3月13日 AlphaGo 李世乭 李世乭中押し勝ち 180
第5局 2016年3月15日 李世乭 AlphaGo AlphaGo中押し勝ち 280
結果:
AlphaGo 4 – 1 李世乭

第1局[編集]

AlphaGo(白)が第1局を勝利した。李は一局の大半を通して主導権を握っているように見えたが、AlphaGoが最後の20分に優位に立ち、李が投了した[21]。李は終局後に、序盤に大きなミスを犯したと述べた。李は、序盤におけるコンピュータの戦略は「卓越」しており、AlphaGoは人間の棋士なら打たないような手を打ったと述べた[21]。GoGameGuruでこの対局を解説したDavid Ormerodは、李の黒7を「序盤でAlphaGoの実力を試す奇妙な手」と説明した。この手を疑問手と見なし、AlphaGoの応手を「正確かつ効果的」と見なした。Ormerodは序盤はAlphaGoがリードし、李は黒81から挽回を始めたが、黒119と黒123が疑問手であり、黒129が敗着になったと説明した[22]。韓国棋院の趙漢乗は、AlphaGoの打ち回しは2015年10月に樊麾を破った時よりも大きく改善されていたと論評した[22]。プロ囲碁棋士マイケル・レドモンドは、コンピュータの打ち方は樊との対局時よりも積極的であったと述べた[23]

金成龍によれば、李世乭は102手目のAlphaGoの強手に驚かされたようである[24](この手の後に李は10分以上長考した)[24]

99手目まで
100-186手目

第2局[編集]

AlphaGo(黒)が第2局に勝利した。李は対局後に、「AlphaGoはほぼ完璧な碁を打った」[25]、「序盤から自分がリードしたと一度も感じなかった」と述べた[26]

AlphaGoの作成者の一人デミス・ハサビスは、解説者がどちらが優勢か判断できなかったゲームの中盤からAlphaGoが勝利を確信していたと述べた[26]。AlphaGoの打った37手目、四線の石に対する肩ツキはそれまでの囲碁の常識にはなかった手で、見守っていた人々を驚愕させ、「新たなパラダイムを示した」と評された[27]。韓国棋院の安永吉英語版は、特にAlphaGoの黒151、157、159を賞賛した[28]

黒167は李に紛れを求めるチャンスを与えたようにも見え、ほとんどの解説者は悪手だと断言した。しかし、のちにこの手も多少の損の代わりに勝利を確実なものにするための正しい判断だったと考えられるようになった[28]

99手目まで
100-199手目
200-211手目

第3局[編集]

AlphaGo(白)が第3局に勝利した[29]

第2局の後、棋士の間では、AlphaGoの真の実力について、まだ強い疑いがあった。第3局ではこの疑いが晴れた。Ormerodは以下のように論評した。

AlphaGoは、経験を積んだ棋士たちが抱くその強さに対する疑いを全て晴らすように、文句の付けようのない形で勝利した。AlphaGoは恐ろしさを覚えるほど非常にうまく打ちまわした ... 李はAlphaGoに非常に厳しく一方的な攻めを見せたが、結果的にこれまで気付かれていなかったAlphaGoの真の力を明らかにしてしまった ... 李は攻めによる得を得ることができなかった ... 最高の中盤戦の名人である彼が、はっきり明確にお株を奪われたのだ[30]

安永吉とOrmerodは、この一局は「AlphaGoが全ての人間の棋士よりも単純に強い」[30]ことを示したとした。AlphaGoは今までの2局では現れなかった、コンピュータには判断が難しいとされてきたコウでもミスは犯さなかった[31]。安とOrmerodは、白148が特に注目に値すると考えた。複雑なコウ争いが起きているなか、AlphaGoはコウ争いに勝てると自信を見せ、上辺の大場に先着したのである[30]

黒番の李は高中国流を採用したが、AlphaGoは白12と黒の大模様に打ち込んでいった。李としてはこの白を厳しく攻めて得を図りたいところだったが、AlphaGoに簡単にサバかれてしまった[30]。安は李の黒31が敗着であった可能性が高いとしており[30]アメリカ囲碁協会のAndy Jacksonは勝敗が黒35の時点で既に決していたと判断した[32]。AlphaGoは白48から碁の主導権を握り、李は守勢を余儀無くさせた。李は黒77・79と反撃したが、AlphaGoは白90まで局面を簡明にすることに成功した。AlphaGoは下辺に大きな地模様を作り、白102から112まで、右辺や左上の白石の強化に回った。安は一連の進行を「洗練されている」と表現した[30]。李は黒115から下辺の白地を荒らしに行ったが、AlphaGoは適切に対応した。黒131から複雑なコウを仕掛けたが、AlphaGoのミスを誘うことはできず、176手目に投了した[30]

99手目まで
100-176手目(122手目は113の位置、
154手目は
163手目は145、164手目は151、
166手目と171手目は160、169手目は145、
175手目は

第4局[編集]

第4局は李(白)が勝利した。DeepMindのデミス・ハサビスは、AlphaGoは79手目にミスをし、その時点では勝率が70%と見積っていたが、87手目に、その推定値が突如急落したとしている[33][34]。Ormerodは87手目から101手目を典型的なモンテカルロベースのプログラムのミスと述べた[35]

李は、AlphaGoが「相場碁」(小さな得を積み重ねて勝ちを目指す碁)を好んでいるようであることから、アマシ作戦を選択し、足早に辺や隅に地を取った[35]。駆け引きに強いAlphaGoであるが、「生きるか死ぬか」の局面に誘導することで、AlphaGoのわずかな得を重ねる力がほとんど無意味になる可能性があると李は考えた[35]。李は辺や隅に地を取ることに集中し、AlphaGoが中央に模様を張る展開となった。李は白40から46と上辺のAlphaGoの模様を荒らしに行った。AlphaGoは黒47とカタツキで応じると、右辺の白と上辺の白をカラミ攻めにする構想を見せ、4子を捨て石にして黒69と上辺の白を制したかに見えた。李は白72から76としたがAlphaGoは適切に対応し、この時点で解説者らは李の打ち回しが勝ち目のないものだと感じ始めていた。しかし、「素晴らしい手筋」と表現された、白78のワリコミと82の強手によって、完全に形勢が逆転した[35]。この手により、中央の白の一団は簡単には取られない石になり、難解な碁になった[36]。しかし局後、78のワリコミに対し黒が正しく応手すれば手にならないことが判明した。実戦はワリコミが候補手になかったことでAlphagoは変化を読み切れず、最善を尽くせなかった結果の逆転となった。

黒83・85は適切だったが、黒87から101にかけてAlphaGoは大悪手を連発した。李は白92と中央に手をつけた時点で優勢となり、安は黒105を決定的な敗着とした。小ヨセに入った段階で、AlphaGoは逆転が不可能であると判断し投了した[35]。これは、逆転の見込みが無いときには投了するべきだという人間の価値観に見合うよう、AlphaGoが勝率が20%未満であると判断した場合投了するよう設定されていたためである[36]

中国棋院古力は、白78を「神の一手」と形容し、この手は全く想像していなかったと述べた[35]。安も、この一局が「李世乭にとっての傑作であり、囲碁の歴史における名局となることはほぼ確実だろう」と称賛した[35]日本棋院井山裕太も「勝てない相手ではないこと、人間が上回っている部分があることを証明してくれた。セドル九段に敬意を表したい」と李を称えた[37]。李は試合後に、AlphaGoは白番の時が最も強かったと考えていると述べた[38]

Ormerodは、黒79から87までのAlphaGoの打ち方のまだ分析できていないが、モンテカルロ木探索を用いたアルゴリズムにおける既知の弱点によるものと考えている。モンテカルロ木探索では、重要ではないと判断された局面の木は刈り取られるようになる。そのため、ほぼ一本道の変化がある局面において、その変化の読みを省略してしまう危険があった[39]

99手目まで
100から180手目(177手目は、178手目は

第5局[編集]

AlphaGo(白)が第5局に勝利した[40]。この一局は接戦だったと評された。ハサビスは、ゲームの序盤にAlphaGoが「大きな失敗」をしでかした後に追い上げたものであると述べている[40]

第5局の手番は新たにニギリを行って決するはずであったが、第4局終了後に李が「AlphaGoは白番の方が黒番より強い。強い白番相手に打ちたい」と希望し、ハサビスが即座にこれを快諾したため、李の黒番で行われた。黒番の李は第4局同様に地で先行する戦略を取り、AlphaGoは中央に大きな勢力を得た。形勢はそれまで互角であったが、 AlphaGoが右下において石塔シボリ手筋を読み落として白48から58としたことで、李が主導権を握ることになった。しかし、 AlphaGoは代償に中央から上辺に模様を広げ、李の黒69から81までの荒らしに対し黒を小さく生かすことに成功した。Ormerodは、この黒の一連の動きが慎重すぎたと指摘した。白90でAlphaGoは形勢を互角に戻し、Ormerodが「珍しいが、微妙に印象的である」と評した、わずかに得な手を打った。地合いで不利な李は黒167・169と仕掛けるもAlphaGoは冷静に対処した。AlphaGoは完璧なヨセで優勢を維持し[41]、AlphaGoの中押し勝ちとなった。安は、終盤の白154、186、194と特に良い手だと指摘した。

99手目まで
100-199手目(118手目は107の位置、161手目は)
200-280手目(240手目は200の位置、271手目は
275手目は、276手目は)

背景[編集]

数学者のI・J・グッドは1965年に以下のように記している[42]。1965年の時点では、まだ初心者程度に囲碁を打てるプログラムすら存在しなかった。

コンピュータの碁においては– 単にルールを守った碁というより、理にかなった碁を打つようにコンピュータをプログラムするためには – 戦略の原理を形式化する、あるいは学習プログラムを設計する必要がある。囲碁の原理はチェスよりも質的かつ神秘的であり、判断力により依存する。したがって、理にかなった碁を打つようコンピュータをプログラムすることは、チェスの場合よりもさらにいっそう難しいだろうと私は考える[43]

2015年まで、9路盤では一部のプログラムがプロ棋士に対して勝利できるだけの力を備えていたが、19路盤ではプロ棋士に太刀打ちできていなかった[44]人工知能の分野における多くの人々も、囲碁はチェスよりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた[45]

AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。ニューラルネットワークでは、評価経験則が人間によってハードコードされておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索もAlphaGoの推論効率を改善するための主要な方法として用いられている。

コンピュータ囲碁研究の結果は、認知科学パターン認識機械学習といったその他の同様の分野に応用されている[46]

備考[編集]

第20回三星火災杯世界囲碁マスターズ開催後、囲碁人口の減少による広報効果の減落により存続の危機に立たされていた。しかしこのAlphaGoの対局により韓国国民の囲碁に対する関心が復活し存続が決定。しかも「夢の木選抜戦」というアマチュアの予選まで追加した[47]

関連項目[編集]

脚注[編集]

  1. ^ a b c 이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려” (Korean). 韓国棋院 (2016年2月22日). 2016年2月22日閲覧。
  2. ^ a b Human champion certain he'll beat AI at ancient Chinese game”. AP News (2016年2月22日). 2016年2月22日閲覧。
  3. ^ http://www.tvbaduk.com/
  4. ^ The Sadness and Beauty of Watching Google’s AI Play Go”. WIRED (2016年3月11日). 2016年3月12日閲覧。
  5. ^ Künstliche Intelligenz: "Alpha Go spielt wie eine Göttin" - Golem.de”. 2016年3月15日閲覧。
  6. ^ 1975-, 大槻 知史 三宅 陽一郎, (2018.7). 最強囲碁AIアルファ碁解体新書 : 深層学習、モンテカルロ木探索、強化学習から見たその仕組み. Shōeisha. ISBN 9784798157771. OCLC 1057382206. http://worldcat.org/oclc/1057382206 
  7. ^ しばしば「プロの棋譜を用いた」などとされることがあるが、KGSのプレイヤーはほとんどがアマチュアであり、正確ではない。
  8. ^ Metz, Cade (2016年1月27日). “In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go” (英語). WIRED. 2016年2月1日閲覧。
  9. ^ a b AlphaGo: マシンラーニングで囲碁を”. Google Japan Blog. 2018年12月22日閲覧。
  10. ^ Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog (2016年1月27日). 2016年3月11日閲覧。
  11. ^ Demis Hassabis [@demishassabis] (2016年3月11日). "We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns". X(旧Twitter)より2016年3月14日閲覧
  12. ^ Google’s AI Wins Pivotal Second Game in Match With Go Grandmaster”. WIRED (2016年3月10日). 2016年3月12日閲覧。
  13. ^ Lee SeDol. gobase.org. accessed 22 June 2010.
  14. ^ http://www.shanghaidaily.com/article/article_xinhua.aspx?id=322918
  15. ^ a b c Mark Zastrow. “'I'm in shock!' How an AI beat the world's best human at Go - New Scientist”. New Scientist. 2016年3月11日閲覧。
  16. ^ AlphaGo”. Google DeepMind. 2016年3月10日閲覧。
  17. ^ Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast”. The Guardian (2016年2月5日). 2016年2月15日閲覧。
  18. ^ Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea”. Business Insider (2016年2月22日). 2016年2月23日閲覧。
  19. ^ Novet, Jordan (2016年2月4日). “YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March”. VentureBeat. 2016年3月11日閲覧。
  20. ^ 李世乭:即使Alpha Go得到升级也一样能赢” (Chinese). JoongAng Ilbo (2016年2月23日). 2016年2月24日閲覧。
  21. ^ a b “Google's AI beats world Go champion in first of five matches”. BBC. (2016年3月9日). http://www.bbc.co.uk/news/technology-35761246 2016年3月9日閲覧。 
  22. ^ a b AlphaGo defeats Lee Sedol in first game of historic man vs machine match”. Go Game Guru (2016年3月9日). 2016年3月9日閲覧。
  23. ^ Tanguy Chouard (9 March 2016). “The Go Files: AI computer wins first match against master Go player”. Nature. doi:10.1038/nature.2016.19544. http://www.nature.com/news/the-go-files-ai-computer-wins-first-match-against-master-go-player-1.19544. 
  24. ^ a b Surprised at his loss, Lee Se-dol says he’s looking forward to another chance”. 2016年3月11日閲覧。
  25. ^ “Google AI wins second Go game against world champion”. BBC. (2016年3月10日). http://www.bbc.co.uk/news/technology-35771705 2016年3月10日閲覧。 
  26. ^ a b Sam Byford (2016年3月10日). “Google's DeepMind beats Lee Se-dol again to go 2-0 up in historic Go series”. The Verge. Vox Media. 2016年3月11日閲覧。
  27. ^ 「人工知能は碁盤の夢を見るか? アルファ碁VS李世乭」 p.78 東京創元社
  28. ^ a b David Ormerdo (2016年3月10日). “AlphaGo races ahead 2–0 against Lee Sedol”. Go Game Guru. 2016年3月11日閲覧。
  29. ^ “Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol”. BBC. (2016年3月12日). http://www.bbc.co.uk/news/technology-35785875 2016年3月12日閲覧。 
  30. ^ a b c d e f g David Ormerod (2016年3月12日). “AlphaGo shows its true strength in 3rd victory against Lee Sedol”. Go Game Guru. 2016年3月12日閲覧。
  31. ^ Sam Byford (2016年3月12日). “AlphaGo beats Lee Se-dol again to take Google DeepMind Challenge series”. The Verge. Vox Media. 2016年3月12日閲覧。
  32. ^ Tanguy Chouard (12 March 2016). “The Go Files: AI computer clinches victory against Go champion”. Nature. doi:10.1038/nature.2016.19553. http://www.nature.com/news/the-go-files-ai-computer-clinches-victory-against-go-champion-1.19553. 
  33. ^ Demis Hassabis. “Twitter post (12:09 a.m. – 13 Mar 2016)”. 2016年3月13日閲覧。
  34. ^ Demis Hassabis. “Twitter post (12:36 a.m. – 13 Mar 2016)”. 2016年3月13日閲覧。
  35. ^ a b c d e f g David Ormerod (2016年3月13日). “Lee Sedol defeats AlphaGo in masterful comeback – Game 4”. Go Game Guru. 2016年3月13日閲覧。
  36. ^ a b Cade Metz (2016年3月13日). “Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI”. Wired.com. 2016年3月14日閲覧。
  37. ^ グーグル囲碁AI「4勝1敗」は人類の敗北か。プロ棋士から見た勝負の評価”. ニュースイッチ. 2018年12月22日閲覧。
  38. ^ Lee Sedol in Google DeepMind Challenge Match 4 post-match press conference (13 March 2016)
  39. ^ https://gogameguru.com/lee-sedol-defeats-alphago-masterful-comeback-game-4/
  40. ^ a b Byford, Sam (2016年3月15日). “Google's AlphaGo AI beats Lee Se-dol again to win Go series 4-1”. The Verge. 2016年3月15日閲覧。
  41. ^ Ormerod, David (16 March 2016), AlphaGo defeats Lee Sedol 4–1 in Google DeepMind Challenge Match, Go Game Guru, https://gogameguru.com/alphago-defeats-lee-sedol-4-1/ 2016年3月16日閲覧。 
  42. ^ I. J. Good (1965年1月21日). “The Mystery of Go”. New Scientist. 2016年3月11日閲覧。
  43. ^ Go on a computer – In order to programme a computer to play a reasonable game of Go, rather than merely a legal game – it is necessary to formalise the principles of good strategy, or to design a learning programme. The principles are more qualitative and mysterious than in chess, and depend more on judgment. So I think it will be even more difficult to programme a computer to play a reasonable game of Go than of chess.
  44. ^ 日本棋院が協力する電聖戦では4子から3子のハンディキャップを付けていた
  45. ^ Johnson, George (1997-07-29), “To Test a Powerful Computer, Play an Ancient Game”, The New York Times, http://query.nytimes.com/gst/fullpage.html?res=9C04EFD6123AF93AA15754C0A961958260 2008年6月16日閲覧。 
  46. ^ Müller, Martin. Computer Go, Artificial Intelligence 134 (2002): p150
  47. ^ 【三星杯】'AlphaGo'が生かしたサムスン火災囲碁大会 nitro15