『棋士とAI』

『棋士とAI ~アルファ碁から始まった未来~』 王銘琬(おう めいえん) 岩波新書
囲碁でAIが人間に勝つのはまだ当分先のことだと思っていた2、3年前から突然アルファ碁がでてきて、韓国のトップ棋士を負かし、翌年には世界ナンバーワンの中国棋士にも勝利した。さらには、そのアルファ碁に100戦100勝するアルファ碁ゼロ。

囲碁プログラムにも詳しい囲碁棋士の王銘琬が、アルファ碁の強さを解説したのが本書である。

2016年3月には、韓国イ・セドルとの対決。イ・セドルが3敗した次の第4局。
イ・セドルの中盤のワリコミに、アルファ碁が間違った戦法を取った。

 勝負で負けるのは仕方のないことですが、アルファ碁の振る舞いはまるで王者が劣勢になる
と、地べたに座り込んで駄々をこねだしたようでした。その豹変ぶりは衝撃的で、局後の記者
会見ではsの落差に質問が集中しました。シリーズ前にグーグルは、アルファ碁の技術は医療
にも転用しうると述べていたので、医療現場でおきたらどうすのか、とも追求されました。

 アルファ碁が急に誤動作を起こしたのではありません。システムはすべて正常に動いていま
した。アルファ碁が急に乱れたように見えたのは「水平線効果」と呼ばれる現象なのです。
 アルファ碁は手を読むと前節に紹介しましたが、いくら計算力がすごくてもそれには限界が
あります。そのため読みの深さ(読める手数)にも限界があるのは言うまでもありません。
 アルファ碁が正しく打ちますと、読みの届く範囲に都合の悪いことが起こる局面になったと
します。そのとき正しい手は悪い結果を招きますので、評価は高いものになりません。逆に良
くない手を打っても、相手がそれに応じる必要があるなら、手数がかかりますので、都合の悪
いことを読みの深さの届かないところまで、先延ばしにすることができます。読みの中で悪い
ことが起こらないので、悪い手の評価がかえって高くなり、選ばれることになります。都合の
悪いことを視野の範囲、つまり「水平線」の外へ無理やり追い出すため、明らかに悪い手を打
つ現象、それが「水平線効果」です。

アルファ碁は、結局、人間対人間や人間対コンピュータの対戦した棋譜を基に強化していったプログラムだった。
人間が一般的に打っている手が、本当に勝利に一番近いのかどうかは、わかっていない。
人間の碁の歴史においても、碁のバリエーションの多さから言ってそこまでの局面をやってないわけだ。

アルファ碁よりも強くするためには、人間が過去に打ってきた回数よりも、より多くの局面を試させる必要があったわけだ。
そこで、人間が子供の頃に、何も無いところから様々な試みをやってみるように、文字どりゼロから対戦させて造りだしたのが、アルファ碁ゼロである。

 ただ、学習する範囲は結局「自己対戦」の中ですから、完全な解決ではなく、やはり問題が
深いところに隠れただけと言えるかもしれません。囲碁ですと、相手より強ければ問題は顕在
化することはないのですが、これですべてよしと決めつけない方がいいでしょう。
 アルファ碁ゼロは純粋な自己学習ながら、過学習が問題になることなく、旧バージョンより
さらに強くなりました。そして2017年12月に発表されたアルファゼロは他のゲームをも制
覇し、アルファ碁自慢の「汎用性」から見て大きな意味を持つものになりました。「神の一手」
がなかったら、これだけの結果はなかったかもしれません。記者会見でディープマインド社が
話した通り「このようなことを発見するために、イ・セドルと戦った」のでした。

アルファ碁は、どういうことを考えて手を決めているのか?

人間なら当然持っている戦略というものが無いという。

 アルファ碁は部分の考え方を持たない裏返しとして、人間のような全局の概念もありません。
「分かる部分」に対しては分かるまで読み、分からない全局に対しては大局観や戦略など、別
のやり方で対応する。それが人間のやり方です。アルファ碁には、「分かる部分」がないわけ
ですから、「分からない全局」もありません。どの手でも、常に同じ処理の仕方をしているだ
けです。前節の「ノゾキ」を説明するため、アルファ碁は「その後の展開まで見通し、人間に
できない戦略を展開した」というような解釈をされますが、AIには「部分」すらないわけで
すから、人間のイメージする戦略、戦術のようなものも持ち合わせていません。

人間ならば、重要な局面に入ったと思えば、時間をかけて、熟慮するわけですが、アルファ碁は重要な局面かどうかすらわからないので淡々と打ち続けるだけである。

最後に

 AIが人間より優れている特技は、以下の三つにまとめることができます。
①局面の勝率判断
 …説明略…
②候補手の提示
 …説明略…
③結果が整理される
 …説明略…

アルファ碁は、人間よりはるかに高速に様々な局面ののそ後の変化を計算して数値化して、順番をつけて人間に提示することができる。
対局となれば、人間の強敵になるわけで、その強敵が、どのように判断したのかを説明できるようになると人間の教師役になれるわけだが、まだそこまではできていない。
アルファ碁がだしてきた候補を人間が見て、それがどうして良いのかを説明を加えるまでだ。

人間には、美意識というものがある。

時には、最善の手はそっちだと思うが、その手が美しく思えないからと別の手を選んでしまうことがある。
様々な手を考えて検討しているうちに、最初に考えていたことをうっかり忘れてしまって、その手が最善だったとしても選ばれずに別の手を選んでしまう。といったミスも起こす。

人間が、常に同じ品質で対応し続けるということは難しい。
コンピュータは、計算可能な範囲では常に最善の選択をする。
お腹も空かないし、対局中にまったく関係ないことが思い浮かぶこともない。

決まった、ルールの中でやるのであれば、結局人間はコンピュータに勝てなくなるだろう。
だから、これからの人間は、感性を磨かなければいけない。






ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 16

なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー) なるほど(納得、参考になった、ヘー)

この記事へのコメント

この記事へのトラックバック