『米長邦雄永世棋聖 vs ボンクラーズ プロ棋士対コンピュータ 将棋電王戦』を見てきた

 昨日行われた『米長邦雄永世棋聖 vs ボンクラーズ プロ棋士対コンピュータ 将棋電王戦』をニコニコ本社で見てきました。バッチリニコニコ動画に俺の姿が映ってしまっていました(笑)
 結果としては残念ながら米長永世棋聖の負け。米長さんは大好きなのでぜひ勝ってほしかった…ただ、終局後の米長さんの記者会見がかっこよすぎ。やっぱこの人にはカリスマがありますね。局中での映像も様になっていてかっこいい。
 大学時代に強化学習とか少しやっていたこともあり、こういうAIについて思うところがあったのと、米長さんの研究の深さに驚いたので、思ったところを徒然と書きたい。

  • 本譜ハイライト
    • <序盤>
       しょっぱなから面白い展開となる。ボンクラーズの初手7六歩に対する米長永世棋聖の2手目はなんと☖6二玉。負けてしまった前哨戦と同じ手を放った。6二玉は通常見られない手なので、会場が騒然となる。この手について、後の記者会見や渡辺竜王の解説によると、これはボンクラーズの癖を読んで、3筋に飛車を呼び込むための誘いだったようだ。実際は一旦4筋に飛車を振られるが、最終的には3筋に飛車が来ることになる。
       13手目☗6五歩に対する、14手☖同歩に対して、当然☗同飛だと思ったらまさかの☗5八金。これには驚いた。ここで☖6四銀と進める誘惑にかられるが、米長永世棋聖は冷静に☖6三銀右と進める。ココらへんがまだコンピュータなのかなと思ったり。もしここで☖6四銀と進めたらどうなっていたのだろうか。最も、最終的には6四に銀を進めるのだが。。。
       40手目米長永世棋聖が守りを固めるために放った☖6五歩に対して、☗6六歩と咎められるかとおもいきや、☗9五歩。
       ここまでの序盤戦は間違いなく米長永世棋聖が優利。対ボンクラーズの研究は完璧だった。序盤は完全に癖をよみ支配していた
    • <中盤>
       中盤というか、序盤の終わりというか、攻めあぐねるボンクラーズは「一人千日手」と揶揄されるような、飛車の左右往復を繰り返し、ひたすら手渡しを繰り返す。それに対して米長永世棋聖はコマをドンドン盛り上げていった。
       しかし結果としては、ボンクラーズは最善形を崩さないように待っていただけで、対して米長永世棋聖は常に1手進めようとしていた。焦らされて我慢ができなかったと見ることもできた。結果として米長永世棋聖が状況を崩すために3二金を53金まで進めようとしてしまった、さらに7二玉を8三玉に進めて飛車道を止めてしまった。
    • <終盤>
       終盤はボンクラーズが圧巻だった。飛車の左右7筋のT字運動を繰り返すボンクラーズが放った☗6六歩。同歩に対して角が出てきて、米長永世棋聖の☖6五歩に対して角は8筋から5筋へ。この角筋の変更に対して米長永世棋聖は(怒りの)☖3四歩を放つ。この一手により各交換を要求されてしまった。しかしそれを拒否するために無理な守りを強いられることになり、決定打となたように思う。
       米長永世棋聖自身は上記は悪手ではないと、悪かったのは76歩に対する対応だと言っていた。確かにあれが山場だったが、それ以前に他にやれたことがあるような…これ以降、ボンクラーズの怒涛の攻めが出て、109手目あたりからついにノータイムでボンクラーズが打ち始めた。つまりは詰みが見えたということだ。
  • 米長永世棋聖の戦型について
     序盤に構築した陣形は非常に守りに強い形だったが、飛車角が完全に死んでいた。特に角。事実上の角落ちで戦ったに等しく、ボンクラーズの無理攻め待ち or 入玉にかけるという若干ギャンブルだった。
     ☖8三玉について。個人的には☖7三桂からの☖8一飛ではなかったか。個人的には守備側の桂は動かしたくないのだが…あるいは☖7三桂からすぐに飛車を3筋または4筋に振ったほうが良かった気がする。また角を3一角→5三角(→44角)に進められなかったか、あるいは☖4四歩の場面で☖4四金ではどうだったか。
     米長永世棋聖感想戦で最初に述べていた8四歩はぜひ見てみたかった。徹底した防衛作戦は果たしてどれほど有効なのか。リスクを犯して攻めないのは勝つ道だったのだろうか。
  • 記者会見
     記者会見でみた米長永世棋聖は本当にかっこよかった。涙が出そうなほどに。そして米長永世棋聖語録がまた増えた。
    • 本譜の感想を聞かれ
      「(2手目)☖6二玉を奇手と書いた記者がいたが、あれは奇手ではない。」「「6ニ玉」ということに、私の研究では結論が出ました。プレ対局のときに「私が奇を衒った」というようなことを書いた(新聞)社もありますが、どうかそれはやめてほしい。それは6ニ玉という手がかわいそうなのですね。
      これは相当研究したのがわかる発言だった。このあと約300時間研究したこと、いろんな棋士を呼んで(渡辺竜王、田中9段等)検討を重ねたこと、結果として本1冊書ける程に研究を重ねたことが明かされた。米長永世棋聖の執念、そして将棋愛がわかる発言だと思う。
    • (6二玉を奇手と書いた)読売新聞からの「6二玉が最善てである根拠は?」に対して
      あなたのものの考え方ではわからないと思います。」と一刀両断。さらに本1冊書けるといった後に「(主催の)中央公論新社から出ます」と皮肉まで(笑)
      読売(と朝日)の記者の態度がすこぶる悪かったので、米長永世棋聖のバッサバッサ切る発言は気持ちよかった。
    • ボンクラーズと打っていて人間のように感じたかと聞かれ
      大山康晴と打った」「今日は2人の大山康晴が指した」と発言。これはボンクラーズに対する最大の賛辞だろう。
    • 今後のコンピュータ戦について
      「最善手を探すのにコンピュータも人間も関係ない」「神事の探求だ」と発言。
    • コンピュータが人間を超えた後にプロ将棋はどうなるかという質問に対して
      「自動車が生まれて、人間よりも早く走れるようになった。でも人はのろのろと走る駅伝を見て、汗を見て感動する。プロ将棋もそうありたい。尊敬される存在でありたい」と熱弁。これは確かにそうあってほしい、人間の有機的な面白さを見続けたい。その後に「竜王戦読売新聞社名人戦朝日新聞社毎日新聞社のご支援よろしく」と社交辞令も忘れなかった(笑)
  • 米長永世棋聖ボンクラーズ研究について
     さすがというか米長永世棋聖の対ボンクラーズ研究は圧巻だった。ボンクラーズの癖を完璧に見抜き、自分の想定通りの序盤戦を組めたのは賞賛に値すると思います。
     米長永世棋聖の解説を聞いていていつも思うことは、この人は本当に相手の思考をトレースするのがうまい。「自分の最善手では」「客観的に見て」という視点はなく、常に「相手ならば必ずこう打つ」という思考で手を組み立てる。その本領が発揮されたのではないかと思う。
     ただ、あまりにボンクラーズを認め過ぎたがゆえに終盤戦でリスクを取る手を打てなかったことが敗因か。
     さらにいうと、米長永世棋聖は「泥沼流」と称されるように終盤戦で混戦模様にして倒すのが得意とされ、序盤はむしろ苦手と言われていた。ただ、コンピュータは収束に向かう終盤戦に強く、混乱することが無いため、そもそも米長永世棋聖は対コンピュータに向いていなかったようにも思う。久保二冠のような全体の捌きがうまい人や、佐藤九段のような序盤戦に強い人の方が向いている気がする。
  • ボンクラーズの打ち方を見て
     一つ弱点があるとすると、1戦を120手と想定し、持ち時間を単純に割って打つこと。その局面は考えるべき大事な場面か、ノータイムで打つ手かを考えることができない。状況判断をうまくできていないのが気になった。探索木をそれぞれ評価し、それぞれの評価値が発散しすぎているとき等は時間をかけるというアルゴリズムは取り入れられないのだろうか。
     終盤戦の打ち筋は流石だと思った。収束に向かう場面での正確性はすでにプロを超えている可能性があるように思う。
     また、序盤戦はやはり課題がある。一つ非常にポイントだと思ったのは米長永世棋聖が記者会見で述べた「自宅の1分170万手と本戦の1800万手で強さに違いがなかった」という指摘だ。これはどういうことかというと、推測にしかならないが、ボンクラーズは探索木をできるだけ深く評価するが、それをあまりに公平に見て(ざっくり言うと平均値を取って)一手を決めているように思う。人間であればある程度、ありえない手を省いた思考の中の探索木だけで評価しているはずなので、そこに差がある。つまり毎秒何万手を考えると言ってもただただ全ての手を考えるのは、終盤で詰みを見つけるのがどれだけ早くなるかしか意味のない段階になってきたといえるのではないだろうか。むしろ探索木がただただ発散するような局面ではボンクラーズは新たなアルゴリズムが必要になるのではないか。
     中盤でのあの飛車の行き来は、ある意味コンピューターがバグったように見えたが、あれが結局良かったんだろう。自分の最善手は崩さず、相手が悪形になるのをひたすら待つ。人間にはやりづらいけど、コンピューターならできる手と言える。
  • 将棋のソフトウェアについて
     上記のボンクラーズについてのことだけでなく、今後思うこととしては、棋譜だ。今は多くが将棋倶楽部24棋譜を取り込んで評価関数を作っているようだ。ただ、これだと初心者のダメな棋譜もありすぎたり、プロの指し筋が見えない弱点がある。やはりここはプロの棋譜を食べさせなければダメなんじゃないだろうか。更に言うと、流行形にも対応すべく、評価関数的に新しい棋譜に対して荷重させる必要もあると思う。
     更に言うと、本当に既存の棋譜を食べさせなければならないのだろうかという点も気になる。真逆の事を言うが、いっそランダムに打たせまくって、一からソフトウェアに評価関数を作らせると一体どんな囲いや戦略が生まれてくるのかとても気になる。矢倉や美濃囲いを打つようになったのは面白いけど、おもしろくない。
  • 今後のプロ対コンピュータについて
     プロが優利な点としては、「常に実験を実戦で試せること」だ。プロ対プロだと、棋譜を見て正確を見て戦型を予想するのが限界だが、対コンピュータだとただただ起動して試してみることができる。だからかなり正確に序盤戦を組み立てることができる点だ。
     もしコンピュータが相手の癖を見抜くことができるようになると(攻略したい相手と自分の棋譜を食べさせて、評価関数を弄る)、プロが研究用に使う日がくるのも近いのではないか。そうなれば羽生が棋譜管理にコンピュータを取り入れて以来の革命が起きるのではないだろうか。