藤野の散文-私の暗黙知-

毎日の中での気付きについて書いています

すぐそこにある。

3日で自己対局が490万回。
限定的なエリアとはいえ、集中的に計算する。

これに対し、(アルファ碁)ゼロはいきなり自己対局を始める。
最初のころはめちゃくちゃな手を打ち合っていたが、よい手を模索しながら急激に上達。
石を囲い込む領土などの概念を獲得したほか、基本的な打ち方のパターンとされる定石の多くに自力でたどりついた。
自己対局が490万回に達した3日後には、アルファ碁を圧倒するほどの腕前になった。

人間の自分たちは、いろんな自然科学の「例外」とか「未知」に対応してきたつもり(だと思っていた)だが。

ひょっとしたら。
「圧倒的な量の経験」に晒されたら、そんな「人間ならでは」の部分は大してないのかもしれない。

思いもかけないこととか、例外的な行動をする。
自然界のイレギュラーに大してめげない。

そんなこともコンピューターが「ロジックと確率」に組み込んでしまえば、人の思考はそれほど変化に富んでいるだろうか。

自分たちは日常、飛躍したことを考えたりするが、それとて「今ある情報の組み合わせ」の範囲ではある。

「人間ならでは」と思っていたことが「だいたいは推測できる範囲」になった時点で人間の"らしさ"はかなり見分けにくいものになるのではないだろうか。

人間性」という言葉で処理されていた非論理性とか、理不尽なことも「ある場合のロジック」になってしまえばそれまで。
実際の人間が突然に思いつくようすとは何も違いはないだろう。

生命というのはまだ遠いけれど「知能」については早晩作り出せるものになるのではないだろうか。

AI 教材ゼロで超人に 競争して進化 研究に転機
 人工知能(AI)研究で新たな潮流が起きている。人間が集めた教材を学ぶのではなく、AIが競い合うことで「独学」で進化する技術の登場だ。囲碁AI「アルファ碁ゼロ」は自己対局を繰り返すことで最強になった。2種類のAIがだまし合いながら上達する手法も登場し、研究が活発になっている。まだ限られた分野だが、何も知らない赤ん坊が短期間で超人に成長するAIが実現し始めた。

画像の拡大

 「人間の知識なしで囲碁を極める」。米グーグルの持ち株会社アルファベット傘下の英ディープマインドは10月、英科学誌ネイチャーにこんな論文を投稿した。新たに開発したアルファ碁ゼロは世界トップ棋士、韓国の李世●(石の下に乙)(イ・セドル)九段に勝ったアルファ碁と100局戦い無敗。世界最強といわれる中国の柯潔(かけつ)九段を圧倒した「アルファ碁マスター」にも大きく勝ち越した。

 研究者たちを驚かせたのは基本ルールを授けただけで独学で上達し、アルファ碁の先輩たちをしのいだことだ。東京大学田中哲朗准教授は「最小限の知識だけで人間を超えた」と意義を説明する。

 従来のアルファ碁は大量のデータから特徴を自ら見つける「深層学習(ディープラーニング)」を土台としていた。高段者の棋譜を画像として読み込み、プロの状況判断や打ち方などを学んだ。その後、AI同士の対局を繰り返すことで腕を上げていった。

 これに対し、ゼロはいきなり自己対局を始める。最初のころはめちゃくちゃな手を打ち合っていたが、よい手を模索しながら急激に上達。石を囲い込む領土などの概念を獲得したほか、基本的な打ち方のパターンとされる定石の多くに自力でたどりついた。自己対局が490万回に達した3日後には、アルファ碁を圧倒するほどの腕前になった。

 従来のアルファ碁はプロ棋士の手とよく似ているほど強くなった。一方、ゼロは手がプロの手とあまり一致していなくても強く、人間が思いつかなかった定石も発見した。プロ棋士を参考にしなくても、AIが試行錯誤しながら強くなれることを証明した。

 だが、やみくもに対局を重ねているわけではない。まっさらな状態から学ばせる様々な工夫がある。例えば「直感的に有効そうな手を選ぶ」「現時点の局面の勝率を評価する」やり方。より確かな解を導き出すためで、多くの対局を重ねると、どんな手だと勝てるのか傾向が見えてくる。2万5000回の自己対局を終えるごとに振り返り、勝率評価法や打ち方を改良した。

 従来は次の一手を探す機能と形勢を判断する機能のそれぞれについて人の脳をまねたニューラルネットワーク(神経回路網)で学ばせた。ゼロは2つのニューラルネットを統合することでより的確で安定した学習が可能になったという。

 深層学習によって、AIは大量のデータの中から専門家のノウハウを自力で獲得し、さらにプロが気づかない特徴を見つけ出すまでになった。ゼロの登場で、学習に欠かせないデータが足りない分野でもAIを活用できる可能性が広がった。ディープマインドはさらに改良して将棋やチェスにも応用したAI「アルファゼロ」を開発。将棋、チェス、囲碁のいずれでも世界最強のソフトを超えた。電気通信大学伊藤毅助教は「新薬開発などの人ができなかった分野でAIが使えるようになるのではないか」と指摘する。

 AI同士が競い合って進化させる研究は他にもある。最も注目を集めるのは、グーグルの研究者イアン・グッドフェロー氏が2014年に提唱した「敵対的生成ネットワーク」だ。アルファ碁ゼロとは違い、2つのAIにはそれぞれ役目がある。片方は画像を作る贋作(がんさく)者で、もう一方は本物かどうか見分ける鑑定士の役目だ。

 例えば猫の場合、贋作者役のAIが作った画像を鑑定士役が判定する。その結果から、贋作者役はどうすれば猫に近づくのかを学ぶ。鑑定士役は多くの画像をみることで判断する材料が集まり、見分ける能力が向上する。こうした作業を繰り返し、本物の猫に似た画像を作るようになる。

 この技術を応用し、AIのミスを指摘して修正するAIの研究も米国で進んでいる。新しい洋服のデザインを作ることなどに応用できる。将来は自動運転のためのシミュレーションなどに使える可能性がある。

 昔のAIは人間の助けが必要だった。それが大量のデータがあれば自ら学ぶようになり、今は人の手もデータも不可欠ではなくなった。AIはどこまで進化するのか、予測は難しい。
(大越優樹)