人対コンピュータ、と言えば何と言ってもチェスでIBMのディープブルーvsガブリ・ガスパロフだった。
というのももう二十年近く前の、自分が社会人になりたての新鮮な話題だったように思う。
それがまだ続いていたのね。
その名もIBMの創業者(とシャーロク・ホームズの友人)の名前を冠した「ワトソン」が人間のクイズ王2人に圧勝したという記事。そして
んなもん、クイズの問題の記憶力で勝負なんて、人間が負けて当たり前。と思っていた。が事実は少し違ったようである。
ミスター・ユビキタス。
坂村教授の解説で目が覚めた。
新聞の報道はニュースとしては有り難いが、「その奥」にある本当の部分を考えないと、非常に皮相的な部分だけで「知ったか」になって「思考の浅いヤツ」になってしまう。
ひやひや。
ワトソンとクイズの正体。
面白いことに、ワトソンはネットには接続していないという。
ワトソンは人間の使う自然言語による質問応答システム。(中略)
ウィキペディアなど100万冊以上、計2億ページの文書を貯め込んで参照している。
ワトソンは2880台のコンピュータの束(コア)であり、メモリーは16テラバイト!!
なんと80テラフロップスだという。
さらにさらに。
来年稼働予定のスパコン"セコイア"は20ペタflopsだと。
実に「今の一万倍以上!」。
いったいどこまで行くのか、ということはまあ置いといて。
ワトソンはこの超並列コンピュータを使い、自然言語の処理を同時に100以上走らせて、「あいまい推測」をしているのだという。
ワトソンは、なぜかクイズ番組にターゲットを絞り「25人のエンジニアが4年間」かけて準備をしたそうである。
一問一答での勝利ではなかった!
さて本題。
「平安遷都の時の天皇の名は?」などという形式の一対一の知識勝負、では人間はまったくかなわないだろうことは想像に難くない。
だがワトソンが勝ったのはもっと厳しい条件である。
それは「トリビアを引き出す疑問文」を回答する問題なのだという。
つまり
「江戸幕府が開かれた年に亡くなった。」「有名なカクテルの名前の由来になっている前任者から嫌われ投獄されたこともある。」という問題に対しては、この2つのトリビアから「エリザベス1世はどんな人?」という質問を思いつき答えれば正解となる。
すごい。
というかこれが出来るのは、人間でもそんなに多くないのではないか。
一対一、のクイズの世界に比べて、遥かに「類推する力」が必要になるのは、実際に問題に挑んでみれば想像に難くない。
それにしても、一番の感心は坂村教授のこの解説であった。
これがなければ、今のコンピュータの進化の度合いは「20年前の延長かな」くらいに誤解したままであったろうと思う。
またそれが「一般紙の報道」から自分が読み取る力であったと思う。
情報が「単なる知識として蓄積」していることは、あまり「一定以上の意味はない」ということを自身で思い知った出来事だった。
"あらたにす"の「新聞案内人」に感謝。
IBMのワトソン君――「スパコン、クイズ王に勝利」の意義(1/4)
先週、IBMのスーパーコンピューター「ワトソン」が米国のクイズ番組(注1)で人間のチャンピオンに勝ったと大きく報じられた。知識を問うクイズで人間が電子の速度の機械にかなうわけはないという人もいれば、人間が負けたことにがっかりする人もいるようだ。これにはいったいどのような意義があるのか、どう受けとめたらよいのか考えてみよう。
○米国メディアは大騒ぎ
このニュースはわが国でも各紙とも結構大きく扱っている。2月17日の夕刊で日経は「コンピューター、『クイズ対決』で人間に圧勝」、朝日は「スパコン、クイズ王に圧勝 米国の人気番組」、読売は「スパコン、クイズ王破る IBM製『ワトソン』、知識100万冊分」。朝日はプレス向けの模擬試合を取材して2月11日の科学面で取り上げており、これは「スパコン、クイズ王に挑む」で読める。
日本での報道に対して米国のメディアは大騒ぎだった。新聞やテレビのニュースは連日大きく扱い、いくつかの雑誌はこのイベントに合わせて人間対コンピューターの特集を組み、テレビではワトソンの開発を描いた番組が放映された。このあたりは2月21日の読売「人工知能 人間超える? 意識を移植 肉体滅んでも『不死』」に詳しい。また開発を追っていたジャーナリストの手による本も発売された。
○ワトソンを巡るQ&A
一般的にはワトソンは「Q&A(質問と答)システム」と呼ばれるものの一種だ。そこで記事を読むだけでは、多くの人が疑問に思いそうな点を「Q&A」形式で解説していこう。
Q) これは人工知能なのか?
A) 1997年にチェスのチャンピオンに勝ったIBMの「ディープブルー」も、当時は人工知能と呼ばれた。しかし、今や普通のコンピューターで走るチェスプログラムでもディープブルーより強いのに特に人工知能とは呼ばれない。Q&Aシステムも今は「人工知能」と呼ばれているが、誰でもが普通に使えるようになったら人工知能と呼ばれなくなるだろう。
ところで、機械が知能を持っているかどうかをテストするには、20世紀の数学者アラン・チューリングが提案した「チューリング・テスト」がよく知られている。相手が人間か機械か分からない状態で、例えば文字のやりとりのみで対話して人間と区別がつかなければ、機械は知性を持つと判断するテストである。今までに完全に合格した機械はない。
ワトソンもクイズ形式の一般的な知識を問う問題に答えられるだけだ。「ところで、クイズで全問正解出せたら賞金で何をしたい?」など聞かれると、うまく答えられないだろう。もちろんプログラマがそういう想定質問への回答を仕込んでおけば答えられだろうが、人間同士で聞かれる可能性のある全ての質問への回答をあらかじめ仕込むわけにはいかない。司会者に「いい声ですね」とか言われるかもしれない。いろいろ話していれば必ずボロが出る。その意味では真の人工知能とは言いがたい。
しかし、あいまいで文脈次第で意味が変わる質問――例えばクイズ番組でよく出るような「江戸幕府が開かれた年に亡くなった英国国王は?」を理解し答える事が出来るならば、「開かれた年に亡くなった」の意味を理解し、知識と知識の連携を取り回答する必要があるので、その意味では高度な知能処理を行っていると言える。
(注1) ワトソンが参加したクイズ番組のJeopardy!は米国で古くは1964年から放映されており、日本で1970年代に放送された「クイズグランプリ」の原型とされている。
回答者各自が手持ちのお金から回答への自信に応じて掛金を決められるので、三日間を戦うという長丁場で、どう賭けるかの戦略も見所らしい。ちなみにワトソンは中盤戦で掛率の高い最終問題で、上に述べたシカゴをトロントと答える失敗をしたが、自信がなくて掛金を減らしていたので被害を最小限にできたとのこと。
Q) グーグルで検索するのとどう違うのか?
A) グーグルのような検索エンジンは入力した文字列が含まれるサイトを表示するだけ。ワトソンは人間の使う自然言語による質問応答システム。質問は人間がパネルを見るのと違ってテキストで受け取るが、応答は自然な音声で答える。ワトソンはインターネットには接続されておらず、ウィキペディアなど100万冊以上、計2億ページの文書を貯め込んで参照している。
例えば、グーグルで上にあげた例の「江戸幕府が開かれたときのイギリス国王は」をそのまま検索しても答えは出てこない。「江戸幕府が開かれたとき」を検索すれば「江戸に幕府が開かれた1603年3月24日」という文字列がヒットする(最近のグーグルはこの程度の言葉のあいまいさには対応できる)。で、「1603年没」と検索するとウィキペディアのページがヒットして、そのページに「エリザベス1世(イングランド女王)」があるので、人間なら答えは「エリザベス1世」と分かる。しかし、そのようにキーワードを考え検索を繰り返し「イングランド女王」は「英国国王」と同じ意味だからこれが答えだろうという推論は、人間には容易でもコンピューターには簡単なものではなく、十分人工知能の分野だ。
Q) ワトソンは「スーパーコンピューター」なのか?
A) 「質問応答システム向けに凄く速く応えられるコンピューター」がワトソン。ワトソンのソフトはスパコンでなくても走るが、開発の初期段階で一台のコンピューターで走らせたら応答に2時間かかったという。本番で使ったのは、同社のPower 750サーバーを90個クラスター接続したシステムでラック10本。Power 750サーバーには32コア分のPower7プロセッサが載っているので、計2880コアとなる。つまり2880台のコンピューターの束。メモリーは総計16Tバイトでパソコンの数千倍。性能は公称80TFLOPS。これで1〜6秒の速度で応答できるようになった。ちなみに2012年に稼働予定の同社の(数値演算専用の)スーパーコンピューター Sequoiaは20 PETAFLOPSを目指し計160万コア。それと比べると大したことはないが今ならスーパーコンピューターの1つだろう。ハードウエアが進歩すれば十分日常的に使われる可能性もあるくらいのスケールではある。
Q) ワトソンは今までのシステムと比べて何が優れているのか?
A) ワトソンの質問応答システムが使っている技法に特に新しいものはないという。ただ、自然言語の解析のためにスパコン並みのハードで同時に100以上の技法を走らせて、100以上の解答の候補を生成し、その中で最も可能性の高い候補を答えるDeepQAというやり方が新しいという。問題はこういう可能性の総当りのようなやり方は爆発的に処理時間が必要になるので、「ワトソン」では2880コアの超並列コンピューターでこの処理を同時並列実行して時間短縮をしているわけだ。
Q) ワトソンの弱みは?
A) 問題が少しあいまいになるとすぐ間違えること。自然言語は、常にあいまいさを含むが人間はそれを常識で判断している。2日目の最後の問題でシカゴと答えるべきところを(カナダの)トロントと間違えた。その理由を「問題のカテゴリーは「米国の都市」だったが、カテゴリーはしばしばあいまいであるため、重要度を低く見積もった。また米国にもトロントという名の都市があり、トロントが本拠地の米国の野球チームがある」などが理由とされた。正解のシカゴは2番目の候補だったという。
Q) 人間と対戦する経緯は?
A) IBMとしては、今年で会社誕生100周年を迎えることもあり、1997年にチェスの世界チャンピオンに勝ったチェス専用スーパーコンピューター「ディープブルー」に続く、新たなグランド・チャレンジを求めていた。なぜかクイズショーJeopardy!がターゲットに選ばれ、ワトソンは勝つためだけに25人のチームにより4年をかけて開発された。準備は非常に手間がかかる作業。研究所には、Jeopardy!の模擬セットを組み、数多くのリハーサルを繰り返した。勝てる見込みに達してから、番組の制作会社に話を持ち込み、今回人間チャンピオンとの本番で勝利をおさめることができた。
研究開発はIBM単独でなく、カーネギーメロン大、マサチューセッツ大など複数の大学との共同研究の成果。広い意味でIBMのマーケティングだが、れっきとした学術的な研究活動でもある。クイズ番組側も話題作りとして番組は3夜平均9.1%とふだんより高い視聴率をとったようで広報効果はおおきかったようだ。1月20日の日経産業新聞によると、IBMはこれから顧客企業の膨大なデータを解析する情報解析を事業の柱にしていくというので、そのお披露目としては格好のイベントだったのではないか。
○「凝った構成の出題」で勝利した重み
なおJeopardy!の問題はトリビアを複数紹介する形で出題され、そのトリビアを引き出す疑問文の形を答えるという凝った構成だ。「江戸幕府が開かれた年に亡くなった。」「有名なカクテルの名前の由来になっている前任者から嫌われ投獄されたこともある。」という問題に対しては、この2つのトリビアから「エリザベス1世はどんな人?」という質問を思いつき答えれば正解となる。各紙の記事では、その凝った構成が分かりにくいからか、ワトソンが応えられたQ&Aの例を紹介する時、書きなおして普通のクイズの形式にしているものが多いようであった。しかし、単純な質問から答えを出すのに対し複数の答えからその元の質問を類推する場合の処理の大変さは幾何級数的に増大する。その辺りがちゃんと読者に伝わっていなかったためか、ネットの中では記事を話題にしても「単純に知識を問うクイズで、コンピューターが勝つのは当たり前」という反応が多く見られたのは残念だ。
ワトソンの応答を見ていると一見、人間の知能に限りなく近づいているように見えるが、人間に匹敵する知能はまだ夢のまた夢だ。とはいっても、現在のような性能でも役に立つところは十分にある。IBMが例に挙げるように世界中の最新の医学論文を読み込んで病状から最も良い治療法を直ちに応えてくれる――文字通り「ドクター・ワトソン」(注2)があれば、大いに役立つだろう。
(注2) IBMの「ワトソン」の名前の由来は、IBM創業者の「トーマス・J・ワトソン・シニア」なので、医者の「ワトソン君」とは実は別人。
スパコンがクイズ王に圧勝、賞金100万ドル
【ワシントン=山田哲朗】米IBMが開発したスーパーコンピューター「ワトソン」が16日、米CBSテレビの人気クイズ番組「ジョパディ」で、人間のクイズ王2人に圧勝、100万ドルの賞金をさらった。
IBMは全額を慈善事業に寄付する。
ワトソンは14日から3夜連続で登場、同番組の賞金獲得王ブラッド・ラター氏、連勝記録保持者ケン・ジェニングス氏と対戦した。初日はラター氏と引き分けたが、2日目以降は正解を連発、大きく引き離した。
ワトソンは冷蔵庫大のコンピューター10台で構成され、毎秒80兆回の計算をこなす。辞書や百科事典、歌詞、聖書など本100万冊分の情報をデータベースに蓄え、解答者席には、コンピューターの活動を表すモニターだけが置かれた。
(2011年2月17日 読売新聞)