藤野の散文-私の暗黙知-

毎日の中での気付きについて書いています

これからが本番。


AIとか機械学習というと何か「得体の知れない新技術」という気配がする。
だからこういう話には、できるだけその中身に近づいてみる方がいい。

案外、既存の技術の積み重ねで「新しい用語」が語られていることがわかる。
特に進化が著しい「画像処理」などについて、一体コンピュータが何をしているのかを確かめてみるのがいいのではないだろうか。
機械学習とかディープラーニングが実際に何をしているのか」が分かれば過剰な期待も恐れもなくなるだろう。

むしろ興味は「これからの可能性」に置きたい。
"世の中じゅうから集まるデータ"をもとに、これから自分たちは何ができるのか。
何がしたいのか。
そんな自由なことが、技術に縛られずに考えられる時代に突入したようだ。

時間や距離やお金の制約に縛られずに「こんなことができたら」を想像できる社会が到来しつつあると思う。

5分で理解できるAIとマシンラーニングの基本的知識
このところAI(人工知能)が人間の仕事を奪うといった危機感をあおる話から、企業のAI活用まで、毎日のようにAIに関するニュースを耳にする。しかし、AIの意味を正しく理解していない人は多い。背景には、(マシンラーニング)などの用語が誤って使われているケースが多いことも挙げられる。そこで、AIや機械学習の初歩的知識について簡単に説明をしたい。

AIと機械学習の違い
AIと機械学習の違いは、経済学と会計学の違いに少し似ている。経済学は学問の分野であり、ノーベル経済学賞の受賞者に会計業務を依頼したりはしないだろう。それと同様に、AIとはコンピュータや人間の意思決定方法を研究するサイエンスなのだ。一方で、機械学習はデータから学習するソフトウェアを開発するテクノロジーを意味する。

両者の違いは、お金が絡むとより重要になる。ベンチャーキャピタリストの多くは、今や「AI」という言葉を誇大広告として捉え、AIを謳う企業への投資に慎重になっている。彼らは、自然言語処理を使ってメールをフィルタリングするプラットフォームや、顔認識技術によって店舗の来店客をトラッキングするといった、明確なユースケースのある機械学習ソフトへの投資に注力している。

これに対し、フェイスブックやなどの大手テック企業や大学は、より広義のAIを研究するラボを設立している。こうしたラボから生まれたグーグルの機械学習向けのソフトウェアライブラリ「TensorFlow」や、フェイスブックの「Pytorch」は無料で利用することが可能だ。

「ラーニング」という言葉が多用される理由
今日、最もエキサイティングなAIの活用方法は、コンピュータに学習能力を持たせ、プログラミングではなく、学んだデータからタスクを実行させることだ。これに使われる様々な技術の名称に「ラーニング」という言葉が用いられている。

機械学習には、大きく分けて「教師なし学習」「教師あり学習」「強化学習」という3つの手法があり、ベイジアン機械学習やシンボリック機会学習など、統計的手法に基づく機械学習と合わせて利用することができる。

しかし、これらの全てについて詳しく知る必要はない。なぜならば、最も多く使われる機械学習の種類は「ニューラルネットワーク」だからだ。ニューラルネットワークとは人間の脳を模倣したコンピュータシステムで、この70年間で流行り廃りを繰り返している。

ディープラーニングとは、ニューラルネットワークのレイヤー(層)を何重にも深くした学習方法の1つで、スマホ音声認識やグーグルの自動翻訳機能などに利用されている。個々のレイヤーは、抽象的な情報を認識する。

例えば、ディープニューラルネットワークを使って顔認識を行う場合、レイヤーによって顔や鼻、口の輪郭、影を認識する。このように、個々のレイヤーは抽象的なデータを認識し、全てが合わさることで顔全体を認識することができる。

ニューラルネットワークは画面上でどのように見える?
基本的にはコードの寄せ集めのように見える。グーグルAIの子会社である「ディープマインドDeepMind)」のエンジニアらは、ほぼ全てのコードをパイソン(Python)で書いている。パイソンは1991年に開発されたプログラミング言語で、ユーチューブやインスタグラム、グーグルなどのサービスの大半で使われている。

AIにおける最高の手法が、ディープラーニングニューラルネットワークなのか、という質問に対する答えは「NO」だ。ニューラルネットワークディープラーニングの組み合わせは現在最も有望な手法だと考えられているが、5年後には全く新しいテクノロジーが開発されているかもしれない。