藤野の散文-私の暗黙知-

毎日の中での気付きについて書いています

ただのデジタル屋ではなく。

*[ウェブ進化論]文化的なIT企業へ
FacebookがAIを使って"ミーム"を研究しているという。
ミームとは「文化を形成する遺伝子のようなもの」らしい。
つまり人の価値観を構成している個々の行動とか、習慣とかいうもののようだ。(wikiより)
 
当面は不正コンテンツのあぶり出しが目的だという。
膨大なデータの集まる巨人らしい話だが、それはともかく。
 
月のユーザー23億人のFacebookや傘下のInstagramやWhatsAppやMessengerで集まる発言や画像をつぶさに観察し、蓄積していけば「ある種のミーム」が分かってくるに違いない。
昔の日本で(新日本書紀とか太平記とか源氏物語とか)その時代のわずかな書物から、その時代のことを類推するような作業が、これからは無限に正確にできるだろう。それがデジタルだ。
多分システムは無くならないから、これから千年も経った後には「人の文化的整体」とか「生物学的な変化」などははっきりと分かるようになるのではないだろうか。
 
自分がそのころに生きていないのは残念だが、デジタルデータの集積が、将来は「人の分析」に役に立つのならば、技術というのは実に素晴らしい。
Facebookは色々と批判もされているが、文化に貢献していく企業を標榜するべきではないだろうか。

Facebookの「ロゼッタ」システムは、ミームの認識を容易にする

9/12(水) 10:44配信
 
 
ミームはウェブの言語であり、Facebookはそれをもっと理解したいと思っている。
 
FacebookのAIチームはここ数年、コンピュータービジョンと自然言語認識の両分野で目覚ましい進歩を遂げてきた。今日(米国時間9/11)同チームは、ふたつの分野の進歩を融合する最新の成果を発表した。新しいシステムはコードネームを "Rosetta" といい、FacebookInstagramで画像内テキストを認識して、被写体がなんであるかを理解し分類を容易にすることによって検索や不正コンテンツの識別に役立てる。
 
ミームばかりではない。ツールは10億以上の画像とビデオフレームを、毎日複数言語にわたってリアルタイムで解析する、と同社はブログに書いている。
 
Rosetta光学文字認識OCR)の最新技術を活用している。まず画像をスキャンしてテキストの存在を検出し、文字がバウンディングボックスの中に置かれる。つぎに畳み込みニューラルネットワークを用いた分析によって、文字を認識し何を伝えようとしているのかを判定する。
 
 
このテクノロジーはしばらく前から使われていたが――FacebookOCRに2015年から取り組んでいる――同社の巨大なネットワーク全体に展開することは、狂気レベルのスケールを必要とするため、文字検出と認識に関して新しい戦略を考える動機が生まれた。
 
技術面に興味のある人には、チームの書いた論文がある。
 
Facebookには、ビデオや写真に写ったテキストに興味を持つ理由が山ほどある。同社のコンテンツモデレーション[コンテンツの監視]の必要性に関しては特にそうだ。
 
の識別は、写真の説明テキストが"Bruh!!! 🤣🤣🤣" や "1 like = 1 prayer" (いいね! 1回=祈り1回)のようなものなら比較的単純だが、Facebookの "time well spent"[有意義な時間]推進のためのアルゴリズム変更によって、タイムラインには似たような技巧を用いたビデオや写真が増えている。同じことはヘイトスピーチにも言える。あらゆるメッセージが1つの写真やビデオに埋め込まれていたらシェアは容易だ。字幕機能が便利なツールになる。
 
同社によると、現在このシステムは複数言語対応という新しい課題をもたらしている。現在は言語を統一したモデルによって動いていて、訓練データの大部分はラテン文字を使っている。同社の研究論文によると、現在既存データベースの最目的化によって新言語をサポートするための戦略を検討しているという。
 
Facebookは人間監視役の負荷を減らし、ニュースフィードアルゴリズムが分類結果に応じてコンテンツを選べるようしたいと考えている。こうしたツールは、Facebookが有害コンテンツを識別し、より興味深いコンテンツをユーザーに見せるうえで大きな可能性を持っている。
 
(翻訳:Nob Takahashi / facebook