藤野の散文-私の暗黙知-

毎日の中での気付きについて書いています

インフルエンザもグーグルで。

ネットの普及は、今生きている大正、昭和元年生まれの世代からの価値観やライフスタイルを揺さぶっている。
つまり逆に、「今経験値を有している古い世代」ほど、ネットに触れる恩恵を感じやすいということでもある。
ビッグデータ」と呼ばれる、途方もない単位のデータが飛び交う時代になる。

キロ、メガ、ギガ、テラ、ペタ。
ここまでくらいがせいぜいだと思った。
エクサ、ゼタ。

こうした単位の「データマネジメントの世界」は果たして自分達の生活を変えてゆくのだろうか。
記事によると、GOOGLEでの検索の結果が、実際の「インフルエンザの感染の状態」を知りえる手段になるだろう、という例が轢かれている。

実際に、これからの「大容量時代」にどのような共生をしてゆくのか、コンピューター社会は新たな転換期に来ている。
本当の「メタデータ」「ビックデータ」の意味は、ようやく普及したこれからのネット社会でこそ実務面で発揮されるのではないだろうか。

big data 急膨張するデジタル宇宙
ITの世界でこの数年、にわかに注目が集まってきているバズワード(はやり言葉)はbig data (ビッグデータ)でしょう。この用語はIT専門メディアだけでなく、一般の新聞や雑誌も取り上げるようになっています。

 ビッグデータとは、情報通信技術の革新、特にインターネットの発達に伴って爆発的に増加しているデジタル情報の全体を指しています。

 具体的には、次々と生まれるウェブサイト、電子化が加速する書籍や文書類、交流サイトやメールでやりとりされる様々な情報、さらに人工衛星や監視カメラの画像、ネットショッピングの情報、金融取引のデータなど、ネット上を駆けめぐり、様々な記憶装置に蓄積されたデータです。

 こうしたデジタル情報は日ごとに増えています。アメリカのIT専門調査会社IDCは、このようなデータの全体を digital universe (デジタル宇宙)と呼んでいます。この世界は現実の宇宙と同様に天文学的な大きさに膨れあがりつつあります。

 IDCの推定によると、昨年1年間に生成または複製されたデータ量は1・8ゼタバイト(ZB)に達します。

 ゼタバイトというのは聞き慣れない単位ですが、以下のリストを見れば、そのとてつもない大きさが想像できると思います(カッコ内の例はそれぞれのバイト数に近いデータ量を持つものを示しています)。

 キロバイト(KB) 10の3乗=1000バイト(400字詰め原稿用紙)
 メガバイト(MB) 10の6乗=100万バイト(フロッピーディスク
 ギガバイト(GB) 10の9乗=10億バイト(CD)
 テラバイト(TB) 10の12乗=1兆バイト(高性能ノートパソコンのハードディスク)
 ペタバイト(PB) 10の15乗=1000兆バイト
 エクサバイト(EB)10の18乗=100京(けい)バイト(グーグルの月間データ処理量)
 ゼタバイト(ZB) 10の21乗=10垓(がい)バイト(世界全体のデータ量)

 (ちなみに日本語の場合、2バイトが1文字に相当します)

 このリストでも示した通り、現在の高性能ノートパソコンの記憶装置(ハードディスク)は容量が1テラバイト程度です。1ゼタバイトはその10億倍(10の9乗倍)に当たりますから、1.8ゼタバイトは高性能ノートパソコン18億台のハードディスクを満杯にするデータ量となります。

 毎年これほど膨大なデータが生成・複製されているわけですが、さらに注目すべき点は、その増加のペースです。言い換えれば「デジタル宇宙」の膨張速度のすごさです。

 IDCによると、1.8ゼタバイトは5年前の9倍の量。そしてデータ量は今後も2年ごとに2倍というペースで増え続ける見込みといいます。2年で2倍ということは4年で4倍、6年で8倍、8年で16倍になることを意味します。まさに指数関数的なペースで増えていくことになります。

 こうしたビッグデータの時代は、私たちの社会や文化、経済や政治にとってどんな意味を持つのでしょうか。世界の関心は今、そこに集まっています。

 欧米の研究調査機関は次々と報告書を出しています。企業は新たなビジネスチャンスを見いだそうとしています。学問の世界では膨大なデータを扱う専門分野が生まれつつあります。国際機関や各国の政府も様々な活用方法を模索しています。

 メディアもビッグデータ活用の可能性に注目しています。

 今年2月に米紙ニューヨーク・タイムズに The Age of Big Data (ビッグデータの時代)という見出しの記事が載りました。その中で以下のようなケースが取り上げられていました。

 The predictive power of Big Data is being explored -- and shows promise --
in fields like public health, economic development and economic forecasting.
  ビッグデータを使って将来を予測する可能性を探る研究が公衆衛生や経済発展、経済予測などの分野で進められている。その将来性を示すケースも出てきた。

 Researchers have found a spike in Google search requests for terms like
"flu symptoms" and "flu treatments" a couple of weeks before there is an
increase in flu patients coming to hospital emergency rooms in a region.

  研究者の調査によると、「インフルエンザの症状」や「インフルエンザの治療」という言葉をグーグルで検索する人が急増した2〜3週後に、地域の病院に駆け込むインフルエンザ患者が増えていたことがわかった。

 この例が示しているのは、グーグルの検索履歴というデータをうまく使えば、感染症拡大の兆しをいち早く察知し、先手を打って対応できるかもしれないという可能性です。ビッグデータ活用法の有力な候補の一つになるかもしれません。

 一方、ビッグデータの時代は様々な新しい問題を招く恐れもあります。例えば、デジタル化され、IT企業のコンピューターに蓄えられた膨大な個人情報は、かつてない規模のプライバシー侵害につながりかねないという危惧の声もあります。
 ビッグデータの功罪をめぐる議論はこれから本格化しそうです。