ビッグデータはかなり一般的な用語になっているけれど、すぐには使わないけれど捨てないデータ、のことをダークデータと言うらしい。
まあ「日陰にある」というニュアンスだけど、活用できる因果関係のあるデータに比べて、このダークデータの方がはるかに膨大なわけで、ITが進化すればするほど情報の収集量は増え続け、さらにこうしたダークデータの量も膨れ上がる。
ハードディスクが「一ギガ千円を切る」と言われたころから「データを選別する」というよりは「もう全てを記録してしまえ」と言うふうにデータに対する我われの態度が変わってしまった。
昔風に言うと「リソースの垂れ流し」というか無駄遣いなわけだが、記憶媒体やコンピュータが限りなく廉価になったおかげの「総記録社会の到来」なわけで、これはこれで新しい世の中の形かもしれないと思う。
町中の夥しい数のテレビカメラや電子チケット、電子マネーなどの記録、さらに電話やネットの通信記録など、気がつけばもう"足あと"を残さぬように生活することなどできなくなっている。
「もう隠すものなど何もない」と開き直ってしまうのが一番だけれど、まあちょっと秘密にしたいプライバシーなどどんどんなくなりそうで、それはそれで少し抵抗感がある気がする。
さて、くだんのダークデータだけれど、自分の日常もふと気付けばダークデータに囲まれている。
後でチェックしようとキャッシュしたネットのデータ。
雑誌のスクラップ記事。
読もうと買って在庫されている本。
見ようと思って溜めている映像、dvd。
いろんな情報系のメールなどなど。
およそ数年先まで、を考えても恐らく手をつけないだろうこれらは、自分にとってのダークデータである。
ビックデータの収集分析をコンピュータに任せても、ダークデータの処分は人間が意図的にせねばならないのが新しい情報社会のルールになるのではないだろうか。
まずは身の回りから実行したいと思ったのである。
世界先読みバズワード
dark data 「ダークデータ」とは何か情報通信(IT)の世界では big data (ビッグデータ)がバズワード(はやり言葉)になっています。
少々紛らわしいのですが、この big data に関連して注目が高まっている新語があります。dark data (ダークデータ)という言葉です。
直訳すれば「暗いデータ」ですが、どんな意味なのでしょうか。ビッグデータとは何が違うのでしょうか。
まずビッグデータとは、皆さんもご存じの通り、インターネットやセンサーを通じて日々生み出される膨大な電子データのことを指します。
ネット通販の購入履歴やSNS(交流サイト)上の書き込みなどはその一例です。街中に置かれるようになった防犯カメラの画像情報も代表的なビッグデータと言えるでしょう。
こうした情報をうまく使えば、新しいビジネスチャンスが生まれるかもしれない。多くの企業はそう考えて、ビッグデータの活用法を模索しています。
政府の規制改革会議も今月初め、安倍首相への答申にビッグデータの活用を盛り込みました。
一方、ダークデータに決まった定義はないのですが、ビッグデータのうち、当面は使い道がない、一見無駄なデータのことを指す場合が多いようです。
ネット上では、以下のように様々な説明が試みられています。
例えば、アメリカの調査会社ガートナーのサイトは次のように指摘しています。
Dark date is the cute name given to all that data an organization gathers that is not part of their day to day operations.
ダークデータとは、ある組織が集めてはみたけれど、日々の業務には使っていないデータに付けた、ちょっと気取った名称である。
ドイツのソフトウエア開発大手SAPのサイトでは、こう説明しています。
It's that neglected data that accumulates in log files and archives that nobody knows what to do with.
ダークデータとは、コンピューターの利用履歴ファイルやデータ記憶装置などに蓄積されてきたものの、どう扱っていいか誰も分からず、放置されたままのデータである。
Although it never sees the light of day, no one feels comfortable destroying it because it might prove useful someday.
こうしたデータは今のところ日の目を見ずにいるけれど、いつか役に立つかもしれないから、誰も破棄する気にはなれないでいる。
要するに、今は活用できないため、目には見えてこないデータ、つまり「暗がりの中に蓄えられたデータ」ということで、「ダークデータ」と呼ばれているのです。
この言葉は最近、ネット上のあちこちで目にするようになってきました。ビッグデータに続き、IT分野の新しいバズワードになっていくのかもしれません。