2015年3月16日月曜日

2015.03.14 ビクター・マイヤー=ショーンベルガー ケネス・クキエ 『ビッグデータの正体』

書名 ビッグデータの正体
著者 ビクター・マイヤー=ショーンベルガー
    ケネス・クキエ
訳者 斎藤栄一郎
発行所 講談社
発行年月日 2013.05.20
価格(税別) 1,800円

● ビッグデータの世界の特徴は次の3つだという。 
   すべてのデータを扱う
   精度は重要ではない
   因果から相関へ

● まず,すべてのデータを扱うということ。
 分子レベルにまで小さくなれば,物理特性が変わるというのが,ナノテクノロジーの基本だ。この特性がわかれば,かつて不可能だったことを可能にする素材も開発できる。(中略)同様に,扱うデータの規模が大きくなれば,少量のデータでは不可能だったことが可能になる。(p24)
 従来は,数が膨大になる場合は,そこから抜き出した標本に頼るほかなかった。19世紀以来の常識だ。標本抽出は情報化社会の産物であり,アナログ時代の情報を扱ううえでの当然の制約だった。 ところが高性能なデジタル技術が普及したおかげで,実はそれが人為的な制約だったことが判明する。(p26)
 これまでの経験や制度設計は「情報が限られている」という前提に立っている。(中略) できるだけ少ないデータで済むように,手の込んだ手法を編み出しもした。極端に言えば,統計の目的は最小限のデータで最大の知見を得ることでもある。(p36)
● データの精度にこだわらないということ。
 ビッグデータの世界では,もはや厳格な制度は現実的ではないし,好ましいことでもない。絶えず変化するデータが大量にある場合,何をおいても完璧な正確さをめざす必要はなくなるのだ。(p27)
 「唯一の真実」という考え方自体,怪しさがある。唯一の真実などあるはずがないという見方もあるし,それを追い求めること自体,混乱の元だ。現実世界のデータを利用する以上,乱雑さは前提条件であって,排除しようと躍起になるようなものではない。(p73)
● 因果の桎梏から自由になること。
 世の中,因果関係で説明できないことは山ほどあるが,悲しいかな,人間というものは,原因がわからないとすっきりしない。しかし因果関係に執着しないのが,ビッグデータの世界だ。重要なのは「理由」ではなく「結論」である。(p28)
 原因を特定する作業は,本当に唯一の理想なのか。それは,いわば現代の一神論のようなもので,これを根底からひっくり返すのがビッグデータだ。我々は今,再び歴史的な閉塞状態のまっただ中で,“神”の死をつきつけられている。これまで信じてきた確かなる存在が,またもや崩れようとしているのだ。(p33)
 仮説を立てては試行錯誤の繰り返しで人類の知は進化を遂げてきた。煩わしいことこのうえないプロセスだが,スモールデータの世界ではこれで通用していたのだ。 ビッグデータの時代になれば,「もしや」というひらめきから出発し,特定の変数同士をピックアップして検証するといった手順はもはや不可能だ。データ集合があまりに大きすぎるし,検討対象となる分野も恐らくずっと複雑になる。(p89)
 ビッグデータを相関分析にかければ,データが答を語り出すのである。見込み違いが起こりやすい仮説主導型と違い,ビッグデータによる相関分析は,データ主導型だ。(p90)
 日常生活では因果関係で物事を捉えることが多いため,因果関係は簡単に見つかると考えがちだが,現実はそんなに甘くない。数学的に浮かび上がる単純明快な相関関係と違い,因果関係は「証拠」を数学的にはっきり示す方法がない。(p104)
● ビッグデータ界の具体例。
 データ化は,多くのソーシャルメディア系企業の根幹とも言える。こうしたSNSは,単に友人・知人を探して連絡を取る方法を提供しているわけではない。日常生活の漠然とした要素をうまく取り込み,データに変えて新たな展開に生かしている。 例えばフェイスブックは人間関係をデータ化する。(p141)
 2012年時点で,フェイスブックには約10億人のユーザーがいる。それが1000億以上と言われる交友関係でつながっている。その結果,フェイスブックのソーシャルグラフは,世界の人口全体の10%以上に達している。それだけお数の交友関係がデータ化された状態で,たった1社の手中にあるのである。(p142)
 身の回りのあらゆる製品にチップやセンサー,通信モジュールを埋め込むことで,「モノをつなぐインターネット」が広がっている。これはモノのネットワーク化であるとともに,データ化でもあるのだ。(p148)
● では,ビッグデータが席巻する未来はバラ色か。手放しで礼讃するわけにもいかない。ひとつは個人情報の問題。もうひとつは,人間の自由意思に絡む問題。
 しかし,この話題に入ると,著者の舌鋒に変化が見られる。ベクトルの向きが変わるので,舌鋒が変化するのは当然なのだが,この問題については,著者も自身の考えを詰めているわけでもないように感じられた。
 ビッグデータの前では匿名化が簡単にやぶられかねない(中略) 取り込むデータ自体が増えているうえに,データ同士の結合も増えているからだ。(p233)
 データ分析の迷走と言えば,ベトナム戦争当時,分析の失敗で戦況の泥沼化を招き,米国国防長官の座を追われたロバート・マクナマラの名を挙げないわけにはいかない。(p244) 頭脳明晰ではあったが,賢人ではなかった。(p252)
 人間は意外に“データの独裁”に支配されやすい。明らかに何か変だなと疑うべき状況でも,よく考えずに分析結果を鵜呑みにしてしまう。(p248)
 2009年,グーグルのトップデザイナーだったダグラス・ボウマンは,こうした何でも数値化する会社の体質に嫌気がさして辞表を叩きつける。「最近も線幅は3ピクセルがいいのか,4ピクセルかで議論したばかりだよ。意見があるなら,それが正しいことを証明しろと必ず迫られる。そういう環境ではやっていけない」(p250)
 優れた才能がいつもデータに頼るとは限らない。ジョブズは,現場からの報告を基に,長年,ノート型のマックを改良し続けた。しかし,iPod,iPhone,iPadの開発では,データではなく,自らの直感を駆使した。(中略)「何が欲しいのかを消費者に言わせるようではダメだ」という名言も残している。(p251)
 人間の素晴らしいところをアルゴリズムやコンピュータチップに聞いても無駄だ。絶対に答えられない。なぜならそれはデータとして取り込めないものだからだ。それは「そこにあるもの」ではなく,「そこにないもの」なのだ。空白だったり,歩道の亀裂だったり,暗黙だったり,まだ考えてもいないことだったりする。(p289)
● 他にも,2つほど転載しておく。
 自然界を数字で把握したいという情熱が19世紀の科学のあり方を決めたと言ってもいい。(p127)
 従来,世の中は自然現象や社会現象といった出来事の連続と説明されてきたが,ビッグデータ的に見れば,情報があふれる空間そのものなのだ。(p149)

0 件のコメント:

コメントを投稿