NTTドコモがビッグデータを売り出したインパクト:解説

読売新聞の朝刊(2013年9月13日)の経済面に「ドコモのビッグデータ どう使う?」という記事が出た。以下は抜粋。

国内最大の携帯電話会社、NTTドコモは、携帯電話利用者の位置情報などがわかるビッグデータ(人口情報)を10月から販売する。新たな経済活動な災害時の情報提供などの様々な分野での活用が期待される。
Q どうやって人の位置情報を集めるのか?
A 携帯電話の基地局は、通信状況を確認するために、エリア内にどの携帯電話があるかを常に把握している。
例えば、あるエリアにドコモの契約者が15人いたとすると、携帯電話事情におけるドコモの占有率は半数弱なので、エリア内におおよそ30人いたと推測できる。
... (略)
「○日午前8時台、東京駅周辺に50歳代男性が○人いた。そのうち○人は都外の居住者」という情報が得られる。ドコモは顧客企業の要望に合わせて必要な情報を販売する。
Q どういう利用方法が考えられるのか。
A ある地域の時間帯ごとの年代別、性別ごとの人の動きを変化が分かれば、飲食店はそれにあわせて、仕入れる材料の量や種類を調達できる。小売店の出店計画も立てやすくなる(※1)。
地方自治体は、防災計画の策定やまちづくりに生かせる。ドコモは仙台市と共同で、災害時の帰宅困難者の推計調査を行った(※2)。
... (略)
ドコモは契約者が電話で申請すれば、その人のデータの利用を停止する(※3)。

... 読売新聞 2013年9月13日(金曜日)朝刊8面より抜粋。※は筆者による。


以前、「JR東日本がSuica情報を売り出したことと、Hadoop MapReduceの実力(2013/7/18)」というログで簡単なシミュレーションを使って、JR東日本Suica情報を売り出したことの意味について説明した。

それから、ほぼ2ヶ月で「本命」のビッグデータの販売が開始される。

ドコモのこの商材については「1冊でわかるビックデータ・・・ビジネス革命の新潮流(2012/7:日経BP)」に記載がされている。この本には、技術的な内容も書かれているが、読み物としても面白いし、Mook本なので読みやすい。出版されてから、1年で状況がどんどん変わってしまっているが、それはこの業界の常。読んでみられてはいかがかと思う。

1冊でわかるビッグデータ (日経BPムック)

1冊でわかるビッグデータ (日経BPムック)

さて、上の本で知ったのだが、この商材は「モーバイル空間統計(ドコモのホームページに説明があります)」という東京大学との2010年からのプロジェクトが発端になっているようだ。
携帯アプリの開発者の目から見ると、携帯の位置情報を知るには、(しばらく前のようにGPSが搭載されていない端末が多かった頃には)「今、どこの基地局を使っているか」という情報を利用していた。GPSが搭載される携帯電話が普及しても、(やはり、搭載していない携帯はあるので)、GPS基地局情報の2段構えで、携帯の場所を特定させるアプリを作っていた。こういったアプリは、最近作っていないが、顧客ニーズによっては、GPSのみでいい、という時代になっているかもしれない。ただ、GPS情報は、(機密的に)数メートルから数十メートルの誤差が出るような仕組みになっているので、カーナビなどはセンサーでそれを補正している(最近のスマホには、加速度センサーが着いているので、Googleのナビなどは当然、スマホ(アンドロイド)の加速度センサーで位置を補正しているはずである。

話が脇道にそれてしまったが、携帯電話で場所を特定する方法として、「全ての携帯をカバーする」という意味で「一番近く(=携帯と通信する)基地局」を使うのは、ある意味で常識的手段である。

そして、上記のインフラを使って、※2の「災害時の帰宅困難者の予測(と施策)」を行ったのは、工学院大学との共同プロジェクトと(上記の本には)記載されている。

さて、上記の本によると、(その時点の)携帯電話の台数は6000万台、これらが、1時間ごとに一番近い基地局と通信しているとのこと。
ドコモのホームページから基地局の数を調べてみると、2011年時点で9万5000カ所。(通話品質競争が激しいので、増えていることはあっても、減っていることはないと思われる)。
ちなみに、気象庁のホームページをみると、全国の地震観測点は4200カ所だから、計測点としてはその20倍以上もある。
上記の本によれば、モーバイル空間統計では、500メートルから1キロメートル四方のメッシュ内での人口分布(人数、性別、年齢層)が把握できる、という。

以下は、上の記事をイメージしやすく図にしたもの。グラフの高さが人口を表すが、実際のデータに基づいていません(あくまでイメージ)。
上は、昼間の人口分布、下が夜間の人口分布。きっと、こんな具合になるのでしょうね。


これに、性別という属性をつけたら以下のようなイメージになる。ここでも、上は、昼間の人口分布、下が夜間の人口分布。

ここで、想像力を働かせて、上のグラフのメッシュは1キロ程度四方であること、1時間おきの観測結果が時系列で取得できること、性別以外にも、年齢や居住地といった情報が取得できること、をイメージすると、※1で言っていることの意味(以前のログで解説したのとおなじ帰結)がハッキリと「スゴい!!」と理解できると思う。
JR東日本Suicaデータが東日本に限られているのに対して、NTTドコモは全国版のデータになっている。しかも、電車が主たる交通手段ではない地域(こういった地域の方が圧倒的に多い)もカバーできる。
郊外型のホームセンターなどの小売り大手がこれの情報を買わないはずがない、と納得してしまう。応用範囲を考えると、夢が広がっていく。先ほど「本命のビッグデータ」と書いたのはそういう意味である。


このログでは、ビジネスへのインパクトを考えてきたが、当然、個人情報保護面でのセーフガードは必要で、それについては、NTTドコモのホームページ(先のリンク先など)に匿名化や方法が記載されている。
上に紹介した本で「モーバイル空間統計」を知った際に一番驚いたのが、「携帯が自動的に基地局と通信しているのを知らなかった」こと。これはいいのだろうかな、と思った。
総務省のホームページを調べてみると、「法令上は、第三世代携帯電話に対して、発信場所または基地局の位置情報を通知することが義務化されており」と書いてありましたから、携帯と基地局の通信は、法制化されているのですね。GPSの搭載の義務はありませんが、将来的にはあり得ますよね(2007年近辺で盛り上がってたように、Webでは見えます)


いずれにしても、ここでも問題視すべきなのは、今後、このようにどんどん強化されていく情報武装によって、大手と中小の間で「すでにあるギャップが加速的に大きくなる」だろうこと。
情報にも「公共性」という概念があるはずだし、「帰宅困難者や、首都直下型地震の被害規模の予測」といった問題は「公共的」な課題。こういうことは議論すべきだし、広く告知されるべきと思う。