読売新聞(2013/8/1)コンビニ新時代について
ビッグデータの記事がまた新聞に掲載された。
さて、「ポイントカード」ってなんなのだろう。
「コンビニ大手はポイントカードを使って、年間150億人の購買履歴のビッグデータをもとに、品揃えなどに反映させている。
…
ファミマがTSUTAYAと提携する「Tポイントカード」の会員数は今年2月末時点で4408万人。カード履歴を分析して、XXXX(人名)のように、1ヶ月利用していない会員100万人を抜き出し、TSUTAYAのレジで割引券を渡した。このうち1割が実際にファミマで買い物をして割引券を使った。街中で不特定多数の人に割引券を配っても、利用率は2−3%にすぎない。ファミマを利用したことがある潜在顧客を洗い出した方が「効果はかなり高くなる」(ファミリーマーケットマネージャーXXXX氏)。
「夕方5時以降にカット野菜の陳列を増やし、揚げ物の惣菜も多めに並べると、一緒に購入する顧客が増える」
業界2位のローソンは「ポンタカード(2月末時点で会員数5200万人)」で徒歩5分以下の商圏に住む会員の購買履歴を分析して得た仮説をもとに、カット野菜を増やしたら住宅街の店で売上が増えた。…
業界首位のセブンイレブンは電子マネー「ナナコ(2月末時点で会員数2145万人)」を導入しているが、XXXXX社長は「来店客が小銭を出さなくても買い物がえきる便利さが狙い」と説明する。
…
ポイントカードや電子マネーを活用して、移ろいやすい消費者の好みをどう捕まえるか。各社の苦闘が続く。」・・・・ 読売新聞:2013年8月1日 朝刊(9ページ:経済「コンビニ新時代」)より抜粋
この記事は、ポイントカードというものが「なぜあるのか」という答えの1つに明確な回答を与えている。
常連のお客様にポイントで割引を差し上げる、という考え方も当然あるのだろうが、上の掲載されている各社では、「購買履歴という情報を得て売上アップにつなげるため」と、明確に経営判断されている。
POS(Point Of Sales)は比較的歴史のあるシステム(概念)で、もともと、販売と物流(場合によっては、メーカー)をつなぐ仕組み(連続供給:continuous replenishment:という言葉があった)として登場したと記憶している。
そして、POSで得た情報を「売れ筋」や「季節変動」、「時間変動」などの分析にも使いましょう、となったのも、最近のことではない。
経営分析を行うシステムは、総称してBI(BusinessIntelligence)と言われるが、筆者が最初にBIを利用したのは15年以上前。その後も、経営にITをつなぐシステムとして、毎年のように、「経営者が期待するソフトウェアランキング」の上位にいる。
では、「なぜ、今、この記事がのるのか?」なのだが、POSとBIをつなぐ部分にあった「莫大な計算というボトルネックが解消できる見込みができてきたから」、「すばやく計算できることで、アドホックな分析を繰り返し行うことができるようになってきたから」が、その答えであって、記事中にある「ビッグデータ」がそのキーワードである。
たとえば、「4408万人から、今月利用していない顧客を100万人を洗い出す(たとえば、住所付きで)」というタスクは、(このブログで継続的に掲載している) Hadoop MapReduceの最も得意とする「抽出」処理であって、PCを横につなげさいすれば、並列処理で来店回数を積算して、利用していない顧客を洗い出すことは簡単である。
当然、「利用していない人を抽出するだけでは能がない」。協調フィルタリング(リコメンデーション)も分散処理できるわけだから、「利用していないお客様に対して、具体的な商品を絞り込んでクーポンをだす」こともできる。
これらは、すべて「ビッグデータというキーワードに包含されるIT」である。
また、「揚げ物とカット野菜」の例は面白い。
なぜなら、内容が、当ブログで紹介してきた「大規模な相関(分析)」の結果得られた洞察と推測されるからである。
上記の記事は、5時近辺のアイテム別売上を分析したところ、カット野菜と揚げ物の販売数に「正の相関があることがわかった」ということを意味している。
当ログで10,000アイテム(変量=商品)について、10,000サンプル(1時間あたりの売上数を1サンプルとすると、24時間営業で416日分のデータ)の相関係数を求めたが、1時間以内に計算を終えることができた。
とすれば、1か月分のサンプルであれば、多く見積もっても20−30分で相関係数を計算して、相関の高い商材とピックアップし、ピックアップしたアイテムの売上が何時をピークにしているかわかるはずだ。地域カテゴリーを変量に加えておけば、地域とアイテムの間の相関もわかる。
その結果として、ある地域では「揚げ物とカット野菜が一緒に売れている」という結論を得ても全く不思議はない。
上の計算だと、翌日からの生産量や、陳列方式が変更できるかかもれない(仕入れなどために、一気に変更できる範囲は限られているはずであるが)。
先日のログで取り上げた、JR東日本のSuicaデータと付き合わせれば、最寄り駅の降車時刻のピークや、降車する人の年代や性別との関連が見えてくるかもしれない。(統計学的な計算では、これも相関分析の範疇にはいる)
ポイントカードを使えば、割引に加えて、よりよいサービスが受けられる。個人情報のハザードが破られない限りは、そういう理屈になる。
もし、コンビニのオーナーであれば、アルバイトさんが「ポイントカード持ってますか?」と聞かないのは大問題だ。必ず、聞くようにしなくてはならない。
また、POS付き(もしくは、データが蓄積できる)のレジスターの見方も変わるだろう。普通のレジスターの何倍もする価格なので、一般の商店には殆ど導入されていない。高いか安いかは考え方次第ということになる。