clock2013.12.23 13:08
SERVICE
home

クロス集計で「セグメント間の違い」を見出せ|ギックスのビッグデータ分析体系 ⑤

AUTHOR :  花谷 慎太郎

セグメントの特徴把握

前回はギックスならではの分析プロセス「2次属性の作成」について説明しました。今回はその付けられた2次属性を利用して、2次属性がついた人や製品の特徴を知るというプロセス、「セグメントの特徴把握」について紹介します。ギックスのビックデータ分析体系では以下の赤枠の部分に相当します。

分析プロセス⑤-1

グループ間の違いを把握するためのクロス集計

まず前回ご説明した通り、仮説を検証したり起こった事象の原因を究明するために、顧客データやトランザクションデータに対して、同じ特徴を持つと思われるグループに同じシールが貼られている状況、すなわち2次属性が付けられている状況から話をスタートさせましょう。

同じグループにシールを貼ったあとに知りたいことは、各グループが他のグループとどう違うのかということです。そのグループ間の違いを把握するのに有効な手法がクロス集計ということになります。

具体的な例を挙げていきます。例えば、すごくべたな例ですが、顧客層の2次属性として「①購買頻度はそれほど多くないけど、購買単価が大きい有望顧客」、「②購買単価は低いけど、リピートでの購買頻度が多い有望顧客」「③一回だけ購買をしただけの一見の顧客」という3つの特徴的な顧客がいると想定してみましょう。この場合トランザクションデータを使ってユーザーデータには①、②、③というシールが貼られている状況になります。

それぞれの顧客層の違いを知るためにクロス集計をしていくことになります。

まず表側(行)には、この顧客層①~③を固定でおきます。そして、その表頭(列)に他のシールでくくられている情報を置きます。例えば、表頭に性別を置くと、男女の比率が①、②、③でどのように違うかがわかりますし、年代などを置くと、どの年齢層が①、②、③に多く含まれるかを把握することができます。

このように表頭に置くグループを性別、年代、地域、購買金額、購買時間、キャンペーンの反応、購買期間などとどんどん変えていくだけで各顧客層の違いが浮き彫りになり、どの顧客層を今後増やしていくかという示唆が出てくることになります。

上記の例は非常にシンプルな事例ですが、2次属性を付けてどんどんクロス集計していくところまでをすると、仮説が正しかったかの検証ができることになります。

クロス集計を試行錯誤しながら実施するために

このクロス集計ですが、エクセルでいうとピポットテーブルに相当します。100万件以下のデータですと、エクセルでピポットをいくつも作っていくということで上記の作業を実施できます。しかし、100万件を超えるデータになりますとエクセルでは対応できなくなります。100万件を超えるデータを扱う際には、ギックスではTableauというソフトウェアを使っています。このソフトウェアは、ビックデータでも簡単に扱えますし、表側・表頭に入れる項目が非常に簡単に変更することができるので、試行錯誤しやすい作りになっています。まさに企画部の方が、何度も自分のアイデアを試行錯誤しならが検証するのに適したソフトウェアです。

このTableauについては後日、ギックスで利用しているツールの回でもう少し細かく触れるようにします。

 

  1. PC上で数千万件データを手軽に扱える時代がやってきた
  2. CRISP-DMをマーケティング領域へ適用させる
  3. ビジネスへのインパクトを「常に」念頭に置こう
  4. 2次属性を理解しよう
  5. クロス集計で「セグメント間の違い」を見出せ(今回)
  6. もう一歩踏み込みたい方は「モデリング」を学ぼう
  7. 大規模投資の前のトライ&エラーが重要
  8. Quick Startのための分析ツールとは
  9. Quick Startのための分析インフラとは

 

SERVICE