clock2015.01.02 09:02
SERVICE
home

第4回 分析結果と考えられる「打ち手」|POSデータでマーケットバスケット分析の実践 with R

AUTHOR :   ギックス

1.9k
ギックス
POS_market_basket_analysis_Title

POSデータでマーケットバスケット分析をした結果を公開していきます

本連載では、4回にわたり、ある書店の実際のPOSデータをもとに、マーケットバスケット分析の事例をRで実装しながら紹介します。マーケットバスケット分析について紹介した本やWebサイトは多くありますが、実データによる分析事例は、POSデータの性格上、あまり紹介がなされておらず、本連載はその貴重な事例となりますので、是非最後までお読みいただければ幸いです。

第4回目の今回は、パラメータのチューニングと分析結果について、説明してまいります。

パラメータのチューニング

本稿では、前述したPOSデータをデータとして用い、アイテムには32の「大分類」を用いて、その「組み合わせ」を分析しました。もちろん、店舗の規模や業種によっては、直接商品を単位として分析することもありますが、書籍の場合、このデータでも商品数は6,247と、ロングテールの部分が非常に大きいことから、大分類による分析を行うこととしました。
Rでは、apiriori関数の引数として、support(支持度)、confidence(確信度)、組み合わせの最大アイテム数を指定することができます。商品Aを買った人に商品Bをレコメンドすることを考えると、リフト値が1を超えていなければレコメンドの意味がないのは当然のことですが、support(支持度)と、confidence(確信度)の「しきい値」の設定については、実際のPOSデータを分析する場合には、どのような「打ち手」を行うかという問題意識と、経験則による部分が大きいです。したがって、組み合わせルール(association rules)の個数の「適正値」のようなものは特にありませんが、可視化のプロセスを考えると、300個くらいが良いと言われています(尾崎隆(2014)『ビジネスに活かすデータマイニング』技術評論社)。
本稿では、ロングテールの部分が大きい書店という業種と、小規模店舗であることを考慮して、support(支持度)は0.0001以上、confidence(確信度)は0.01以上、組み合わせの最大アイテム数は5を引数として指定しました。その結果、189件の「相関ルール」(うちリフト値が1を超えるのは69件)を抽出しました。

分析結果

抽出した「相関ルール」のうち、リフト値の上位20件は、下表の通りです。

表 マーケットバスケット分析結果

apriori6

リフト値が最も高かったのは、「書籍←雑誌」「雑誌→書籍」の組み合わせですが、ここでいう「書籍」というのは、「その他」的な分類をされているものなので、一旦除外して考えます。そうすると、実質的に最もLift値が高いのは、「新書→ビジネス」「ビジネス→新書」の組み合わせになります。また、「人文社会→新書」も、高いリフト値を示しています。なお、理論的な部分で前述したように、リフト値ベースでみると、矢印が逆のもの組み合わせは同じ数値になっています。
一般的な書店と同様、この書店でも、新書は独立した棚に配置されていますが、分析結果を踏まえると、一般書とテーマが関連する新書は、新書の棚ではなく、関連する書籍のところに配置し、併売を促すという「打ち手」が一つ考えられます。
また、リフト値が高いパターンに、「{○○○}→{児童書}」というものが多くみられます。具体的には、「ムック、文具」「コミック、趣味実用」「月刊誌、文具」「ムック、趣味実用」、「月刊誌、趣味実用」といったものです。このような「組み合わせ」は、中高年の方が、自分の本や雑誌を買う時に、子どもや孫の本を「一緒に」買うというパターンが主に考えられます。「打ち手」としては、こういった、「子買い」、「孫買い」は、多種類の併売のチャンスになるので、なるべく多くの商品を買ってもらえる動線になるよう、児童書の配置を工夫するということが考えられます。

これらはあくまで一例にすぎません。分析結果からデータドリブンで考えていくことによって、インストアマーチャンダイジングのためのさまざまな「気づき」を得ていくことが可能になります。

まとめに代えて

一般的なPOS分析では、レシート数もアイテム数も非常に大きいため、まともに分析しようとすると、CPUやメモリがいくらあっても足りず、非常に高度な分析環境を構築しないといけないという話になりがちです。しかし、本連載でご紹介したような様々なTipsを利用しつつ、まずはできる部分から、Quick&Smallで分析を始めていただきたいと思います。

第1回 マーケットバスケット分析とは?
第2回 マーケットバスケット分析の評価指標
第3回 マーケットバスケット分析のRでの実装
第4回 分析結果と考えられる「打ち手」(今回)

【当記事は、ギックス統計アドバイザーの中西規之が執筆しました。】

nakanishi

中西 規之(なかにし のりゆき)

ギックス統計アドバイザー。公益財団法人日本都市センター研究室主任研究員、フェリス女学院大学国際交流学部非常勤講師(社会統計学)などを歴任。東京工業大学大学院社会理工学研究科社会工学専攻修士課程修了。最近の関心は、市民、民間、行政の3者が「Win-Win-Win」になるような、公共サービスにおけるビッグデータ・オープンデータの活用のあり方について。

 

SERVICE

SERVICE

BANNER

graffe

grip

GiXo BLOG

recruit

Aibou

amazon web service partner network

TAG BOX