CONCEPT
データ活用診断
データ基盤構築
採用情報

平均値同士の「相対性」を把握する:"リフト値"を活用する(3)

AUTHOR :   ギックス

1.6k
ギックス
平均値同士の「相対性」を把握する:"リフト値"を活用する(3)

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

平均値の「差」も、リフト値を使って把握しよう

記事「“リフト値”をバスケット分析以外で活用する(2):POSデータ分析のクロス集計での活用」では、”リフト値”という考え方をPOSデータのクロス集計の中で活用することについて書きました。
そして、この記事の最後で「”リフト値”は個々の値を全体と比較するための指標である」と考えられるということを書きました。
今回は、この「”リフト値”は個々の値を全体と比較するための指標である」という考え方をデータ分析においてさらに応用することを考えてみます。

平均値の”リフト値”

以前、「リフト値とは|データ分析用語を解説」において、

「リフト値」は、「ある条件xのときにある事象yの割合」を「全体で事象yの割合」で割ったものである。

と書いたとおり、この考え方に沿って、ここまでは「割合」についての「個々」と「全体」との比較に”リフト値”が有用であるとしてきました。
しかしながら、「個々」と「全体」とを比較が必要な値は、「割合」だけに限られません。「個々」と「全体」とを比較するケースが多い値として、「平均値」が挙げられます。
例えば、あるスーパーマーケットのチェーンで、各店舗の「買い物1回当たりの平均決済額」が他の店舗と比較して多いのか少ないのかを知りたい場合、各店舗の平均決済額を全店舗の値と比較したくなります。ここでは、「各店舗の平均決済額」を「全店舗の平均決済額」で割った値が、各店舗の平均決済額が多いか少ないかを判断する指標になるでしょう。
Lift3-1
この「個々の値」を「全体の値」で割るというのは、これまで見てきた「割合」の”リフト値”の考え方と同じであり、「個々の平均値」を「全体の平均値」を割ったものは「平均値の”リフト値”」であると考えることができます。
(平均値の”リフト値”)=(個々の平均値)/(全体の平均値)
先の「買い物1回当たりの平均決済額」の例で、平均値の”リフト値”を求めると次のようになります。
Lift3-2
この”リフト値”が大きいほど、1回当たりの決済額が多い店舗(≒まとめ買いが多い店舗)であるといえます。
このように、”リフト値”という考え方は割合だけでなく平均値にも応用することができます。

「個々」と「全体」とを比較できる値なら”リフト値”の考え方を応用できる

今回は「平均値」の”リフト値”について書いてきましたが、”リフト値”の考え方は「平均値」以外でも「個々」と「全体」とを比較できる値なら応用が可能です。例えば、中央値、最頻値も”リフト値”によって「個々」と「全体」の比較ができるようになるでしょう。標準偏差の”リフト値”が役立つシーンがあるかもしれません。
今回、ここで紹介した”リフト値”は、統計学上は正確な表現で無いかもしれません。しかしながら重要なのは、分析結果から示唆を得て、これをビジネスの成果へと結び付けていくことです。この「分析から示唆を得る」というステップにおいて、ここで紹介した”リフト値”の考え方は役に立つでしょう。

【リフト値関連記事】
  1. リフト値とは|データ分析用語を解説
  2. 統計データでリフト値を用いることで「相対値」が分かる:”リフト値”を活用する(1)
  3. POSデータのクロス集計で「売れ方」の理解に用いる:”リフト値”を活用する(2)
  4. 平均値同士の「相対性」を把握する:”リフト値”を活用する(3) (本編)
SERVICE