統計データでリフト値を用いることで「相対値」が分かる:"リフト値"を活用する(1)

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

リフト値を使うことで「相対性」が把握できる

以前、「リフト値」について説明いたしましたが、この記事の文末で、

「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。
このように考えると、「リフト値」の考え方は「バスケット分析」以外でも活用できます。

と書きました。
今回から、この「リフト値の考え方をバスケット分析以外で活用する」について連載していきます。

統計データにおける”リフト値”の活用例

総務省統計局のサイトに、年齢区分別の人口の割合のデータがありますので、これを例にとって「リフト値の考え方をバスケット分析以外に展開する」を説明していきたいと思います。
このデータから、全国および北海道・秋田県・東京都・大阪府・沖縄県の5都道府県について、男女全体および男性のみ、女性のみの老齢(65歳以上)人口の割合の表を作成すると次のようになります。
Lift1-1
この表で、男性の老齢人口の割合について「日本全国に対する各都道府県の”リフト値”」を算出してみます。

「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。

における条件Xを「各都道府県」、事象Yの割合を「男性の老齢人口の割合」として、”リフト値”を計算してみます。算出した”リフト値”は次のようになります。
Lift1-2
当然ながら、老齢人口の割合の大きい順と”リフト値”の大きい順は同じになりますが、”リフト値”があることにより、その老齢人口の割合の値が全国での値に比べてどれくらい大きいのか、どれくらい小さいのかが一目で分かります。
次に、同じデータを用いて、今度は都道府県別の老齢人口の割合について「男女全体に対する男性の”リフト値”」を算出してみます。

「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。

における条件Xは「男性」、事象Yの割合を「各都道府県別の老齢人口の割合」です。なお、この場合の全体というのは、「男女で全体」という意味であって、計算は「各都道府県別」に行うことになります。
“リフト値”の計算結果は次のようになります。
Lift1-3
ここで”リフト値”を見ることで、そもそもその都道府県で老齢人口の割合が高いのか、それとも男女全体では老齢人口の割合は高くはないが男性に限ると老齢人口の割合が高くなっているのかがわかるようになります。

リフト値により、全体に対してその値がどれくらい大きいかがわかる

このように、”リフト値”を見ることで、全体に対して、その値がどれくらい大きいのかどれくらい小さいのかがわかるようになります。
今回は、「老齢人口の割合」という具体例で示しましたが、この”リフト値”の考え方は様々なシーンで活用することができます。次回は、POSデータ分析の話に戻り、バスケット分析以外のPOSデータ分析でこの”リフト値”の考え方を活用してみます。

【リフト値関連記事】
  1. リフト値とは|データ分析用語を解説
  2. 統計データでリフト値を用いることで「相対値」が分かる:”リフト値”を活用する(1) (本編)
  3. POSデータのクロス集計で「売れ方」の理解に用いる:”リフト値”を活用する(2)
  4. 平均値同士の「相対性」を把握する:”リフト値”を活用する(3)
SERVICE