リフト値とは:その事象が、どれだけ「持ち上がっているか」を考える指標|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

リフト値が高い=その物事が”起こりやすい”

以前、「バスケット分析とは|データ分析用語を解説」という記事を書きました。
この記事中にもある通り、バスケット分析は「頻繁に購入される商品の組合せ」を見つけるための分析手法です。この組合せを見つける際に重要となる指標が「リフト値」という指標です。今回は、この「リフト値」について解説していきたいと思います。

リフト値とは

リフト値とは、バスケット分析における重要な指標の一つであり、ある商品xの購買が他の商品yの購買とどの程度相関しているかを示す指標です。英単語”lift”は「持ち上げる」という意味であり、リフト値は商品xの購買が商品yの購買をどの程度”持ち上げる”か(促進させるか)を示す指標であると言えます。リフト値が大きければ大きいほど、商品xの購買が商品yの購買を”持ち上げて”います。
この「リフト値(Lift)」という指標は、「支持度(support)」と「確信度(confidence)」という指標とともに説明されます。
すべてのトランザクション(購買履歴)のうち商品xと商品yがともに購買されている割合を「支持度」といい、商品xの購買したときに、さらに商品yを購買する確率を「確信度」といいます。
「支持度」「確信度」をそれぞれ式に表わすと次のようになります。
apriori1 apriori2
そして、この「確信度」を商品yを含むトランザクションの件数で割ったものが、「リフト値」になります。
この式は、次のようになります。
apriori3
この式から「リフト値」は、「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものである、と考えることができます。

リフト値の考え方はバスケット分析以外にも応用できる

「リフト値」は「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものであると書きましたが、これを一般化すると次のようになります。
「リフト値」は、「条件Xのときの事象Yの割合」を「全体での事象Yの割合」で割ったものである。(バスケット分析の時は、条件Xが「xが買われた」になり、事象Yの割合が「yが買われる確率」になります)
つまり、「リフト値が高い」ということは条件Xのときに事象Yが起こりやすいということを示しています。このように一般化すると「リフト値」の考え方は「バスケット分析」以外でも活用できます。これについては、次回以降の記事「”リフト値”をバスケット分析以外で活用する」で書いていきたいと思います。

【リフト値関連記事】
  1. リフト値とは|データ分析用語を解説 (本編)
  2. 統計データでリフト値を用いることで「相対値」が分かる:”リフト値”を活用する(1)
  3. POSデータのクロス集計で「売れ方」の理解に用いる:”リフト値”を活用する(2)
  4. 平均値同士の「相対性」を把握する:”リフト値”を活用する(3)

データ分析用語:索引

SERVICE