生年月日から年齢を計算する ~年齢算出の基準日は1つではない~ | データ分析のお作法

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

年齢算出の基準日によって、データ分析の用途が異なる

データ分析において、年齢は、頻繁に利用される分析軸です。そして、この年齢は、顧客情報などの生年月日から算出されることが多く、一般的には、分析日を基準日として年齢を算出していることが多いようです。しかし、本当に分析日を基準日にして良いのでしょうか? 今回は、年齢の基準日について、3つのパターンと用途をご紹介したいと思います。

パターン1:分析日を基準日にして年齢を算出する

分析日を基準日として生年月日から年齢を算出する方法は、現在の利用者の年齢が分かるため、利用者ごとの年齢別の利用状況の分析などを行う場合に最適な方法です。この分析日は、単純に分析処理の当日の日付を使うのではなく、分析日の月初や月末を分析日として定義し、それを使って年齢を算出する必要があります。この分析日の定義を行わず、分析処理の当日を基準日とした場合、分析処理のタイミングによって、同一の利用者の年齢が異なる結果になるため、注意が必要です。

パターン2:利用日を基準日にして年齢を算出する

利用日を基準日として生年月日から年齢を算出する方法は、利用当日の年齢が分かるため、利用した商品・サービスの年齢状況の分析などを行う場合に最適な方法です。この分析日は、利用した商品・サービスを中心に決めてるため、同一の利用者でも商品・サービスの利用タイミングによって年齢が一意になりません。また、分析期間内で商品・サービスを利用しなかった会員は、年齢を算出することができません。このため、利用者を中心とした分析には、不向きな年齢算出方法です。tanjobi

パターン3:全利用履歴の最終日を基準日にして年齢を算出する

利用者に関係なく、全利用履歴の最終日を基準日として生年月日から年齢を算出する方法は、最終利用日の利用者の年齢が分かるため、利用当時の利用者ごとの年齢別の利用状況の分析などを行う場合に最適な方法です。この方法は、パターン1の方法に類似しますが、パターン1と異なるのは、「基準となる分析日の定義を行わず、売上などの利用履歴の最終日を分析日として算出する」ことです。そのため、利用履歴に合わせて、年齢が更新されていくため、パターン1のように定義する必要はなく、基準日の定義忘れによる分析ミスを減らすことができます。また、利用履歴に合わせて、年齢が設定されるため、1年以上前の過去の分析データでも当時の利用者の年齢で分析が行えます。

年齢算出以外にもソーシャルゲームの離脱ユーザー算出にも使える

今回は、年齢を中心に期間算出の方法をご紹介しましたが、同様の方法でソーシャルゲームなどの離脱ユーザー算出にも使えます。
離脱ユーザー算出は、パターン1、または、パターン3の方法で最終利用日からの期間を求め、一定期間、利用がなかった利用者を離脱ユーザーとみなすことができます。このように、基準日を設けることで様々な期間を算出し、そこから新たな分析を行うことができます。

連載/関連記事リスト:データ分析のお作法
SERVICE