分析データのデフォルト値とは? ~何も設定していない時の値~|データ分析用語を解説

AUTHOR :   ギックス

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

不思議な業界用語「デフォルト」、 分析データでの使い方について理解する

データ分析やシステム開発に携わる専門職の中で、普通に使われている「デフォルト」という業界用語(IT用語)があります。この「デフォルト」という言葉は、非常に「曖昧な言葉」であり、使っている場面や前後の言葉によって、様々な解釈ができます。今回は、その中で分析データのデフォルトについて、掘り下げたいと思います。

「デフォルト(default)」の意味を正しく理解する

英語の「default」の日本語訳は、「1.(予定試合への)不出場」「2 .((形式))(義務などの)不履行,怠慢;滞納;債務不履行」「3.《法律》懈怠(けたい):特に法廷出頭義務の不履行」「4.《コンピュータ》デフォールト:ハードやソフトの初期設定」となっており、システム開発などに携わる専門職では、「4.《コンピュータ》デフォールト:ハードやソフトの初期設定」の意味で使っていることが多いです。
主な使い方は下記です。

  • デフォルト設定 → 初期設定
  • デフォルトでインストール → 標準設定でインストール

この様に「初期設定」や「標準設定」のように「最初から決まっている設定」 という意味で使われています。

分析データの「デフォルト」とは

では、分析データでは、デフォルトはどのような意味で使われているでしょうか? 分析データでは、先ほどのデフォルトの意味と若干異なり、「何も設定していない時の値」という意味で使われています。
分析データには、多くのデータ項目を持っています。これらのデータ項目には、全て情報が入っているとは限りません。この時、「何も設定していない時の値」が登録されます。
例えば会員データとして、下記のデータ項目があったとします。

  • 会員番号
  • 会員名
  • 性別
  • 住所
  • 会社名
  • 入会日
  • 退会日

ここで「デフォルト」を意識するデータ項目は、「会社名」と「退会日」です。例えば、学生などは、会社に所属していませんので未記入の場合があり、退会日は退会手続きを行うまで決まりません。これらのデータ項目に「何も設定していない時の値」として、どのような値が入ってくるかが、デフォルトの値となります。また、このデフォルトで登録すする値の事を「デフォルト値」と呼ばれています。

データ分析では「デフォルト値」で何が登録されているかが重要

データ分析では、デフォルト値として、何が登録されてるかを把握する必要があります。例えば、会社名などの文字情報の場合、空文字列(0桁の文字列)を使われることが多いですが、登録できる桁数まで半角スペースを登録している場合もあります。また、売上金額などの数値情報の場合、0円で登録しているかを明確にするために「-1」などの異常値をデフォルト値として登録している場合もあります。
このように、分析データの「デフォルト値」は、データを登録されているシステム、分析データを作る作業などによって、必ず決まった値になる事はありません。そのため、分析データごとに「デフォルト値」が何であるかを把握する必要があるのです。このデフォルト値の把握を怠ると、正しい分析結果が出ない場合もあります。
データ分析用語:索引

SERVICE