「表計算」を意識する ~行・列がどのように計算されているかをイメージする~| Tableau分析塾

AUTHOR :   ギックス

7.7k

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

Tableauを使いこなすためには表計算を意識することが重要

Tableauは直感的な操作でデータビジュアライズを行える非常に優れたツールです。その操作の容易さ故に、内部でどのような計算が行われているかを意識の外に追いやりがちですが、その計算はExcelに代表される表計算ツールと同様に行と列の組み合わせである表をもとに行われます。そのため、Tableauで思い通りの計算を行い結果を可視化するためには、データソースがどのような様式でデータを保持しているか、Tableauでどのような計算が行われるのかを把握する必要があります。
また、Tableauには「表計算」という機能が存在しています。これを用いることで構成比やランク、移動平均を算出できる便利な機能なのですが、この「表計算」を使いこなすためにも、表のどの範囲を計算して結果が導出されているのかを理解する必要があります。

1行の単位は何か(データの粒度について)

データソースがどのような様式でデータを保持しているかを理解する必要のある場面をご紹介致します。例えば、ある決済データを扱う場合に合計決済数を算出したいとします。1行のデータが1決済を表している場合、行数を数える関数 COUNT を用いることで決済数の算出が可能です。しかし、1行が1決済ではなく1商品の売上であった場合は、単純に行数を数えると商品数になってしまいます。この場合は、重複を除いた行数を数える関数 COUNTD で決済IDを集計することで決済数を算出しましょう。(決済IDとは、決済を一意に特定できるキー情報です。分析に際して別途作成する必要があり、店舗情報や決済日時等を組み合わせて作成することが多いかと思います。)
このように思い通りの集計を行うためには、データソースがどのような様式でデータを保持しているかを考慮する必要があります。

「表計算」機能について

前述の通りTableauには「表計算」という機能が存在します。この「表計算」機能についても、使いこなすためには表を意識することが重要です。以下では、「表計算」機能を用いた場合Tableauでデータがどのように集計され、グラフとして表示されるかを解説致します。
例として、都道府県別の売上金額に占めるカテゴリ構成比を算出する場合を想定します。この場合、以下のようなグラフで表現することになるでしょう。
spreadsheet_01
 
まず、構成比を算出する場合は分母と分子を明確にする必要がありますが、今回分母となるのは都道府県毎の合計売上金額で分子は都道府県毎のカテゴリ別売上金額となります。この構成比をTableauで表現するためには、まず分子となる都道府県毎のカテゴリ別売上金額を表現します。
spreadsheet_02
現在のグラフは都道府県毎のカテゴリ別売上金額を集計していますので、都道府県毎の売上金額という数値は存在していません。この、現在シート上では存在していない都道府県毎の売上金額について別途集計を行う必要があるのですが、ここで「表計算」機能が活躍します。
行(または列)に設定した「売上」を右クリックし「表計算の追加」を選択。spreadsheet_03
 
「計算タイプ」を「合計に対する割合」とした上で「次の値を要約」を「カテゴリ」に設定します。
spreadsheet_04
今回の例ではカテゴリを色として設定しています。棒グラフの高さを100%として、それぞれのカテゴリで分割することで構成比を表現しています。また、「表計算の追加」を行った「売上」をラベルにドラッグ&ドロップすることで、数値を文字で表示することが出来ます。「色に指定した項目を設定する」と覚えて頂ければ、今回ご紹介しましたグラフは問題なく作成できるかと思います。
 

表で計算内容を確かめる

「表計算」機能は名前の通り、表計算を行う機能です。どのように計算が行われているかを理解するには、実際に表形式でのビジュアライゼーションを行ってみるとよいでしょう。「表示形式」をクリックし、「テキスト表」を選択することで、棒グラフを表に変換できます。
spreadsheet_05
「次の値を要約」を「カテゴリ」に設定することは、もう一方の軸について、各カテゴリの数値の合計を分母とすることを意味します。今回の例では、もう一方の軸が都道府県ですので、都道府県ごとにカテゴリ別の売上構成比が算出されます。
また、「カテゴリ」を「表(下)」に変更しても、計算結果は同様です。「表(下)」は、それぞれの列について各行の合計を分母とすることを意味します。行にはカテゴリ、列には都道府県が設定されていますので、「カテゴリ」を選択することと同じ計算が行われます。
spreadsheet_07
このように、グラフを描画するための計算は表に沿って行われています。そのため、表形式でどのようにデータが保持されており、またそれぞれの行・列がどのように計算されているかを意識することが、思い通りに計算結果を算出しグラフとして表現する近道となるでしょう。

連載/関連記事リスト:Tableau分析塾
SERVICE