「今年の夏は暑い」は本当か?(1):身近なネタで考えるグラフの使い方|冷やしデータ分析はじめました

AUTHOR :  田中 耕比古

夏といえば、やっぱりデータ分析だよね!

暑い日が続きますね。こんな日はアイスクリーム片手に「データ分析」するに限りますね。ということで、この連載では、「猛暑を乗り切る楽しいデータ分析」をテーマに、いろんな分析に取り組んでみたいと思います。

「今年の夏は、暑いよねー」という決まり文句は正しいのか?

毎年毎年、夏になると「今年の夏は暑いなー」という言葉を耳にします。僕は38年生きてきましたが、物心ついたころから、ほぼ毎年耳にしてきました。ほんまにあついんか?おまえ、そのセリフ言いたいだけちゃうんか?と突っ込みたくなりながら、突っ込まずにやり過ごしてきましたが、今年こそは、ちゃんと検証してみたいと思います。

使用するデータは、気象庁が公開している「過去の気象データ」です。

このデータの中で「東京」の「月ごと」のデータを取得して、月単位で年推移をグラフ化しました。1876年1月から2015年7月(途中までのデータですが)をプロットしています。

検証①:夏は暑い?

赤実線が8月、黄色が7月、緑が9月です。(赤点線が、年平均です。)当たり前ですが、殆どすべての年で、8月が一番気温が高くて、次が7月、次が9月、です。やはり「夏は暑い」のは間違いないですね。

Kion_Tokyo_001

検証②:年々、暑くなっている?

9月が30日しかないだろ、という話はさておいて、単純に7,8,9月の気温を平均してグラフ化すると、このようになります。Kion_Tokyo_002

こう見ると、何となく、年平均も、7-9月平均も同じように右肩上がりになってきてるように見えます。

検証③:暑い夏=暑い1年なのか?

こんな風に「動きが似てるかも?」と思った時は、とりあえず散布図です。横軸が「年平均」で縦軸が「7-9月平均」です。右に行くほど年平均気温が高く、上に行くほど7-9月の平均気温が高い、ということですね。

Kion_Tokyo_003

R2(アールスクウェア)0.6 なんとなく相関性がありそうなんですかね・・・と思ったあなたは夏の暑さにヤラれてます

気温が高い3ヶ月を入れた「年平均」は偏ってる

年平均と、7-9月平均を比較しても無駄です。7-9月が毎年一番気温が高いわけですから、それを含んだ年平均は「引き上げられて」います。この暑い季節のデータを除いた1-6月+10-12月の平均データと比較しましょう。

まずは、折れ線グラフ。

Kion_Tokyo_004

右肩上がりの傾向は変わりませんが、散布図で見てみるとどうでしょう?縦軸は「7-9月平均」で変わりませんが、横軸が「7-9月以外(=1-6月+10-12月)平均」です。

Kion_Tokyo_005

R2が、0.4までさがりました。

この時点で言えるのは、「夏の暑さが厳しい」ということと「年間通して気温が高い」ということは、直接的な関係がなさそう、ということです。

次回へ続きます

 

SERVICE