Tech & Science 2014.03.09 10:56 「確率がとても低い事象の分析」に全量データ分析は威力を発揮|ビッグデータ分析の留意点② 「ロングテール」に代表される確率が低い事象には全量データ分析 本日は、全量データ分析の優位性①にあたる、以下のポイントについて説明します。 優位性①:確率が低い事象を扱う場合に、サンプルデータでは得られない知見が得られるという点で、...
Tech & Science 2014.03.16 11:08 全量データで多重クロス集計を行い、擬似相関を見破り、交互作用を発見|ビッグデータ分析の留意点③ 本日は、全量分析の優位性②にあたる、以下のポイントについて説明します。 優位性②:性別、年齢、居住地、嗜好など、非常に多くの要素による多重クロス集計を行うことができる。 購買行動や意識などを分析する時、性・年代別ごとのクロス集計を取...
Tech & Science 2014.03.23 11:01 べき分布のデータには注意しよう|ビッグデータ分析の留意点④ 購買系のビッグデータには「べき分布」が多く注意が必要 (第2回)と(第3回)で全量分析の優位点について紹介しました。本日からは、全量データに注意すべき点を説明します。本日は注意点①の以下のポイントです。 注意点①:サンプルデータは中...
Tech & Science 2014.03.30 11:04 ビッグデータでは統計的検定は意味がない|ビッグデータ分析の留意点⑤ 統計的検定とは? (第2回)と(第3回)で全量分析の優位点について、(第4回)で全量データを分析する際の注意点①を紹介しました。本日は、2つ目の注意すべき点である以下について説明します・ 注意点②:標本統計を前提とした統計的検定は、ビッ...
Tech & Science 2013.12.09 13:00 ビジネスへのインパクトを「常に」念頭に置こう|ギックスのビッグデータ分析体系 ③ 「ビジネスの理解」と「データの理解・準備」 今回からギックスの分析体系の中身についてお話していきます。本日は「ビジネスの理解」と「データの理解・準備」の話です。ギックスのビックデータ分析体系では以下の赤枠にあたる部分です。 ビジ...
Tech & Science 2014.01.13 12:58 Quick Startのための分析ツールとは|ギックスのビッグデータ分析体系 ⑧ 手軽に利用できるビッグデータ分析ツール ここまで7回にわたってギックスのビッグデータ分析体系の中の分析プロセスについて説明しました。本日は分析体系の中の「ギックスで利用するビッグデータ分析ツール」の紹介に進みます。ビックデータ分析体系の中...
Tech & Science 2015.04.17 09:15 文字コードや文字化けを理解しよう(その2)|いまさら訊けないビッグデータ分析 第2回は「文字化けあるある」です。 前回は文字コード関する基本的な知識をまとめてみました。第2回の今回は「じゃあ文字化けはどういった場合に起こるの?」という場面についてパターン分けして説明していきたいと思います。皆さんも心当たりがあったら...
Tech & Science 2015.04.03 09:08 カラムナー、キューブ、インメモリ…ビックデータ分析におけるデータベースのまとめ|いまさら訊けないビッグデータ分析 データベースの「タイプ」を知ってますか? こんにちは、ギックス技術チームの岩谷です。 先日とある方より「ビッグデータ分析処理で、Tableauはキューブを作成しないからシステムの運用がしやすいって聞いたんだけど、どういう事なのかな?...
Tech & Science 2017.02.08 09:02 Amazon Athena の分析サービスとしての位置付けについて考えてみる Amazon Athena は Google BigQuery と MS PolyBase を足して2で割ったようなサービス 昨年末、Amazon Web Services(以下、AWS)が主催したAWS re:Invent 2016から...
Tech & Science 2020.12.15 08:58 TableauのLOD表現で注意すべきこと この記事は GiXo アドベントカレンダー の 15 日目の記事です。昨日は、トチカチを支える技術でした。 Design & Science Div.の松田です。本記事では、弊チームが利用しているBIツールの一つ「Table...