Tech & Science 2017.03.17 09:06 ゲーミングパソコンはデータ分析に使えるのか? ~DELL ALIENWARE AURORA で検証~ データ分析パソコン選びの基準は「NVMe接続」 きっかけは非常に単純だった。オンプレミスPCでデータ分析がどのくらいできるか? 大量データを高速で処理したい場合は、どうしても大掛かりなサーバー環境が必要になり、そのため比較的手軽に使...
Tech & Science 2017.05.18 17:31 クラウドサーバーが、常にオンプレミスより優れているとは限らない ~スモールローカルサーバーという新たな選択肢~ クラウドサービスの空白地帯を考えたオンプレミスの導入 Amazon社がクラウドサービスの Amazon Web Services (通称、AWS)を公開して10年。新規システムならクラウドサービス内で作るのが当たり前となり、既存のオンプレ...
Tech & Science 2013.12.16 13:13 2次属性を理解しよう|ギックスのビッグデータ分析体系 ④ ギックスならではの分析プロセス 「2次属性の作成」 前回は分析プロセスの最初の段階となる「ビジネスの理解」と「データの理解・準備」のプロセスについてご説明しました。今回は、いよいよギックスデータ分析体系ならではの分析プロセスであたる「2次...
Tech & Science 2014.03.02 10:58 ビックデータを全量分析できる時代になった|ビッグデータ分析の留意点① サンプル分析から全量分析へ 近代統計学の学問体系は、無限に近い大規模な母集団から無作為に抽出された、数百から数万のサンプルデータが持つ統計的な性質を中心に論じられてきました。たとえば、内閣府が行っている「社会意識に関する世論調査」では、1...
Tech & Science 2014.03.23 11:01 べき分布のデータには注意しよう|ビッグデータ分析の留意点④ 購買系のビッグデータには「べき分布」が多く注意が必要 (第2回)と(第3回)で全量分析の優位点について紹介しました。本日からは、全量データに注意すべき点を説明します。本日は注意点①の以下のポイントです。 注意点①:サンプルデータは中...
Tech & Science 2014.04.03 12:08 Microsoft Power BI 活用レポート:Power Pivotを使ってみた① ~データ処理速度は「実用に耐える」~ Power Pivot の「処理速度」は実用レベルとしては十分 ギックスでは、従来より「Aktblitz(アクトブリッツ)」という高速データ処理ソフトウェアを活用しています。今回は、こちらと比較しながら、処理性能について考察を進めていきま...
Tech & Science 2015.02.23 09:03 第5回 STEP2 データの格納・確認・前処理|POSデータで事業構造分析 with Power BI Power BIで実践するPOSデータの事業構造分析を公開 この連載では、2013年11月に弊社CEOの網野が出版した「会社を強くするビッグデータ分析」「Part2 分析の実践」の部分を「Power BIでPOSデータを使って事業構造分析...
Tech & Science 2015.03.11 08:52 グループによる2次属性づけ|プロ野球データでクロス集計with Tableau 第9回 2014年のプロ野球全打席データをクロス集計していきます 2014年のプロ野球の打席データを全量(約6.6万件)手元に置き、さまざまな切り口でクロス集計して、プロ野球全体の打席の傾向を見ていく「プロ野球データでクロス集計 with Tab...
Tech & Science 2017.02.08 09:02 Amazon Athena の分析サービスとしての位置付けについて考えてみる Amazon Athena は Google BigQuery と MS PolyBase を足して2で割ったようなサービス 昨年末、Amazon Web Services(以下、AWS)が主催したAWS re:Invent 2016から...
Tech & Science 2018.01.24 12:13 BigQueryの標準SQL対応によって競合サービスからの乗り換えが発生するか? ~Redshiftと使用感を比較してみた~ 分析の試行錯誤フェーズではRedshift。分析の”型”が決まったらBigQuery。 ビッグデータ分析においてデータベースは必要不可欠であることは言うまでもありません。これらのビックデータ向けデータベースの代表格としてオンプレミスではO...