Tech & Science 2015.02.03 09:01 決定木のCARTアルゴリズム|プロ野球データで決定木(Decision Tree) with R 第2回 プロ野球データで決定木を行った結果を公開していきます 本連載では、3回にわたり、プロ野球のデータで実際に決定木を行った事例を紹介していきます。第2回目の今回は、理論編として、決定木とは何かと、決定木の代表的なアルゴリズムであるCARTアル...
Tech & Science 2014.07.23 08:52 ”R”で実践する統計分析|序:R(アール)とは?【外部寄稿】 Rの分析手法や使い方を連載形式でご紹介します(※外部寄稿) 本連載は、Yuu.Kimy氏にご寄稿頂いて、Rでの分析手法やその使い方について紹介していきます。初回である今記事は「Rの概要」について説明します。 「R(アール)」とは? 数...
Tech & Science 2014.08.13 09:05 ”R”で実践する統計分析|回帰分析編:③ロジスティック回帰分析【外部寄稿】 Rによる回帰分析の実施手順を紹介 本日は、Rの使い方の実践として、「回帰分析」について紹介していきます。なお、回帰分析の理論については、こちらの特集内の【寄稿】回帰分析とその応用を参照ください。 『”R”で実践する統計分析|回帰分析...
Tech & Science 2014.09.08 09:04 Geek at GiXoの分析ツール使いこなし術|TableauとRの連携 第1回 [ギックス流]での分析ツール活用をお伝えします 私が分析ツールアドバイザーを務める「株式会社ギックス」は、クライアントの事業を高度化するための分析を実施することを主業務の一つと置いており、また、その実現にあたっては「分析の目的にマッチし、...
Tech & Science 2014.09.09 09:06 Geek at GiXoの分析ツール使いこなし術|TableauとRの連携 第2回 TableauとRを連携させる 前回は、TableauとR連携の準備を進めてきました。意外と簡単に設定が出来たかと思います。今回は、実際にTableau-R連携環境で何ができ、どのような仕組でTableauとRが連携されているのかを確認し...
Tech & Science 2014.12.16 09:04 Python+Anaconda+Eclipseを導入/PythonとRのビッグデータ統計分析の比較 第1回 統計モデル構築のためにPython+Anaconda+Eclipseを選択 これまで何度かご紹介してきたとおり、ギックスではR言語を利用して統計モデルを作成するケースが多いです。Rはオープンソースなのでフリーで活用できますし、カバーしてい...
Tech & Science 2014.12.23 09:04 Python+Anaconda+Eclipseのインストール手順/PythonとRのビッグデータ統計分析の比較 第2回 AnacondaとEclipseの導入・連携の手順 前回の記事では、統計モデルを構築する上でRの他にPythonを利用する方法があることや、その環境を構築する上で必要となるモジュール群の概要を説明しました。今回は、AnacondaとEcl...
Tech & Science 2015.01.07 09:05 2014年全6.6万打席の紹介|プロ野球データでクロス集計 with Tableau 第1回 2014年のプロ野球全打席データをクロス集計していきます 我々ギックスは、データ分析において「加工されていない生データを手元に持ちましょう」「複雑なモデルを作らなくてもクロス集計で十分なケースが多いです」「仮説を検証するための人間の頭で考...
Tech & Science 2015.01.23 08:52 分析結果|プロ野球データでロジスティック回帰の実践 with R 第2回 プロ野球データでロジスティック回帰分析を行った結果を公開します 本稿では、プロ野球の打席データで、実際にロジスティック回帰分析を行った事例を紹介します。具体的には、その打席が「安打」か「凡打」かの確率が、ボールカウント、ストライクカウント...
Tech & Science 2015.02.18 09:10 火事場泥棒・焼け石に水な打者(パ・リーグ)|プロ野球データでクロス集計 with Tableau 第7回 2014年のプロ野球全打席データをクロス集計していきます 2014年のプロ野球の打席データを全量(約6.6万件)手元に置き、さまざまな切り口でクロス集計して、プロ野球全体の打席の傾向を見ていく「プロ野球データでクロス集計 with Tab...