Tech & Science 2020.02.10 09:06 Cloud Composer と GKE を活用して機械学習のワークフローを構築する GKE を効率的に使うために 弊社の機械学習基盤では、ワークフロー管理ツールとして Cloud Composer (Airflow) を利用しており、機械学習タスクは別の Google Kubernetes Engine (以下、 ...
Tech & Science 2020.04.13 08:07 機械学習基盤における Cloud Dataflow の活用 Cloud Dataflow の使い所 Cloud Dataflow は GCP で提供されているサービスの一つで、フルマネージドな環境で ETL 処理を実行することができます。バッチ処理とストリーミング処理を統一的に扱うことのでき...
Tech & Science 2020.12.22 08:35 少人数の開発で Kubernetes を活用するための設計戦略 この記事は GiXo アドベントカレンダー の 22 日目の記事です。昨日は、 ギックスの考えるデータサイエンスとは でした。 MLOps Div. の廣津です。最初に断っておきますが、タイトルは半分釣りのポエム記事です。 本...
Tech & Science 2014.02.06 09:05 ビッグデータ活用事例(7)R&D領域/会社を強くするビッグデータ活用 この連載では「会社を強くする ビッグデータ活用入門 -基本知識から分析の実践まで-」で取り上げたビッグデータやアナリティクスの活用事例を抜粋し、ご紹介していきます。 書籍の中では大きく2つの場合で事例を区分しており、合計8回にわたり、...
Tech & Science 2014.04.10 12:19 Microsoft Power BI 活用レポート:Power Pivotを使ってみた② ~お手軽導入の”限界”~ 「お手軽導入」の限界を知ろう 前回は”Power Pivotがどれくらい早いか”の検証を行いました。Power BI for Office 365 + Office 365 ProPlusのお手軽導入版でも、速度的には、弊社が実施している...
Tech & Science 2014.07.23 08:52 ”R”で実践する統計分析|序:R(アール)とは?【外部寄稿】 Rの分析手法や使い方を連載形式でご紹介します(※外部寄稿) 本連載は、Yuu.Kimy氏にご寄稿頂いて、Rでの分析手法やその使い方について紹介していきます。初回である今記事は「Rの概要」について説明します。 「R(アール)」とは? 数...
Tech & Science 2015.01.02 09:02 第4回 分析結果と考えられる「打ち手」|POSデータでマーケットバスケット分析の実践 with R POSデータでマーケットバスケット分析をした結果を公開していきます 本連載では、4回にわたり、ある書店の実際のPOSデータをもとに、マーケットバスケット分析の事例をRで実装しながら紹介します。マーケットバスケット分析について紹介した本やW...
Tech & Science 2015.01.28 08:59 第3回・フラットファイル(固定長フォーマット)|CSV、XML、JSON…データフォーマットの変遷について考える まずはじめはフラットフォーマットから 本連載の第1回はデータフォーマットの変遷を考える上で取り上げるデータの概要を説明しました。また第2回(前回)は、テキストデータ処理を考える上で必要となる「データを処理する際の共通的な取り決め」について...
Tech & Science 2015.06.17 14:58 「データレイク」のコンセプトを理解しよう|Treasure Data(トレジャーデータ)は、まさにデータレイクだ データレイクは登場したばかり。既存のサービスと比べて理解を深めよう! こんにちは、技術チームの岩谷です。前回、データレイクについての記事を執筆させていただきましたところ、何人かの方々から「それならデータレイクはトレジャーデータのソリューシ...
Tech & Science 2015.08.03 08:30 インターフェースとは?~継承とは役割が違う~|オブジェクト指向プログラミング(OOP)をおさらいしよう(3) 「インターフェース」を理解する上で「継承」の事は忘れてください こんにちは。技術チームの岩谷です。前々回、前回とオブジェクト指向プログラミング(OOP)をおさらいする連載を書かせていただいています。今回は第三回として、前回の継承機能と並ん...