• Milan

    データ活用を競争力に。

    データ分析を軸に企業の意思決定・問題解決をサポートします

サービス内容

データの獲得から、分析、新たな気付きの創出、分析結果の活用まで、 科学的アプローチによって問題解決・意思決定をサポートします。


データ分析

「勘」や「経験」に頼っていた判断の潜在的な要因やパターンをデータから発見します。新たな知見を探し出し、より良い意思決定を支援致します。

コンサルティング

データ活用を軸としたコンサルティング業務を行います。科学的アプローチにより企業の課題解決・業務改善を支援致します。

システム構築

分析結果の活用を促進するシステムを構築致します。データの獲得や分析結果のリアルタイムでの活用を支援致します。

「データを分析する」からこそ見える未来がある。

実績紹介

データ分析を軸に、様々なプロジェクトをお手伝いしています。 その中からセレクトした実績をご紹介致します。


判例文の自然言語処理技術の開発

自然言語処理技術を用いて大量の法令、判例文を解析し、日本の法令関連分野に特化した独自の辞書を作成しました。 辞書作成以外にも判例のラベリングや自動目次生成といった技術を提供しています。

ソーシャルメディアの感情分析エンジンの開発

Twitterに投稿されたツイートの感情分析を行うエンジンを開発しました。弊社の自然言語処理と機械学習の技術を応用し、感情分析を高精度に行うことができます。




全文検索エンジンの開発

適切な検索結果を素早く返す、高機能な全文検索エンジンを開発・導入し、検索精度・スピードを大幅に向上させることに成功しました。

人材派遣会社向け月次KPI運用システムの構築

KPIの運用に必要なデータの整理を行い、データの蓄積・可視化をするためのシステムを構築・導入を行いました。

ブログ

Microsoft Project Oxford の Face API で顔認識をしてみる

2015年6月24日

少し前にHow-Old.netがバズっていましたね。 How-Old.netはProject OxfordのFaceAPIを使っているらしいです。 本日は、この Project Oxford の FaceAPI を使って顔写真から顔を認識する方法を紹介したいと思います。 subscription-keyを取得する Azureのアカウントが必要になりますので、登録しましょう。 AzureのMarket PlaceよりFaceAPIを追加します。 追加が完了するとsubscription-keyが取得できます。 サンプルコード(PHP) 画像のurlをGET...

階層ベイズモデルでサッカーチームの攻撃力と守備力を推定する【リーガ・エスパニョーラ編】

2015年4月28日

以前プレミアリーグの主要チームの攻撃力・守備力の推定を行いました。 今回はリーガ・エスパニョーラのチームの攻撃力と守備力を以前と同様の階層ベイズモデルで推定を行いたいと思います。 はじめに 利用したデータ 前回と同様、データは football-data.co.uk のデータを10年分使用しています。 各チームごとに1部リーグに参加した年は黒丸をプロットしています。 X軸に記載されている年は、その年から始まるリーグを意味しています。2005だったら、2005-2006シーズンのデータです。 分析対象とするチーム 今回は10年間1部リーグでプレイし続けているチームに関...

AzureのVirtual Machineで大規模データ解析もサクサクこなせるR環境を構築する

2015年4月10日

分析を進めるにあたって試行錯誤のスピードを上げるのって大事ですよね。 そこそこのマシンでも、ちょっとした集計なんかは対して時間がかかりませんが、 機械学習やMCMCなどの計算処理をブン回したいときは非力なマシンだと時間がかかってしょうがないです。 計算処理の高速はそれこそ様々な手法がありますが、 今回はAzureを使って計算リソースのスケールアップすることができるRStudio Server環境の構築方法を紹介したいと思います。 Ubuntu14.04で構築することを前提に進めていきます。 1. Virtual Machineを作成する Azure...

階層ベイズモデルでサッカーチームの攻撃力と守備力を推定する【プレミアリーグ編】

2015年4月5日

階層ベイズモデルを用いて、プレミアリーグの主要チームの攻撃力と守備力を時系列で推定しました。 過去に書いた、一般化線形モデルのポアソン回帰を用いて攻撃力と守備力を推定した記事と、サッカーの勝敗予想をベイズモデル化した記事の合わせ技 + αな内容となっております。 目次 はじめに 利用したデータ 分析対象とするチーム モデル 前提 モデルのJAGSコード MCMCの計算と結果 分析結果の見方 結果のサンプル Y軸の数値の意味 λってなんだったっけ 濃いグレー・薄いグレー 分析結果...

サッカーの勝敗予測モデルをベイズモデル化する

2015年3月23日

以前、サッカーの試合の勝敗をポアソン回帰を使って予測を行いました。 今回は上記モデルをベイズモデル化し、今後の発展的分析につなげていきたいと思います。 ベイズ統計と頻度統計の違い 厳密ではありませんが、おおざっぱに言うと下記です。 データの捉え方と母数の捉え方が違います。 頻度統計の考え方 ・唯一無二のパラメータが決まっている(パラメータ=固定) ・得られたデータはサンプリングの結果たまたま得られたものとして扱う(データ=確率変数) ・得られたデータよって唯一無二のパラメータを推定する ベイズ統計の考え方 ・得られたデ...

Ruby + NokogiriでWebスクレイピング入門

2015年3月16日

Webスクレイピングとは ※1 ウェブスクレイピング(Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。ウェブ・クローラー(Web crawler) あるいはウェブ・スパイダー(Web spider)とも呼ばれる。 Webサイト上のテキストデータを活用したいけど、APIやCSV等が提供されていないというケースは結構多いですよね。 今回はウェブサイトからテキストデータを取得する方法を紹介をしたいと思います。 RubyのNokogiriというライブラリを使います。 環境構築 構築環境はUbuntu 14.0...

競馬の記述統計 【中山芝2000m編】

2015年3月8日

以前、ロジスティック回帰を使って競走馬の勝敗予測を行いました。 説明変数として、過去2年間の出走成績を用いたのですが、 もっと良い説明変数があるんではないでしょうか。 より良い変数を検討するため、集計・検定を行ってみたいと思います...

JAGSとRでマルコフ連鎖モンテカルロ法

2015年3月1日

今日はベイズモデリングに必要なマルコフ連鎖モンテカルロ法を行うための設定と、 簡単なサンプルを紹介したいと思います。 マルコフ連鎖モンテカルロ法を行うライブラリは様々なものがあるのですが、※1 今回はJAGSをRから使えるように設定していきたいと思います。 ざっくり、マルコフ連鎖モンテカルロ法とは 「マルコフ連鎖モンテカルロ法」とは確率分布のサンプリングを行うアルゴリ...