Data Science Engine | データサイエンスエンジン®

ノーコード時代の次世代統計クラウドサービス

データサイエンス
エンジン®

R言語・SQLなどの
専門知識の学習時間が圧倒的に短縮。
マウス操作だけでデータ分析が可能に!

はじめに

21世紀は「データの時代」と言われています

「データは、未来の石油」と言われるほど、私たちの生活でデータは欠かせない資源になっています。しかし、データは活用しないと意味がありません。
データを活かし、価値あるものに変えていくには、データサイエンスが必要不可欠なのです。
データサイエンスは、統計学・数学・計算機科学の知識からデータ分析を行い、データの背後に潜む「なぜ」を追求することによって、新たな価値を見つけ出します。
アカウンタビリティを果たすホワイトボックス型AI(人工知能)の開発にも欠かせません。

データサイエンスに必要な知識

  • 統計解析スキル
  • 機械学習
  • プログラミング言語
データサイエンスエンジン®

「データサイエンスエンジン®」なら、これらの学習時間を
圧倒的に短縮できます

「データサイエンスエンジン®」とは

マウス操作のみでデータ分析ができる
次世代統計クラウドサービスです

  1. POINT1
    R言語の学習時間が
    短縮できます
  2. POINT2
    データ同士の繋がりが
    見えます
  3. POINT3
    場所を選ばず
    利用できます
  4. POINT4
    初心者でも簡単に
    操作できます
特徴
「データサイエンスエンジン®」は、R言語(機械学習・統計学・プログラミング言語)の自動実行機能を持っているので、データサイエンス学習の最大の壁となっていたRプログラミングを覚える必要がありません。
直感的に操作できるUIだけでRプログラミングや難解な数式を半自動で実行し、ノーコードで高度な統計解析を行えるようになることを目指して開発されました。
「データサイエンスエンジン®」はブラウザで起動しますので、インストールや環境構築の手間は一切かかりません。インターネットに繋がる環境さえあればご利用いただけます。

「データサイエンスエンジン®」ができること

探索的データ解析
データを俯瞰で捉え、そのデータが語る仮説を発見するために、幾度となくデータの加工・データ洗浄を繰り返します。
試用版ツール無償提供中
2023年7月現在では、試用版として「探索的データ解析」におけるデータ分析にフォーカスした機能を提供します。
データサイエンス業務がすべて行えるサービス
開発チームは引き続き研究を進め、2024年度にはデータサイエンス業務がすべて行えるサービスを提供できるよう開発を進めています。
「データサイエンスエンジン®」ができることのイメージ

データを視覚化できる
「平行座標プロット」とは

マウスだけで多角的にデータを検証できます

平行座標プロットのイメージ1

平行座標プロットはデータを視覚化するための表示方法のひとつで、数値や文字のデータ資料では分からなかった「データの傾向・ばらつき」「データ同士の相関関係」の確認ができます。
平行座標プロット上でデータ軸の並び替えやデータの範囲指定など、直感的に操作できることが、「データサイエンスエンジン®」の最大の特徴であり、2019年に特許(特開2020-181135)も取得しました。

平行座標プロットを使って、データに触れてみよう

平行座標プロットでどのようにデータ分析をしていくのか、
実際のデータを使ってご紹介していきます。

サンプルデータとして、都道府県の平均寿命(男性)・平均寿命(女性)・平均気温・犯罪発生率・自殺総数(10万人当たり)・事故発生数(10万人当たり)・年収・魅力度の項目を持つデータを、「データサイエンスエンジン®」に読み込ませました。

1/4
都道府県の魅力度にはどの要素が影響しているのかを見ていきます。年収のデータ軸の値が高い位置にある線をたどっていくと、魅力度のデータ軸では下の方に位置しているように見えます。次に年収のデータ軸で高い部分を範囲選択して絞り込んでみます。
そうすると、年収が高い値の場合には都道府県の魅力度の値は高くないことがわかります。「平均年収が高いと、都道府県の魅力度が下がるのではないか」という傾向が見えてきました。さらに他の傾向がないか探索を続けます。軸の並び替えをしていくと、魅力度の高い値が自殺総数・事故発生数では下がっているように見えます。
3つの軸の影響度を見るため、魅力度が高い部分を範囲選択して絞り込んでみます。
魅力度の高い都道府県は、自殺総数・事故発生数の値が低いことが分かります。
「都道府県の魅力度が高いと、自殺総数・事故発生数は低くなるのではないか」という傾向が見えました。

ここで使用した機能はほんの一部ですが、このように「データサイエンスエンジン®」では、平行座標プロットで軸を並び替えや範囲指定をすることにより、データから傾向が読み取れるようになります。

出典:「平均寿命(男女)[平成17年]」厚生労働省・「平均気温[2016年]」総務省統計局・「犯罪発生率[2009年]」政府統計・「自殺総数[平成15年]」厚生労働省・「事故発生率[平成29年]」警察本部・「年収[2019年]」厚生労働省・「魅力度[2020年]」ブランド総合研究所

動画で操作を体験

「アヤメの部位の計測値から種類を特定するAIを開発する」という想定で、実際に並行座標プロットを操作するシーンをご紹介します。

「データサイエンスエンジン®」の
主な機能

平行座標プロット

データ全体の傾向やデータ同士の繋がりを視覚的に確認できます。
軸の並び替えや削除など、直観的にマウスで操作できるので、データ分析がはじめての方でもご利用いただけます。

データブラウジング

各データの分布状態・データの傾向や外れ値を確認できます。
ヒストグラム・散布図・棒グラフ・箱ひげ図・モザイクプロットのグラフ表示が対象のデータ軸の型により自動で表示されます。

データモデリング

特定のデータ軸と他のデータ軸との影響度や相関性を確認することができます。
データ軸の型により、線形モデル・一般化線形モデル・一般化加法モデル・決定木のチャートの表示や機械学習の処理結果が、自動で出力できます。

履歴

実際に行った平行座標プロットの操作や順番などの履歴は自動的に保存されます。
履歴からさかのぼって、過去のデータに戻ることも可能です。

「データサイエンスエンジン®」の動作条件

ファイル形式 CSV形式(カンマ区切りのテキストファイル形式)
データ条件
  • ヘッダー行は必ず定義してください。
  • データに欠損がある場合、正常に分析できないことがあります。
  • 値の中に「,」(カンマ)を指定する場合は、ダブルクォーテーションで値を括ってください。
  • データ行数の上限は1,000件となります。
  • データ列数の上限は20件となります。
動作環境 OSはWindows10、ブラウザはGoogle Chrome・Microsoft Edgeで動作することを確認しています。

監修者のご紹介

データサイエンスの専門家との
研究開発プロジェクトです

「データサイエンスエンジン®」は、一橋大学でデータサイエンスを教える横内大介准教授との共同研究・開発で生まれました。データサイエンスの教育現場はもちろん、現役データサイエンティストにも利用されており、リアルな現場から上がってくるフィードバックをもとにアップデートを行っています。

監修者横内 大介Daisuke Yokouchi, Ph.D.

一橋大学大学院経営管理研究科 金融戦略・経営財務プログラム 准教授
株式会社アナザーウェアAI(人工知能)データサイエンス 技術顧問

監修者 横内 大介 氏

慶應義塾大学において、データサイエンスを提唱された柴田里程教授のもと、博士(工学)を取得。同大学・理工学部 数理学科 データサイエンス研究室の助手を経て、一橋大学大学院 経営管理研究科・金融戦略・経営財務プログラムで准教授に就任しました。専門はデータサイエンスで、データ解析のスペシャリストであると同時に、データベース論やプログラミング、ソフトウエア開発にも精通しています。企業が抱えるデータ解析の様々な問題についてのコンサルティングなども行い、多方面で活躍しています。

よくあるご質問

Rプログラミングが出来ないのですが、利用できますか
本サービスの機能のほとんどは、プログラミングの知識がなくてもご利用いただけます。
グラフの表示やデータの操作、データの傾向を発見するまでの一連の流れに、コードを書く必要はありません。
平行座標プロットの見方が分からないのですが、大丈夫でしょうか
平行座標プロットは、データのつながりを視覚的に見えるという特徴のあるグラフです。
まずは、気になるデータを登録し、データ軸のデータ選択範囲をピックアップすることから始めていただけると、選択したデータがどのように分布しているかを確認することができるので、データの偏りの見方のコツがつかめると思います。
また、この操作を繰り返していただくだけでも傾向を発見することができますので、何度もデータ分析を重ねてみてください。
データサイエンスエンジン®が動作する環境は何ですか
OSはWindows10、ブラウザはGoogle Chrome・Microsoft Edgeでご利用いただけます。
利用やアカウント登録に料金はかかりますか
現在、期間限定で全て無料でご利用いただけます。
「データサイエンスエンジン®」の始め方を教えてください
【今すぐ使ってみる】のボタンから、個人情報の取り扱いについて確認と同意をしていただきます。
同意後、本サービスのサインイン画面からアカウント登録のみで、ご利用を開始していただくことができます。
アカウント登録せずに、「データサイエンスエンジン®」を利用できますか
ご利用いただけません。
本サービスをご利用していただくためには、必ずアカウント登録をしていただく必要がございます。
「データサイエンスエンジン®」のアカウント登録には、どんな情報が必要ですか
メールアドレスと所属されている会社/大学の組織名等を登録していただくことでどなたでもご利用することができます。

利用者の声

東京都 20代男性 大学生
文系でPythonやSQLといった技術がなくても身近なデータをグラフで表示でき、グラフからデータの偏りが視覚的に確認することができるため、統計学の知識が浅くてもデータ分析を行えました。
兵庫県 30代女性 会社員
平行座標プロットでデータ全体を見ることで表形式でデータを見ていた時では分からなかったデータの偏りを視覚的に捉えることができました。
また、Rの利用経験が浅かったのですが、データ分析で分析結果と実行されたRのコマンドが表示され、分析、回帰モデルにおける目的変数、説明変数の指定方法などRに対する理解度を深めることができました。
福岡県 20代男性 研究職
日本語を含んだデータにも対応しており、回帰分析もR言語そのものの機能を使用することができるほか、実行されたR言語のコードが表示されることで分析方法も確認でき、貴重なツールと感じています。

「データサイエンスエンジン®」が
あなたの研究を加速させます

無料トライアル実施中今すぐ使ってみる

お問い合わせは末尾の「個人情報の取り扱いについて」に同意の上、下記のフォームに必要事項を入力してお申し込みください。

は必須となります。

お名前

個人情報の取り扱いについて

株式会社アナザーウェア(以下、当社)は「個人情報の保護に関する法律」を順守し、当社または当社グループ会社が行う以下に記載する取り決めに従い個人情報を利用します。

1.お客さまの個人情報の利用目的について

当社において、事業を行うにあたり、各種の申し込みの受付、アンケート調査、商談、契約の締結などの機会を通じて、た、不動産登記簿、商業登記簿、電話帳などの一般に公開されている媒体からも、お客さまの住所・氏名・郵便番号・電話番号・FAX 番号・メールアドレス、お問い合わせ内容、などの個人情報をお預かりいたします。これらの個人情報は、次の目的で利用させていただきます。

お預かりした個人情報の利用目的

・お客さまからのご意見・感想をいただくため
・お客さまからのお問合せや資料請求などに対応するため
・市場調査や新しい商品・サービスの開発や向上のため
・各種イベント・セミナー・キャンペーン・展示会などの案内のため
・メルマガなどの情報配信サービスや刊行物などの発送のため
・当社グループまたは提携先で取り扱っている商品やサービスに関する情報の提供のため
・会計監査上の確認作業のため
・その他当社の事業に付帯・関連する事項のため

2.個人情報の共同利用について

当社は、お客さまの個人情報を次のとおり共同利用させていただきます。

個人情報の項目

お客さまの住所・氏名・郵便番号・電話番号・FAX番号・メールアドレス・役職・勤務先・お問い合わせ内容など

共同利用者の範囲

株式会社デジタルフォルン
株式会社情創
株式会社エフビズ
株式会社ショウナンソフトウェア
株式会社セカンド・ウェーブ

利用目的

上記1の「お客さまの個人情報の利用目的について」と同じ。

個人情報に関するお問い合わせ先

〒221-0835
神奈川県横浜市神奈川区鶴屋町2-21-8 第一安田ビル6F
株式会社アナザーウェア  個人情報保護相談窓口
メール:isms@another-ware.co.jp  電話:045-312-6389
月曜~金曜(祝日、年末年始は除く) 9:00-17:30

3.個人情報の第三者提供について

当社は、以下のいずれかに該当する場合を除きお預かりした個人情報を第三者に提供いたしません。

・お客さまから事前にご同意をいただいた場合
・利用目的の達成に必要な範囲内において外部委託した場合
・法令に基づき提供を求められた場合
・人の生命、身体または財産の保護のために必要な場合であって、お客さまの同意を得ることが困難である場合
・公衆衛生の向上または児童の健全な育成の推進のために特に必要がある場合であって、お客さまの同意を得ることが困難である場合
・国または地方公共団体などが法令の定める事務を遂行することに対して、協力する必要がある場合であって、お客様の同意を得ることにより、当該事務の遂行に支障を及ぼすおそれがある場合
・上記2の共同利用者の範囲に掲げる者に対して提供する場合

個人情報の取り扱いを外部に委託する際には、当社の規定に基づき要件を満たした委託先のみに委託を行い適切な管理を行います。

4.個人情報の開示・訂正・削除について

当社は、お客様からの求めにより、当社が取得した開示対象個人情報の利用目的の通知、開示、内容の訂正、追加又は削除、利用の停止、消去及び第三者への提供の停止に応じます。

窓口については上記2の「個人情報に関するお問い合わせ先」を参照してください。

2020年2月10日
アナザーウェアグループ
代表 鈴木 晶