Data Scientist Fes2018ミドルカンファレンス
~データ×ビジネス変革×企業の成長~

Data Scientist Fes2018ミドルカンファレンス

 11月26日(月)に赤坂インターシティコンファレンスで開催されたミドルカンファレンスの講演、セッションの採録です。「データ×ビジネス変革×企業の成長」と題したフォーラムでは、データ先進企業の取組みの紹介、ビッグデータやAI活用による経営・ビジネス推進のためのソリューションや組織・人材育成へのアドバイス等、幅広い情報が共有されました。

基調講演

データ活用事例と企業間ビッグデータ連携の可能性

月間1兆のシグナルを処理するヤフーがめざすもの

佐々木 潔氏 ヤフー株式会社 執行役員チーフデータオフィサー(CDO)
兼メディアカンパニープラットフォーム統括本部長

佐々木 潔氏 ヤフー株式会社 執行役員チーフデータオフィサー(CDO)兼メディアカンパニープラットフォーム統括本部長

 AIブームは過去にも2回あり、現在は第三次と言われる。そのブームを支える「ビッグデータ、インフラストラクチャー、データサイエンス」の3つに積極的に取り組んでいるのがヤフーだ。同社 執行役員の佐々木氏は、CDOの肩書を持つ。CDOはいわゆるデジタル化を推進する「チーフデジタルオフィサー」を指す場合もあるが、佐々木氏はヤフーのビジネスのデータ活用やガバナンスを統括する「チーフデータオフィサー」である。

 ヤフーは現在、100以上のサービスを展開・運営しており、月間のログインユーザー数が4000万人以上、月間のページビューが700億以上。ユーザーの動作を検知するシグナルは、月間で1兆を超えている。
 Webやスマホアプリなどを通じて、データを駆使して様々なサービスを提供するヤフーの注目すべき取り組みは、機械学習や自然言語処理、情報検索に関する技術だ。これらデータサイエンス領域の権威ある国際学会における論文の発表数は国内企業としては一番多いという。ヤフーニュースの記事、ヤフーショッピングやヤフートラベルの商品のおすすめなどは、こうした3つの技術の融合によって日々進化している。ヤフー知恵袋では独自のスーパーコンピューターkukaiを用い、ディープラーニングによって回答の内容を判断し、質の低い書き込みを見えにくくすることで、40%のユーザーが質の向上を実感したという。

 ヤフーのデータ人材は約500人。推進体制については、データ人材を集約する組織を作り、データのガバナンスや利活用を進めている。こうしたデータ利活用のノウハウを用いて、ヤフーのビッグデータと外部の企業や自治体などの機関の持つデータを掛け合わせ、得られたインサイトを提供する仕組みとして「データフォレスト構想」を2019年度の事業化に向けて進めている。流通・小売企業とともに生産、物流のプロセスにデータ分析を用い、廃棄や欠品などの問題を解決するといった事例や、交通インフラや防災分野、都市問題を解消する分野でもヤフーの多岐にわたるビッグデータを活かした実証実験などを推進している。

 佐々木氏は、データサイエンス分野の人材の重要性を述べ、学校教育での裾野を広げるための活動も今後、積極的に展開していくことを強調した。

企業講演1

アナリティクス技術のビジネス適用

共通のビジネス用語、モックアップ型試行が有効

廣田 壮一郎氏 野村総合研究所 システムコンサルティング事業本部 システムデザインコンサルティング部副主任データサイエンティスト

廣田 壮一郎氏 野村総合研究所 システムコンサルティング事業本部 システムデザインコンサルティング部副主任データサイエンティスト

 野村総合研究所(NRI)が日本情報システムユーザー協会(JUAS)と行った調査を通して、アナリティクスの成果が出ている企業は2割を下回っているということが判明した。アナリティクスのハードルを下げるツールも多々登場してきているが、ツールだけでは解決できない課題がまだまだ多いことを示している。
 NRIの廣田氏はビジネスとITを繋げる事が出来るジェネラリスト型のアナリティクス人材が重要となると述べた。一方で、ジェネラリスト型のアナリティクス人材は希少な存在となっており、各企業で確保するのが難しい実情にも触れた。そこで特定の人材に頼りきらない方法論として、①共通のビジネス用語をベースに会話する。②アジャイル的な進め方を理解してモックアップ試行を実施する。③成果を現実のものとするために仕組みも変える。の3つの歩み寄りについて解説した。
 まずひとつ目に、チームメンバー間の会話は共通言語となり得るビジネス用語を用いるべきと主張した。ついつい技術的な要素をベースに会話しがちだが、それでは難しい印象を与えるばかりで話が進まなくなることも多い。しかし、ビジネス用語で会話するばかりでは、技術的な妥当性を検証できないといったジレンマが発生してしまう。そこでふたつ目に、アジャイル的な進め方を理解しつつモックアップをスクラップ&ビルドしながら案件を進めるべきと主張した。実際にモックアップを用いた業務試行を実施することで、実現性を考慮しながら着実な案件推進が可能となるだけでなく、業務担当者側の技術的な理解を深めることもできる。目標にはアナリティクスシステムとしてビジネス適用することを設定し、投資対効果検証・実現性検証・本番開発と進める3つのステップ論について述べた。最後に、アナリティクスの成果を回収するうえで現場の努力だけでなく、経営層の協力も大事であると主張した。各部署の業務やルール、部署間の連携などがビジネス適用時のハードルとなることも多い。効果が見えたタイミングで号令を出すことで活動を後押しするなど、チームの一員だという意識を持つべきだと述べた。
 その具体例として、最適化手法を用いたアナリティクスシステムの開発プロジェクトを挙げた。まずは現行業務を理解するために現在使用している帳票を収集し、普段使いしている各種指標をベースに何が変わるのかを議論した。そのうえでPythonとExcelを連携させたモックアップを構築し、実際に業務試行を通じて効果を体感してもらうことにした。最終的には経営層に費用対効果の大きさを理解して頂くことができ、関係部署間で連携する新業務を適用していく方向で決定した。堅実な案件推進が可能となり、投資対効果も早い段階から見える様になった。結果として次のステップや新しいアナリティクスのビジネス適用仮説についても議論が発展するなど、アナリティクスをビジネス適用していく流れが企業の中でできることとなった。

企業講演2

事例にみるAIビジネス活用の最前線

システムインテグレーターの立場から

香川 元氏 TIS AIサービス事業部AIサービス企画開発部エキスパート

香川 元氏 TIS AIサービス事業部AIサービス企画開発部エキスパート

 TISでは、企業が自社のAIを業務システムに応用するためのシステム開発、コンサルティング、運用の支援を行っている。コンサルティングのフェーズでは、AI化の狙い、目的と仮説の設定、AI化の企画・戦略の立案などトータルなサポートを担う。ここで重要なのは、社内の業務プロセスの見直しから改革にいたる「BPR」(ビジネス・プロセス・リエンジニアリング)だ。
 アセスメントの段階で顧客のニーズをつかみ、PoC(概念実証)を実施するが、近年はこのフェーズで、非構造化データなどの多様な形式のデータを格納する基盤である「データレイク」を作り、クラウドでのデータ管理・運用ツールであるKubernetesなどのDockerの技術を用いることが潮流になってきている。案件としては、製造現場の外観検査や監視カメラの画像解析、故障検知などさまざまだ。とりわけ最近では医療分野での導入が進んでいるが、その場合、結果を導くアルゴリズムや判断に対しての根拠が求められる。「ブラックボックスなAIでは通用しなくなる」と香川氏は主張する。
 人材については、「ビジネスへの理解と統計やデータ分析のスキル、機械学習・ディープラーニングなどのデータサイエンスを身につけた高度人材をいかに育てるかが鍵となる」という。そのためTISではAIビジネス推進コンソーシアムにてAI人材育成のワーキンググループを設け、一般企業の参加も呼びかけている。

企業講演3

信頼できるAIでビジネスを最大化

「公正」と「透明性」のための環境を提供

赤石 雅典氏 日本アイ・ビー・エム Watson Technical Solutionsエグゼクティブ ITスペシャリスト

赤石 雅典氏 日本アイ・ビー・エム Watson Technical Solutionsエグゼクティブ ITスペシャリスト

 AIの「説明責任」と同じく、現在最も重要なテーマとして語られるのは、AIの「公正」と「透明性」だ。米国では犯罪者の再犯予測を行うAIや、採用での就職希望者を自動的にランキングするAIが「差別」を生み出しているとみなされ、社会問題になった。GAFA(Google、Amazon、Facebook、Microsoft)などのメジャーIT企業も、公平性を担保するためのツールや論文などを発表している。その中でもいち早く、IBMは2017年からCEOジニー・ロメッティ氏がAIに関する責任性についてレポートで触れ、18年には「AI倫理のためのガイド」を公表した。
 このガイドラインやIBMの公平性、透明性についての研究を踏まえたソリューションが、「IBM AI OpenScale」だ。IBMはこれまでもWatsonのブランドで、開発環境や実行環境としての機械学習ツールを提供したが、赤石氏は「AI OpenScaleはその一歩先の運用環境にあたる」と話す。Open ScaleはIBMだけではなく、他社のAIも管理対象となり、オープンソースのAIの開発用のフレームワークを用い、パブリック、プライベート両方のクラウドで展開できる。機械学習モデルの入出力ロギングを手がかりにすることで、バイアス検出と、モデルの説明性を実現する。バイアスの検出結果やトランザクション単位のモデルの説明性は、すべてダッシュボードから視覚的に確認可能である。

企業講演4

SQLによる機械学習の実現

顧客接点の情報を集約し、解約率の低減に貢献

油井 誠氏 トレジャーデータ 首席エンジニア

油井 誠氏 トレジャーデータ 首席エンジニア

 トレジャーデータは2011年にシリコンバレーで日本人3人のファウンダーによって設立された。現在は半導体プロセッサのIP(知的財産)とIoTサービス事業を推進するArm(ソフトバンク傘下)による買収を経て同社の一事業部門となっている。
 いま高度なマーケティング向けのソリューションであるカスタマー・データ・プラットフォーム(CDP)に、セキュリティーやコンプライアンスを強化したエンタープライズ対応としての「Arm Treasure DataeCDP」を提供している。「それを可能にするのが、当社の持つ高速なデータ処理能力と機械学習技術だ」と油井氏。
 Arm Treasure Data eCDP によって、CRMなど複数のデータソースを統合した顧客データを使い、マーケティングキャンペーンなどの施策を計画、立案していくことができる。一顧客が利用するばらばらなサービスを固有のIDによって束ね、その傾向に応じたセグメントを作成して、スコアリングを行う。行動履歴や閲覧履歴からキーワードをつけられ、カテゴリーに振り分けられていく。
 また「Hive mall」のような、利用者が複雑なプログラミングをすることなく一般的なデータベース言語であるSQLのクエリーによって処理できる機械学習ライブラリも提供している。
 「例えば、スバル自動車が顧客とのさまざまなタッチポイント・部署でArm Treasure Data eCDP を活用し、オンラインから実店舗までのデータを連携させて購入の成約率を上げた事例や、野菜のオンライン販売「オイシックス」が機械学習による予測によって解約率を引き下げた事例などがある」と語った。
 最近、盛んなサブスクリプション型のビジネスにおいては、解約予測は生命線であり、油井氏は「ウェブやSNS、電話を通じてのクレーム情報を統合して施策に反映させたり、ユーザーの離反を防止するユーザーインターフェースの改善に役立っている」と話した。

企業講演5

ビッグデータと機械学習の活用のために

データサイエンティストが「分析モデル作成」に集中できるテクノロジーを提供

瀬田 浩伸氏 マイクロストラテジー・ジャパン 営業部シニア・セールスエンジニア 中小企業診断士

香川 元氏 TIS AIサービス事業部AIサービス企画開発部エキスパート

 第三次AIブームやビッグデータブーム以前からBI(ビジネスインテリジェンス)は利用されてきた。マイクロストラテジーはBIベンダーとして、特に大規模データ量/ユーザ数の利用実績で評価を得ている。
 近年では、Facebookでの200PB(ペタバイト)超のビッグデータ分析への利用が、同社のCTOによって公表されている。
 ビッグデータ活用が語られて久しいが、依然として多いのは、「分析モデル作成」というデータサイエンティストが最も期待される役割以外の「データの前処理」の負荷の問題だ。データの種類が増え、多様化する中で、分析データへのアクセス・抽出・加工のプログラムは、都度作成・修正が求められている。瀬田氏は「データサイエンティストの業務の9割が前処理で驚くべき状況」と語る。
 MicroStrategyは、顧客企業から高い評価を獲得している分析データに対してのきめ細かなガバナンス性に加え、近年の分析データのデータ種類の多様化には、それぞれのデータソースへの最適な取得パターンやAPIでのアクセスをGUIで提供。データの整形・加工を行う、「データラングリング」の機能を、BI機能として提供している。ログファイルやSNSデータなどの半構造化データや非構造化データも構造化されたデータに整形・分析することができる。
 さらに、複数のデータを組み合わせて活用する、データブレンディングも提供。GUI操作で、社内の地域別の売上データと、国勢調査などの公衆データの地域別の人口統計を組み合わせ、可視化することも即座に可能となるという。
 こうした可視化と抽出・加工の支援は、BIツールとしての20年以上に及ぶ長い実績によって洗練されてきている。現在ではRやPythonなどの分析用プログラムもダッシュボードと連携することで分析・予測結果等を手早く可視化することができる。データサイエンティストは、MicroStrategyのBIテクノロジーを活用することで、分析モデルの構築に集中でき、より洗練されたモデルを、わかりやすい形式で簡易に表現できることになる。企業のビジネス部門もデータサイエンスの価値を活用するサイクルを加速化できることになるだろう。

クロージングセッション

花塚 泰史氏 ブリヂストン デジタルソリューション本部 IoTセンシング技術開発ユニットリーダー

花塚 泰史氏 ブリヂストン デジタルソリューション本部 IoTセンシング技術開発ユニットリーダー

中林 紀彦氏 SOMPOホールディングス チーフ・データサイエンティスト

中林 紀彦氏 SOMPOホールディングス チーフ・データサイエンティスト

ファシリテイター 鹿内 学氏 パーソルキャリア Data Ship/ミイダス

ファシリテイター 鹿内 学氏 パーソルキャリア Dataship/ミイダス

データ活用先進企業における「変革」

レガシーな業態のディスラプションに備える

 クロージングとしてのパネルディスカッションでは。データ活用先進企業の会社・組織・ビジネス変革についての議論がおこなわれた。

 中林氏は、現在、保険業界が大きな変化の波にさらされていることをあげた。「車と住宅と健康」というこれまでの保険の対象だったビジネスモデルが、シェアリング型のサービス、自動運転やヘルスケアの新サービスといった潮流によってディスラプト(破壊)されようとしている。こうした中で、既存の保険業務の効率化と新たな事業開発の両方向でのデータサイエンティストのチームの活動を推進している。
「データサイエンスブートキャンプ」を立ち上げ、「外部の人材や企業を巻き込んだプロジェクトを推進する出島(SOMPO D-STUDIO)」によって人材の集結を図っている。

 花塚氏は、2003年、新卒の入社配属時から「タイヤにセンサーをつけ、データを収集する」プロジェクトに関わった。学術界の協力も得ながらデータを価値ある情報に変換するアルゴリズムに取り組んできたという。
ブリヂストンは世界のタイヤシェアは現在でもNo.1で、新興国市場が伸びており売上の右肩上がりは維持しているものの、新興国企業の追い上げもあり、危機感があるという。ブリヂストンの強みであるタイヤやベルトコンベアなどの「モノ」に付随した形のサービスをデータサイエンスから生み出すことが花塚氏の目的だ。そのために、社内で「データドリブンなカルチャーを醸成する」ことに力を入れ、アカデミーとの連携も進めている。

 またファシリテイターの鹿内氏も、認知神経科学の分野からビジネスに転身した方だ。科学研究で培われた知見や方法論はビジネスサイドでも十分活かせることを知り、「Data Ship」と「ミイダス」という事業開発プロジェクトを推進している。

 このイベントの一貫したテーマである人材については、「ビジネスとデータサイエンスの橋渡し」となる人材が最も必要というのが共通した見解だ。鹿内氏からの「ビジネスドメインとデータサイエンスのスキルのどちらが重要か」という問いかけに対しては、両者とも「データ分析にはドメイン知識が必要」と回答した。最初の課題設定でも、データ分析スキルのあるデータサイエンティストのかかわりが重要であり、ビジネスとデータの橋渡しにおいて、データサイエンティストが橋をかける主導的な役割を担っていることがわかる。

 全セッションを通じて、データサイエンティストという専門のスキルを社内的にいかに育成するか、組織やチーム、外部との交流や連携プロジェクトや社内での教育・研修コースの事例の数多くの事例が紹介された。とくに、人材育成や教育について、参加者は熱心にメモを取り、時に許諾された投影画像を撮影するなど、収穫の多いイベントとなったようだ。