NTTコミュニケーションズ

Bizコンパス

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?
2020.10.14

これからの時代に求められるデータ利活用第6回

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?

著者 亀井聡

 いま、ビジネスの世界ではデータ活用に取り組む企業が増えています。その背景には「安く大量にデータを収集できる」「集めてから加工方針を考える」「関係性が見られる」「試しながら修正できる」というデータ活用の4つの技術的な進歩があります。

 前回は、このようなデータ活用の進歩について解説しましたが、今回は実際の企業における、データ活用のプロセスを紹介します。その一環として、前回も触れた多様なデータを元のまま保存する「データレイク(data lake)」の活用についても、詳しく紹介します。

不正確なデータからは、不正確な学習結果しか得られない

 無料のオンライン教育サービスを提供する「coursera(コーセラ)」というサイトでは、「How Google does Machine Learning」というコンテンツが公開されています。これは Google における機械学習(ML)の利用例を、実例を交えて説明しつつ、Google Cloud の上での利用につなげる、という講座です。Google内部のシステムにおける経験と、多数の企業へのML導入経験から、機械学習を実ビジネスに適用するためには何が重要であるかを、Googleのエンジニアが解説しています。

 このコンテンツでは、機械学習を活用しようと思う企業がシステムを構築するときにどこに労力を注ごうとするかを、1)KPI定義、2)データ収集、3)基盤構築、4)ML(機械学習)アルゴリズムの最適化、5)システム統合、といったフェーズに分けて説明しています。

 多くの企業は、4)のMLアルゴリズムに労力がかかると見積りがちです。しかしこの講義では、2)と3)のデータ収集と基盤構築に、ほとんどの労力を費やす必要がある、としています。さらに、既存のシステムに統合する5)のステップを加えると、4)のMLアルゴリズムにかかる労力は、極めてわずかになるといいます。

 このことから分かることは、データ活用をするためには“正しいデータを集める労力を過小評価してはならない”ということです。あたりまえですが、不正確なデータからは不正確な学習結果しか得られません。結局は、「まずはデータ整備だ」という結論になります。

SHARE

関連記事

“センスのなさ”から始める「発注力」の重要性

2021.04.20

IT&ビジネスコラム第2回

“センスのなさ”から始める「発注力」の重要性

コロナ禍の「会えない」はセールス・マーケティングの変化をどう加速させたか

2021.04.19

ニューノーマル時代にビジネスはどう変わるのか第27回

コロナ禍の「会えない」はセールス・マーケティングの変化をどう加速させたか

【激白】NTT Comの“危機感”とDX事業の勝ち筋

2021.04.15

IT&ビジネスコラム第1回

【激白】NTT Comの“危機感”とDX事業の勝ち筋

横河電機が推進する“インターナル”と“エクスターナル”両輪でのDXとは

2021.04.14

デジタルトランスフォーメーションの実現へ向けて第64回

横河電機が推進する“インターナル”と“エクスターナル”両輪でのDXとは

岸博幸氏が語る「スマートシティは“課題先進国”日本を変革する処方箋になる」

2021.04.07

ニューノーマル時代にビジネスはどう変わるのか第25回

岸博幸氏が語る「スマートシティは“課題先進国”日本を変革する処方箋になる」

味の素社のDX戦略「規模を追う経営から、DXで社会を変革するパーパス経営へ」

2021.04.02

デジタルトランスフォーメーションの実現へ向けて第63回

味の素社のDX戦略「規模を追う経営から、DXで社会を変革するパーパス経営へ」

勘と経験だけではもう通用しない。スポーツ界のデータ分析最前線

2021.03.31

これからの時代に求められるデータ利活用第9回

勘と経験だけではもう通用しない。スポーツ界のデータ分析最前線

IT部門の変革によりDXを加速!起爆剤となる「マネージドサービス」とは

2021.03.26

DXを加速させるITシステムの運用改革第38回

IT部門の変革によりDXを加速!起爆剤となる「マネージドサービス」とは

「自由な組織が新しいビジネスを生み出す」というわけではない

2021.03.26

ニューノーマル時代にビジネスはどう変わるのか第24回

「自由な組織が新しいビジネスを生み出す」というわけではない