NTTコミュニケーションズ

Bizコンパス

サイトメンテナンスのお知らせ(2020年10月28日(水)予定)
DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?
2020.10.14

これからの時代に求められるデータ利活用第6回

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?

著者 亀井聡

 いま、ビジネスの世界ではデータ活用に取り組む企業が増えています。その背景には「安く大量にデータを収集できる」「集めてから加工方針を考える」「関係性が見られる」「試しながら修正できる」というデータ活用の4つの技術的な進歩があります。

 前回は、このようなデータ活用の進歩について解説しましたが、今回は実際の企業における、データ活用のプロセスを紹介します。その一環として、前回も触れた多様なデータを元のまま保存する「データレイク(data lake)」の活用についても、詳しく紹介します。

不正確なデータからは、不正確な学習結果しか得られない

 無料のオンライン教育サービスを提供する「coursera(コーセラ)」というサイトでは、「How Google does Machine Learning」というコンテンツが公開されています。これは Google における機械学習(ML)の利用例を、実例を交えて説明しつつ、Google Cloud の上での利用につなげる、という講座です。Google内部のシステムにおける経験と、多数の企業へのML導入経験から、機械学習を実ビジネスに適用するためには何が重要であるかを、Googleのエンジニアが解説しています。

 このコンテンツでは、機械学習を活用しようと思う企業がシステムを構築するときにどこに労力を注ごうとするかを、1)KPI定義、2)データ収集、3)基盤構築、4)ML(機械学習)アルゴリズムの最適化、5)システム統合、といったフェーズに分けて説明しています。

 多くの企業は、4)のMLアルゴリズムに労力がかかると見積りがちです。しかしこの講義では、2)と3)のデータ収集と基盤構築に、ほとんどの労力を費やす必要がある、としています。さらに、既存のシステムに統合する5)のステップを加えると、4)のMLアルゴリズムにかかる労力は、極めてわずかになるといいます。

 このことから分かることは、データ活用をするためには“正しいデータを集める労力を過小評価してはならない”ということです。あたりまえですが、不正確なデータからは不正確な学習結果しか得られません。結局は、「まずはデータ整備だ」という結論になります。

SHARE

関連記事

未来の製造業のヒントが体感できるショールーム「スマラボ東京」オープン!

2020.10.21

デジタルトランスフォーメーションの実現へ向けて第53回

未来の製造業のヒントが体感できるショールーム「スマラボ東京」オープン!

なぜニューノーマル時代に「ゼロトラストモデル」が求められるのか

2020.10.16

ニューノーマル時代のネットワーク技術革新第2回

なぜニューノーマル時代に「ゼロトラストモデル」が求められるのか

モノだけを売る時代は終わった。データで“体験”が生み出せるか?慶大・宮田裕章教授に聞く

2020.10.09

INDUSTRY REVIEW~業界有識者が「DXの現在と未来」を語る第8回

モノだけを売る時代は終わった。データで“体験”が生み出せるか?慶大・宮田裕章教授に聞く

リアルイベントを、バーチャルでどう再現するのか?NTT Comの取り組みに迫る

2020.10.07

デジタルトランスフォーメーションの実現へ向けて第52回

リアルイベントを、バーチャルでどう再現するのか?NTT Comの取り組みに迫る

「Smart Mobility」で、クルマはもっと安全に、便利になる

2020.10.07

デジタルトランスフォーメーションの実現へ向けて第51回

「Smart Mobility」で、クルマはもっと安全に、便利になる