NTTコミュニケーションズ

Bizコンパス

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?
2020.10.14

これからの時代に求められるデータ利活用第6回

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?

著者 亀井聡

 いま、ビジネスの世界ではデータ活用に取り組む企業が増えています。その背景には「安く大量にデータを収集できる」「集めてから加工方針を考える」「関係性が見られる」「試しながら修正できる」というデータ活用の4つの技術的な進歩があります。

 前回は、このようなデータ活用の進歩について解説しましたが、今回は実際の企業における、データ活用のプロセスを紹介します。その一環として、前回も触れた多様なデータを元のまま保存する「データレイク(data lake)」の活用についても、詳しく紹介します。

不正確なデータからは、不正確な学習結果しか得られない

 無料のオンライン教育サービスを提供する「coursera(コーセラ)」というサイトでは、「How Google does Machine Learning」というコンテンツが公開されています。これは Google における機械学習(ML)の利用例を、実例を交えて説明しつつ、Google Cloud の上での利用につなげる、という講座です。Google内部のシステムにおける経験と、多数の企業へのML導入経験から、機械学習を実ビジネスに適用するためには何が重要であるかを、Googleのエンジニアが解説しています。

 このコンテンツでは、機械学習を活用しようと思う企業がシステムを構築するときにどこに労力を注ごうとするかを、1)KPI定義、2)データ収集、3)基盤構築、4)ML(機械学習)アルゴリズムの最適化、5)システム統合、といったフェーズに分けて説明しています。

 多くの企業は、4)のMLアルゴリズムに労力がかかると見積りがちです。しかしこの講義では、2)と3)のデータ収集と基盤構築に、ほとんどの労力を費やす必要がある、としています。さらに、既存のシステムに統合する5)のステップを加えると、4)のMLアルゴリズムにかかる労力は、極めてわずかになるといいます。

 このことから分かることは、データ活用をするためには“正しいデータを集める労力を過小評価してはならない”ということです。あたりまえですが、不正確なデータからは不正確な学習結果しか得られません。結局は、「まずはデータ整備だ」という結論になります。

SHARE

関連記事

ビジネスリーダーは、DXサービスを「完成品」と見なす感覚を捨てるべし

2021.01.22

ニューノーマル時代にビジネスはどう変わるのか第16回

ビジネスリーダーは、DXサービスを「完成品」と見なす感覚を捨てるべし

雑談が一番難しい会話型AIの今後とは?

2021.01.21

IT&ビジネス最新ニュース第100回

雑談が一番難しい会話型AIの今後とは?

パラダイムシフトに直面する製薬業界、 ニューノーマル時代に求められるMR像とは

2021.01.20

ニューノーマル時代にビジネスはどう変わるか第1回

パラダイムシフトに直面する製薬業界、 ニューノーマル時代に求められるMR像とは

SOMPOひまわり生命は“無害化”で安全にWeb閲覧できるセキュリティを実現

2021.01.20

セキュリティ対策に求められる新たな視点第21回

SOMPOひまわり生命は“無害化”で安全にWeb閲覧できるセキュリティを実現

中村 伊知哉氏が語る 「デジタル化がもたらす“仕事”と“働き方”の変化」

2021.01.20

ニューノーマル時代にビジネスはどう変わるのか第15回

中村 伊知哉氏が語る 「デジタル化がもたらす“仕事”と“働き方”の変化」

データ分析の膨大な手間を“1クリック”で解決する方法がある

2021.01.15

これからの時代に求められるデータ利活用第8回

データ分析の膨大な手間を“1クリック”で解決する方法がある

経済産業省が「GビズID」で目指す“行政サービスの100%デジタル化”

2021.01.13

デジタルトランスフォーメーションの実現へ向けて第57回

経済産業省が「GビズID」で目指す“行政サービスの100%デジタル化”

デジタル変革、組織内での格差で生じる課題

2021.01.12

IT&ビジネス最新ニュース第96回

デジタル変革、組織内での格差で生じる課題

ゼロトラストで“リモートワークをオフィス並み”にセキュアにする方法

2021.01.08

セキュリティ対策に求められる新たな視点第20回

ゼロトラストで“リモートワークをオフィス並み”にセキュアにする方法