NTTコミュニケーションズ

Bizコンパス

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?
2020.10.14

これからの時代に求められるデータ利活用第6回

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?

著者 亀井聡

 いま、ビジネスの世界ではデータ活用に取り組む企業が増えています。その背景には「安く大量にデータを収集できる」「集めてから加工方針を考える」「関係性が見られる」「試しながら修正できる」というデータ活用の4つの技術的な進歩があります。

 前回は、このようなデータ活用の進歩について解説しましたが、今回は実際の企業における、データ活用のプロセスを紹介します。その一環として、前回も触れた多様なデータを元のまま保存する「データレイク(data lake)」の活用についても、詳しく紹介します。

不正確なデータからは、不正確な学習結果しか得られない

 無料のオンライン教育サービスを提供する「coursera(コーセラ)」というサイトでは、「How Google does Machine Learning」というコンテンツが公開されています。これは Google における機械学習(ML)の利用例を、実例を交えて説明しつつ、Google Cloud の上での利用につなげる、という講座です。Google内部のシステムにおける経験と、多数の企業へのML導入経験から、機械学習を実ビジネスに適用するためには何が重要であるかを、Googleのエンジニアが解説しています。

 このコンテンツでは、機械学習を活用しようと思う企業がシステムを構築するときにどこに労力を注ごうとするかを、1)KPI定義、2)データ収集、3)基盤構築、4)ML(機械学習)アルゴリズムの最適化、5)システム統合、といったフェーズに分けて説明しています。

 多くの企業は、4)のMLアルゴリズムに労力がかかると見積りがちです。しかしこの講義では、2)と3)のデータ収集と基盤構築に、ほとんどの労力を費やす必要がある、としています。さらに、既存のシステムに統合する5)のステップを加えると、4)のMLアルゴリズムにかかる労力は、極めてわずかになるといいます。

 このことから分かることは、データ活用をするためには“正しいデータを集める労力を過小評価してはならない”ということです。あたりまえですが、不正確なデータからは不正確な学習結果しか得られません。結局は、「まずはデータ整備だ」という結論になります。

SHARE

関連記事

ゼロトラストを目指し境界防御から無害化に、ネオファースト生命はどう移行したか?

2021.06.16

セキュリティ対策に求められる新たな視点第24回

ゼロトラストを目指し境界防御から無害化に、ネオファースト生命はどう移行したか?

JALは新しいナレッジシステムで、次世代のコンタクトセンターを目指す

2021.06.11

いま求められる“顧客接点の強化”第36回

JALは新しいナレッジシステムで、次世代のコンタクトセンターを目指す

早大IT戦略研究所 根来龍之氏 「日本の大企業だけがDXに後れを取っているわけではない」

2021.06.04

デジタルトランスフォーメーションの実現へ向けて第67回

早大IT戦略研究所 根来龍之氏 「日本の大企業だけがDXに後れを取っているわけではない」

企業の価値を高める「SX」とは何か?有識者が解説

2021.06.02

デジタルトランスフォーメーションの実現へ向けて第66回

企業の価値を高める「SX」とは何か?有識者が解説

AIが営業のネクストアクションを示唆! 〇〇〇で営業の生産性向上を目指す

2021.05.28

これからの時代に求められるデータ利活用第10回

AIが営業のネクストアクションを示唆! 〇〇〇で営業の生産性向上を目指す

新規事業立ち上げ時に考えるべき4箇条

2021.05.27

ニューノーマル時代にビジネスはどう変わるのか第28回

新規事業立ち上げ時に考えるべき4箇条