NTTコミュニケーションズ

Bizコンパス

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?
2020.10.14

これからの時代に求められるデータ利活用第6回

DX推進の軸となる「データレイク」とは?データウェアハウスとの違いは?

著者 亀井聡

データレイクは“魔法の箱”か?

 このデータ整備を簡単にするのが、冒頭でも触れたデータレイクです。

 これまで主流だった DWH(データウェアハウス)では、あらかじめ決められた構造のデータしか受け取ることができませんでした。しかし、ビッグデータ以降に登場したデータレイクでは、「スキーマレス」(schemaless)と呼ばれる、構造が未知なデータや、非構造化データと呼ばれる行や列を持たないデータも扱うことができます。

 データレイクは、データ分析に画期的な変化をもたらしました。DWHでは、データを集める時点で分析の目的を明らかにしたうえでシステム開発を行う必要があったのですが、データレイクではデータを集めたあとで、分析の目的を変更できるようになったのです。

 これは一見メリットですが、デメリットもあります。それは分析者に要求されるスキルや技術レベルが上がるという点です。

 DWHでは、設計時点でどのようなデータをシステムに取り込んで、どう処理して最終的なアウトプット用データに変換するかが決まっています。つまり、システムが自動的に定型的な処理をしてくれるというわけです。

 一方でデータレイクでは、取り込まれたデータを、目的に応じて加工して構造化する作業は、分析者に委ねられます。従って、これまでシステム開発としてアウトソースできていた部分を、外部委託ではなくインハウス、内製で手当てすることが重要になります。

 加えて、分析時にどういうロジックを適用するか、ロジックの変更を素早く適用することができるか、ということが競争の源泉ともなるため、特に自社のノウハウが集積されるDXや業務分析のためには、外部の企業に“外出し”することがそもそも困難になります。

 データレイクは膨大なデータを取り扱うことができるのですが、それ自体は処理のスループットを高めるだけであって、何か高度な機能が内包されているわけではありません。使いこなすためには、それなりに高度なスキルが要求されます。そういう意味では導入すれば問題が自動的に片付く魔法の箱ではない、という点に注意する必要があります。むしろ派手な可視化機能を持つようなソリューションと比較すると地味な印象を与えるかもしれません。

SHARE

関連記事

【激白】NTT Comの“危機感”とDX事業の勝ち筋

2021.04.15

IT&ビジネスコラム第1回

【激白】NTT Comの“危機感”とDX事業の勝ち筋

横河電機が推進する“インターナル”と“エクスターナル”両輪でのDXとは

2021.04.14

デジタルトランスフォーメーションの実現へ向けて第64回

横河電機が推進する“インターナル”と“エクスターナル”両輪でのDXとは

岸博幸氏が語る「スマートシティは“課題先進国”日本を変革する処方箋になる」

2021.04.07

ニューノーマル時代にビジネスはどう変わるのか第25回

岸博幸氏が語る「スマートシティは“課題先進国”日本を変革する処方箋になる」

味の素社のDX戦略「規模を追う経営から、DXで社会を変革するパーパス経営へ」

2021.04.02

デジタルトランスフォーメーションの実現へ向けて第63回

味の素社のDX戦略「規模を追う経営から、DXで社会を変革するパーパス経営へ」

勘と経験だけではもう通用しない。スポーツ界のデータ分析最前線

2021.03.31

これからの時代に求められるデータ利活用第9回

勘と経験だけではもう通用しない。スポーツ界のデータ分析最前線

IT部門の変革によりDXを加速!起爆剤となる「マネージドサービス」とは

2021.03.26

DXを加速させるITシステムの運用改革第38回

IT部門の変革によりDXを加速!起爆剤となる「マネージドサービス」とは

「自由な組織が新しいビジネスを生み出す」というわけではない

2021.03.26

ニューノーマル時代にビジネスはどう変わるのか第24回

「自由な組織が新しいビジネスを生み出す」というわけではない

DX成功の鍵“あらゆる組織がデータを活用できる環境”はどう実現するのか

2021.03.24

デジタルトランスフォーメーションの実現へ向けて第62回

DX成功の鍵“あらゆる組織がデータを活用できる環境”はどう実現するのか

セブン-イレブンの次世代データ利活用基盤を支えるネットワークとは

2021.03.23

DXを加速させるITシステムの運用改革第37回

セブン-イレブンの次世代データ利活用基盤を支えるネットワークとは