NTTコミュニケーションズ

Bizコンパス

データ、アナリティクス、AIの2021年を占う(1)–DWHとデータレイク、民主化、倫理
2021.02.25

IT&ビジネス最新ニュース第114回

データ、アナリティクス、AIの2021年を占う(1)–DWHとデータレイク、民主化、倫理

 筆者の元にはデータ/アナリティクス業界の企業幹部や著名な人物から、年末が近付く頃に翌年の予想が数多く寄せられてくる。筆者が今回受け取った2021年の予想をまとめると、その量は49ページもの長大なものになった。

 それらすべてをここで紹介するのは無理だが、30社を超える企業の幹部らによる2021年の予想について以下にまとめてみた。その中には、ClouderaやDatabricks、Micro Focus、Qlik、SAS、Snowflakeをはじめとする著名なデータ/アナリティクス企業の幹部による予想が含まれている。また、Andreessen HorowitzやDeloitte AI Institute、O’Reillyといった企業の幹部らとともに、小規模だが業界で重要な位置を占めている企業の幹部らによる見解も含まれている。

 本記事ではこうした予想をグループ化し、データウェアハウス対データレイクや、人工知能(AI)の民主化、責任あるAI、AIとビジネスインテリジェンス(BI)の融合、データリテラシーの発達、データガバナンスの必要性、そしてもちろん、アナリティクスと新型コロナウイルス感染症(COVID-19)のパンデミックの間の相互作用といったテーマに分類している。前置きはこれにくらいにして、2021年の予想を紹介したい。

データウェアハウス対データレイク:共存は可能か?

 2020年によく採り上げられた話題の1つは、アナリティクスに対するデータウェアハウスアプローチとデータレイクアプローチの力量の比較や、どちらが最終的に生き残るかというものだった。

 Snowflakeの元最高経営責任者(CEO)であるBob Muglia氏は、画像や動画を含む、あらゆるデータソースからのデータがデータウェアハウス内で適切に処理できるようになる日が「2~3年のうちに訪れ、データレイクはとどめを刺されることになるだろう」と述べている。またMicro Focusでオープンソースリレーションズのマネージャーを務めるPaige Roberts氏は「『Vertica』のような堅牢かつ信頼できるアナリティクス向けデータベースを構築するだけで10年以上を要するため、データウェアハウスベンダーらは(データレイクベンダーらが)追いつけないほど先を走っているといえる。データレイクベンダーらは、まだ10年程度の歴史しか有しておらず、追いつくことに懸命になっている段階だ」と感じている。

 FivetranのCEOであるGeorge Fraser氏は「2021年には、モダンなデータスタックにおけるデータレイクの必要性が低下している事実が明らかになると考えている」とし、この点に加えて「(中略)ストレージからコンピュートを切り離したデータウェアハウスの登場によって、データレイクを採用するという技術面からの理由はもはや存在していない」と述べている。そして、これだけでは納得できないという人のために、Fraser氏は「モダンなデータスタックの世界では、データレイクは最適なソリューションたり得ない。データレイクは既にレガシーなテクノロジーになりつつある」と総括している。

 一方、データレイクの支持者らはさらに熱く意見を語っている。Dremioの共同創業者であるTomer Shiran氏は「The Data Lake Can Do What Data Warehouses Do and Much More」(データレイクはデータウェアハウスができる以上のことができる)と題した予想の中で、「歴史的に見た場合、データウェアハウスは(中略)データレイクよりも優れていた。しかし昨今、データティアーにおけるオープンソースのイノベーションが生み出される中、こうした状況は変わりつつある」と述べている。同氏はそのようなイノベーションの例として「Apache Parquet」と「Delta Lake」に言及するとともに、まだそれほど知られていない「Apache Iceberg」や「Nessie」というプロジェクトに言及した。これらプロジェクトのおかげで、データはファイルシステムをまたがったオープンなカラムナフォーマットで保存され、バージョン管理されるとともに、トランザクションの整合性を維持したまま処理できるようになっている。

 Andreessen HorowitzのゼネラルパートナーであるMartin Casado氏は、「データレイクとデータアナリティクスのユースケースに目を向けると、大きく異なっていると分かるはずだ。データレイクは非構造化データに多く用いられ、コンピュート集約型であり、オペレーショナルAIに特化する傾向がある。オペレーショナルAIのユースケースの方が大きく、迅速に成長している。長期的に見ると、最終的にすべてを飲み込むのはデータレイクだと考えられるはずだ」と述べている。

 「PrestoDB」をベースにしたアナリティクス製品を手掛けているAhanaの共同創業者で最高製品責任者(CPO)のDipti Borkar氏は「クラウドがメインストリームレベルの普及段階に達し、企業は自社データの大半をクラウド上で生成、保管するようになっている(特に、コスト効率に優れた『Amazon S3』ベースのデータレイクが利用されている)」と述べている。同氏の同僚である、Ahanaの最高技術責任者(CTO)を務めるDavid Simmen氏は「フェデレーション(連携)化されている分散スタック(中略)によって、従来型のデータウェアハウスが緊密に結合されたデータベースに置き換えられつつある」と述べている。またSimmen氏は「(中略)従来型のデータウェアハウスが緊密に結合されたデータベースというアーキテクチャーは、レガシーなワークロード向けのものになる」と確信してもいる。

 Databricksでの戦略は、データレイクテクノロジーにフォーカスしつつ、データウェアハウス的な品質を取り込んでいくというものだ。Databricksのマーケティング担当バイスプレジデントを務めるJoel Minnick氏はこれについて、「われわれは現在具現化しつつあるこのビジョンを、レイクハウスと呼んでいる。これによって、データレイクにデータウェアハウス並みのパフォーマンスと信頼性、品質、スケーラビリティーをもたらす、構造化されたトランザクションレイヤーが提供される。その結果、かつてはレガシーなデータウェアハウスを必要としていたユースケースの多くが、データレイクだけで実現できるようになる」と説明している。

 そういったものを有していない企業はどうするのだろうか?O’Reillyのコンテンツ戦略担当バイスプレジデントを務めるRachel Roumeliotis氏は、データレイクとレイクハウスというモデルの有効性を認め、「データレイク、特にクラウドデータレイクはここ数年で着実に息を吹き返してきている(中略)これについては2021年においても目を離せないだろう。同様に、データレイクとデータウェアハウスの特徴を有するデータレイクハウスというアーキテクチャーは、2020年に勢いを増してきており、2021年も目覚ましい成長を続けるだろう」と語っている。Roumeliotis氏は、ウェアハウスモデルに対しても肯定的であり、「クラウド上でのデータウェアハウスのエンジニアリングは、データベースソリューションがますますクラウドに向かう中で、特に注目されるものとして発展していく」と述べている。

 データレイクに対するクエリーを得意としつつ、データウェアハウスや数々のデータソースへの接続も可能な「Trino」(旧称「PrestoSQL」)を手掛けるStarburstでCEOを務めているJustin Borgman氏は、「ビジネスのリーダーたちは、データのある場所がクラウドかオンプレミス、データレイク、データウェアハウスであるかに関係なく、あらゆる種類のデータを網羅したデータ駆動型の意思決定を採用するようになるだろう」と述べている。

※この記事はZDNet Japanから配信されています。

SHARE

関連記事

コロナ禍の「会えない」はセールス・マーケティングの変化をどう加速させたか

2021.04.19

ニューノーマル時代にビジネスはどう変わるのか第27回

コロナ禍の「会えない」はセールス・マーケティングの変化をどう加速させたか

企業がデータサイエンティストの才能を引き出すためにはどうすれば良いのか

2021.04.12

注目を集める「データサイエンティスト」の将来第2回

企業がデータサイエンティストの才能を引き出すためにはどうすれば良いのか

データサイエンティストに求められる3つの能力とは

2021.04.02

注目を集める「データサイエンティスト」の将来第1回

データサイエンティストに求められる3つの能力とは

コロナ禍だからこそできる、バーチャルな体験で集客する方法

2021.03.19

ニューノーマル時代におけるCXの新潮流第4回

コロナ禍だからこそできる、バーチャルな体験で集客する方法

顧客に会えない時代に、どうすれば商談を作れるのか?

2021.03.19

ニューノーマル時代におけるCXの新潮流第3回

顧客に会えない時代に、どうすれば商談を作れるのか?

今こそ営業戦略にあったデジタルマーケティングを!NTT Comデジマ事例

2021.03.19

ニューノーマル時代におけるCXの新潮流第2回

今こそ営業戦略にあったデジタルマーケティングを!NTT Comデジマ事例

デジタルとリアルを掛け合わせれば、顧客体験の価値は最大化できる

2021.03.12

ニューノーマル時代に求められる顧客体験の設計第2回

デジタルとリアルを掛け合わせれば、顧客体験の価値は最大化できる

消費者はコロナ禍を経て、新たなデジタル顧客体験を求めている

2021.02.17

ニューノーマル時代に求められる顧客体験の設計第1回

消費者はコロナ禍を経て、新たなデジタル顧客体験を求めている

Afterコロナ時代に求められるオンライン営業とは?

2021.02.12

ニューノーマル時代にビジネスはどう変わるのか第19回

Afterコロナ時代に求められるオンライン営業とは?

2021年に押さえておきたい8つのアナリティクス業界トレンド

2021.02.08

IT&ビジネス最新ニュース第107回

2021年に押さえておきたい8つのアナリティクス業界トレンド