NTTコミュニケーションズ

Bizコンパス

AIは、コロナに便乗した「フェイクニュース」を見抜けるようになる
2020.08.28

With/AfterコロナにおけるAI技術の可能性第3回

AIは、コロナに便乗した「フェイクニュース」を見抜けるようになる

著者 島田健一郎

 COVID-19(新型コロナウイルス)の世界的な流行に対し、AIは治療や診断、感染規模拡大の予測などで、人類を助ける存在となっています。

 当連載では過去2回に渡り、AIのCOVID-19に対する貢献を取り上げてきましたが、実はAIは、医療分野以外でも、COVID-19の解決に寄与します。たとえば、デマ情報や誹謗中傷ツイートなどの対策にもなりうるのです。

 コロナ禍だけでなく、たとえば自然災害下などでは、誰しもが不安を抱えながら生活をせざるを得なくなります。そういった状況においては、不安心理を煽るような様々なデマ情報が出回ることがあります。今回はこうしたデマ情報に対し、有効と考えられるAI関連技術の取り組みについて紹介します。

AIが人間以上の文章を作成できる時代になった

 AIはどのように、デマ情報を見抜くのか?その鍵となる技術が「自然言語処理」です。

 自然言語処理とは、日常我々人間が使っている自然言語をコンピュータに処理させる一連の技術です。特に、曖昧な表現、意図の解釈、文脈の理解などがとても困難でしたが、ディープラーニングを始めとした機械学習技術により、ここ数年で大きな発展を遂げています。

 特に2018年にGoogle社が発表したBERT(Bidirectional Encoder Representations from Transformers)は、様々な言語処理タスクにおいて圧倒的なスコアを出し、実際の課題に対する解決にもつながっています。スマートスピーカーやチャットボットなどは、その代表例と言えます。

 BERTはその名称の通り、文章を文頭からと文末からの双方向(Bidirectional)に学習するモデルであり、「Transformer」という、Attention(文中における単語の意味を理解する時に、文中の単語のどれに注目すれば良いかをスコアで出力する仕組み)を活用したニューラルネットワークモデルを採用しています。

 さらにBERTは事前学習モデル(あらかじめ学習させてあるAIモデル)であり、ファインチューニング(既存のモデルを再利用し、新しいモデルを構築する手法)を行うことで、特定タスクの精度が向上するため、応用範囲が広がります。効果として、「文脈の理解」が大きく高まったことが挙げられます。

 Googleの紹介記事では、検索エンジンにおける文脈理解の活用事例が紹介されています。例えば“2019 brazil traveler to usa need a visa”(2019年にブラジルの旅行者がアメリカへ行くときに、ビザが必要か?)という検索ワードの場合、過去の技術では文脈理解のための前置詞“to”の解釈が出来ておらず、“U.S. citizens traveling to Brazil”(アメリカ人がブラジルに旅行する)と解釈したような結果が表示されていました。

 ところが、このBERTを導入した後には、“to”の意味も含めて正しく文脈が解釈され、ブラジル人旅行者がアメリカへ旅行するために必要な「B-2ビザ」を紹介する米国大使館のサイトがトップに表示されるようになりました。

 もう一つ、2020年に触れておかなければならない自然言語処理技術として「GPT-3」が挙げられます。

 GPT-3はOpenAIが開発した言語生成モデルであり、「文章生成レベルが人間のレベルを超えた」と話題になりました。学習には、巨大なニューラルネットワークとビッグデータを用いています。GPTとは“Generative Pretrained Transformer”の略で、その名の通り、Transformerを用いた事前学習型の言語生成モデルとなります。

 簡単に言うと、文章の流れで「次に来る単語」の予測を事前学習したものです。非常に強力なモデルで、文脈(コンテキスト)理解ができるため、質疑応答や翻訳といった様々な個別タスクもこなせてしまうレベルです。学習をするために、3000億の字句を含む大規模なデータセットを用い、ニューラルネットワークのパラメータ数も1750億という、巨大なネットワークとなっています。

 APIが公開されているため、様々な開発者がこれを使ったアプリケーションを作成しています。中でも、スタートアップのdebuild.co社が公開した自然言語からWebページを生み出すサイトを用いた取り組み事例は、「指示を出せば、コーディングをせずにWebページに必要なプログラムが生み出せる」として、大きな話題となりました。さらにGoogleのサイト自体を同様の方法で再現しており、GPT-3の凄さが理解できます。

 

SHARE

関連記事

「DX人材」に必要なキャリアとスキルとは?エバンジェリストが解説

2020.12.02

エバンジェリストが解説「5分でわかるITトレンド」第11回

「DX人材」に必要なキャリアとスキルとは?エバンジェリストが解説

エバンジェリストが回答!DXを阻むサイロ化をどう解決すればいいのか

2020.12.02

エバンジェリストが解説「5分でわかるITトレンド」第10回

エバンジェリストが回答!DXを阻むサイロ化をどう解決すればいいのか

コロナ禍でもデジタル志向企業のIT投資は衰えず–ITR調査

2020.11.26

IT&ビジネス最新ニュース第82回

コロナ禍でもデジタル志向企業のIT投資は衰えず–ITR調査

新ビジネスはSDGsから生まれる!エバンジェリストが解説

2020.11.25

デジタルトランスフォーメーションの実現へ向けて第54回

新ビジネスはSDGsから生まれる!エバンジェリストが解説

DX部門を立ち上げたらどうなるのか?実際の企業に見る、DXの理想と現実

2020.11.20

これからの時代に求められるデータ利活用第7回

DX部門を立ち上げたらどうなるのか?実際の企業に見る、DXの理想と現実

従業員を固定電話から解放、第一生命の“スマホで加速する”働き方改革

2020.11.20

働き方改革&生産性向上のカギはどこにある?第30回

従業員を固定電話から解放、第一生命の“スマホで加速する”働き方改革

トヨタが「Woven City」で狙うのは、DXのプラットフォーマー

2020.11.18

ニューノーマル時代にビジネスはどう変わるのか第12回

トヨタが「Woven City」で狙うのは、DXのプラットフォーマー