3行要約AIが話題！“東大”発のAIプロフェッショナル集団『ELYZA』が目指す未踏の領域【前編】

一番ヶ瀬絵梨子

2021.11.28

この記事でわかること

「ELYZA DIGEST」は、どんな長文も3行に要約するAIである

自然言語処理技術の分野は、計算機の性能向上により大きく発展した

Googleの汎用言語モデル「BERT」が、2019年に人間の精度を超えた

Facebook

LINE

Hatena

SNSで大きな話題となり、公開わずか5日間で13万人が体験――

音楽やゲームなどエンタメ系の新製品のニュースのようですが、これは実は、“東大”発のAIプロフェッショナル集団による自然言語処理のAIツール「ELYZA DIGEST（イライザダイジェスト）」の話。

一見、一般人の日常生活とは縁遠く感じる最先端の「ELYZA DIGEST」がバズったのは、どんな長文でも3行に要約するというキャッチーさと、その結果の面白さ（正しくても間違っていてもシェアしたくなる！）、そして会員登録もインストールもなしに無料で試せる手軽さが理由でしょう。

開発した株式会社ELYZAは、東京大学・松尾研究室発のスタートアップ企業。いま大きな注目を集めており、2021年3月には今後著しい成長が期待されるスタートアップ企業を表彰する『EY Innovative Startup 2021』を、11月には事業や社会を前進させた方々を表彰するアワード『Forward Award 2021』にて『テクノロジー賞』を受賞しています。

今回は「ELYZA DIGEST」のお話を中心に、ディープラーニングやAI技術、自然言語処理（NLP）の現在と未来について、CEOの曽根岡侑也さんと、自然言語処理プロジェクトのリーダーを務める中村朝陽さんにインタビューしました。

３行要約AI「ELYZA DIGEST」は“我が子のような存在”

一番ヶ瀬絵梨子

「ELYZA DIGEST」、TwitterなどのSNSでかなり話題になりましたよね。どういうものか、簡単に紹介していただけますか？

中村さん

「ELYZA DIGEST」は、長文のテキストを3行に要約するツールです。読み込んだ文章をAIが解析して要約するのですが、“生成型”であることが大きな特徴です。要約の方法にはほかに「抽出型」「圧縮型」「テンプレート型」があります。

中村さん

生成型と比較しやすいのは、文章の中から必要だと思われる部分を抜き出す抽出型です。簡単で間違いが少ない方法です。一方、AIが一から要約文を作成するのが生成型。web上の文章をとにかく大量に読み込ませることで、一般常識や「この単語とこの単語は同じ意味」といった、要約に特化した学習をします。

一番ヶ瀬絵梨子

つまり……？

中村さん

わかりやすい例で言うと、抽出型だと固有名詞や日付が繰り返し登場してしまう部分で、生成型は「それ」といった代名詞や「同日」といった表現を使えます。これらが使えると文章が簡潔で読みやすくなりますし、限られた文字数を有効利用できるようになるんです。

一番ヶ瀬絵梨子

なるほど、わかりやすい！「ELYZA DIGEST」、web上で無料で使えるので私も試させていただきましたが、長文があっという間に短く要約されるのが単純に面白かったです。あれは？これは？と、延々と遊びたくなってしまいました。あの時間であの精度、すごいですよね。

平均900文字の要約で、発展途上とはいえ、この精度。平均所要時間は、人間が５分１秒に対し、ELYZA DIGESTは9.84秒。

一番ヶ瀬絵梨子

ただ、たまにトンチンカンな要約もありました。SNSでシェアしたくなるような面白さでエンタメとしては魅力でしたが、実用的という面ではまだ少し足りない、というところなんでしょうか。

中村さん

そうですね。プロダクトとしての精度としては、まだまだ改善の余地があります。要約処理は今は100％AIですが、より精度を上げるには、ディープラーニングでは難しい部分を人間の手で補正するとか、そういったことも必要になるかもしれません。

前列右から3番目が曽根岡さん、最後列右端が中村さん

一番ヶ瀬絵梨子

いま、開発チームはどれくらいの人数なんでしょうか？

中村さん

ELYZAの研究開発チームは6人で、そのうち要約処理の分野を担当しているのは3名です。要約のためのディープラーニングにはとにかく大量のデータが必要なので、その入力作業には開発とは別に人員が必要ですが。

一番ヶ瀬絵梨子

入力するデータには、制約があるんですか？ひらがな・カタカナ・漢字は分けるとか、コーポレートサイトから何文字・Wikipediaから何文字・個人ブログから何文字・SNSから何文字、と割合を決めているとか。

中村さん

ひらがな・カタカナ・漢字は分けません。混じった状態で存在しているのが自然な日本語ですからね。また、「ELYZA DIGEST」については様々なジャンルで活用できることを特徴としているので、収集元や文字数の制限も設けていません。ただ、特定のジャンルに特化したAIを開発する必要がある場合は、テキストデータの収集元を絞ることもあります。

一番ヶ瀬絵梨子

極端な例ですけど、恋愛小説なんかでは“「嫌い！」というセリフだけど、実は前後関係から推測するに「好き」のニュアンスだな”みたいなこともあるじゃないですか（笑）。どんどん学習すれば、AIはそういうのもわかるようになるんですか？

中村さん

たしかに、小説は特に難しいジャンルですね。おっしゃるようなニュアンスの問題もありますが、そもそも文章がすごく長いし、一般的な文章に比べて代名詞が指している言葉がとても遠かったりするので、そこも難関です。

一番ヶ瀬絵梨子

小説だと、指す対象を明言せずに代名詞だけで話が進行することすらありますもんね。たしかに難しそう……。でも、難しい小説を子ども向けに易しく要約するとか、ケータイ小説風にするとか、そういうことができると実用面でも娯楽としても魅力的ですね。ELYZA DIGEST、まだまだ面白いことになりそうですね。

中村さん

はい、「ELYZA DIGEST」については、我が子を見つめるような気持ちです。もっと広く使ってもらえるよう、APIの提供も視野に入れています。

一番ヶ瀬絵梨子

エンジニアを目指す人の個人開発の幅が広がったり、チャットボットのように、いろんな会社のホームページに「ELYZA DIGEST」が組み込まれたりする日も近いかもしれないんですね。楽しみです。

日本語の自然言語処理で、パラダイムシフトを起こしたい

一番ヶ瀬絵梨子

「ELYZA DIGEST」は、自然言語処理エンジンを使った要約ツールですよね。話が少し前後するかもしれませんが、自然言語処理技術そのものについて、教えてください。まずは基本中の基本、「自然言語処理技術」とは何でしょうか？

中村さん

自然言語とは人間が話す言葉のことで、自然言語処理は“言葉を機械的に処理していく工学”ということになります。英語では“Natural Language Processing”で、NLPという略称も一般的です。画像処理だと、コンピューターが画像を解析して人の顔を認識したり、被写体の色を判別したりしますよね。画像処理が先で、その後、言語処理が進歩してきています。

一番ヶ瀬絵梨子

画像処理の言語バージョンと考えると、なんとなくわかります。でも、画像処理に比べると、言語処理はあまり身近ではないような……？

中村さん

深層学習を用いた自然言語処理の理論自体は、昔からわかっていました。でも、機械に言語を学習させるには、大量のテキストデータとそれを処理するための計算機（コンピューター）が必要で、計算機の性能が追い付いてなかったんです。でも、今は違います。実はGoogleの汎用言語モデル「BERT」（英語）は、2019年に自然言語処理分野で人間を超える精度を実現しています。

一番ヶ瀬絵梨子

言語の分野でコンピューターが人間に勝てるわけがない、みたいな先入観がどうしてもあるのですが、機械が人間よりも言葉を上手に操れると……？

曽根岡さん

そうなりつつあります。計算機の処理能力向上のおかげで、パラダイムシフトが起きたんです。昔の自然言語処理AIは精度が低かったのですが、変わってきていますよ。

一番ヶ瀬絵梨子

じゃあ、すでに私たちの生活で使われていたりしますか？実は新聞記事はAIが書いてるんだよ、とか。

中村さん

新聞はまだ書いてない、と思います。でも、英語では、人間が記事の冒頭文を書くと、それに続く“ありそうな記事”をAIが想像して書くという機能が登場しています。日本人に身近なところでは、Google翻訳やGoogle検索ですね。“猫”でも“ネコ”でも“ねこ”でも、同じ検索結果になるのは、AIがそれらが同じものを指すと学習しているからだし、“かわいい動物”と検索して猫が表示されるのは、AIが“猫”は“かわいい動物”だと学習しているからなんです。

曽根岡さん

海外では「AI Dungeon」というテキストで完全に自由な対話ができるゲームが登場してきていますし、どんどん身近になっていますよ。学習プログラム自体も、どんどんアップデートされてきています。

一番ヶ瀬絵梨子

自然言語処理のAIは、どんな仕組みで学習しているんですか？“教師あり学習”といったキーワードはAIの分野でよく聞きますが……？

中村さん

2018年のBERTの論文で、自然言語処理の分野に関しては、いわゆる“教師あり学習”だけではなく“教師なし学習”を活用するほうが良いことが示され、大きな変化が起きました。これは犬、これは猫、という概念（ラベル付け）で学習するのが教師あり学習なのですが、その前にとにかく大量の文章で事前学習させる方法です。

曽根岡さん

技術的な話になるのでとても難しいと思うのですが、左がBERT以前の学習方法。例えて言うと、いきなり知らない外国語の入試問題の過去問を渡されているような状態です。一方、右のBERT以降は、過去問を見る前にその外国語のサイトをできるかぎり大量に読んで、その言語の概要を掴んでから過去問を理解していくイメージ。コンピューターの性能向上と、ベースとなるモジュールの進化、膨大なデータを読み込めるモデルの大規模化もあって学習の精度が大幅に向上し、パラダイムシフトが起きました。

一番ヶ瀬絵梨子

事前学習が必要だとわかったことに加えて、事前学習できるだけの計算機の性能向上や周辺技術の進化など、実現できる環境が整ったということなんですね。AIが発達していることは知っていましたが、ここまでとは全然知りませんでした。

曽根岡さん

英語圏では、自然言語処理のAIがすごい！とTwitterとかでもすごく盛り上がっているんですよ。なのに、日本人は誰も知らなくて、すごさを享受できてない現状がもどかしいですね。チャレンジしている企業も少ないので、未踏の領域ではありますが、パラダイムシフトを起こすしかないと思っています。

後編では、日本語特化のAIエンジン「ELYZA Brain」や自然言語処理の未来についてお話を伺います。

3行要約AIが話題！“東大”発のAIプロフェッショナル集団『ELYZA』が目指す未踏の領域【後編】

【関連リンク】

株式会社ELYZA

ELYZA DIGESTサービスサイト