PaLM 2がリリース
Googleは、現地2023年5月10日に開催したGoogle I/O 2023において、大規模言語モデル(LLM)PaLMの最新版であるPaLM 2を発表しました。発表当日から自社製品・サービスへの導入を開始しています。ここでは、発表内容から特徴や導入サービスを中心に解説していきます。
【参考】:PaLM 2 【参考】:Google Japan Blog: PaLM 2 のご紹介 【参考】:Google I/O 2023: Making AI more helpful for everyone
そもそもPaLMとは
PaLMとは、Googleの開発した大規模言語モデル(LLM)を指します。PaLMは「Pathways Language Model」の略で、読み方はパームです。アクセラレータを用いた分散計算をオーケストレーションする仕組みを持ちます。
PaLMは5,400億パラメータの性能を持つ言語モデルで、英語を主要言語としたジョークを理解したりコード生成を行ったりすることができるモデルです。2022年4月にリリースされており、1年後の今年にはPaLM2として最新版を発表しています。
【参考】:Google Research Blog: Pathways Language Model (PaLM)
PaLM 2の概要と強化機能
PaLM 2は、昨年リリースしたPaLMの研究開発に基づく次世代の大規模言語モデルです。AIの倫理的なGoogleのアプローチにより提供され、多言語処理や自然言語の生成、コードや推論などを行います。PaLM 2で強化された機能は大まかに以下の項目が挙げられます。
・推論 PaLMから強化されたポイントの1つです。複雑なタスクをサブタスクに分解することができるので、自然言語においても言葉の持つニュアンスを理解できます。これにより、あいまいな言い回しや比喩、慣用句などを理解します。同様に論理的な推論や常識に基づくものまでカバーします。
・多言語処理 PaLM 2では並列処理の性能を発揮し、多言語テキストを100以上の多くの言語で事前に学習済みです。各言語で使われる慣用句や言い回しなども、事前に学習されており、言語生成や翻訳などの性能が向上しています。
・コーディング PythonやJavaScriptなどの一般的なプログラミング言語は、大量のウェブページやソースコードで事前に学習済みです。さらに科学技術計算などで用いるFortranや論理プログラミングのProlog、ハードウェア設計のVerilogなども事前学習しています。
【参考】:PaLM 2
多言語でジョークを評価
PaLMは、大規模言語モデルの高性能化により多言語に対応します。Googleは、多言語機能と推論機能を検証するために、技術報告書「PaLM 2 Technical Report」を公開しています。技術報告書では、専門的な試験の合格率や性能スケーリングなどの評価結果が掲載されています。
特筆すべきは、ジョークが正しく理解できているかなども調査されていることです。日本語では、ジョークやダジャレ、俳句などがどのように理解されているか公表されています。
”おでんの予約は?お電話で!”、”食べ過ぎる 今食べるのは 明日の分”など、日本語が分かると吹き出しそうな言い回しですが、技術報告書ではこれらがまじめに解説されています。
PaLM 2の構築手法
PaLM 2では、モデルサイズと学習データセットのサイズを比例させて、計算スケールする手法をとっています。従来よりも推論の高速化やパラメータの削減、コスト削減などの全体の最適化が図られています。これにより従来英語のみであった事前学習データセットを多言語に拡張し、学習することが可能になりました。
PaLM 2の Googleサービスへの導入
PaLM 2は、リリース開始から25以上のGoogleサービスへ導入されています。PaLM 2を使うには、導入済み製品やサービスを用いて行います。具体的な導入製品・サービスは、以降で解説していきます。
Bard
Bardは、Googleが提供する対話型AIサービスで、試験運用として提供されます。PaLM 2リリースにより、日本語と韓国語に対応します。PaLM 2を実際に体感する際には、まずはBardを利用すると良いでしょう。
将来的には、Google検索への導入も視野に入っているとされ、米国では限定ユーザー向けに「Search Generative Experience」(SGE)の公開も始まっています。
Googleは、Adobe Fireflyとのパートナー契約も結んだことを明らかにしており、近い将来にはBardからAdobe Fireflyを利用することが可能になる予定です。
【参考】:Bard 【参考】:Google Blog: Supercharging Search with generative AI 【参考】:Adobe Blog: Google Bardとの連携により、数百万人のGoogleユーザーのもとに Adobe FireflyとAdobe Expressを
PaLM API
PaLM APIにより、PaLM 2のようなGoogleの大規模言語モデルをAPIから利用することができます。具体的には、コンテンツ生成や対話による助言、要約・分類・リコメンデーションなどの生成AIアプリケーションの構築を容易にしてくれます。プライベートプレビューとして公開しており、利用するには、ウェイティングリストに登録が必要です。
【参考】:PaLM API 【参考】:Google Developers: PaLM API & MakerSuite
MakerSuite
MakerSuiteは、機械学習の専門知識をもたずとも生成AIのプロトタイプを構築することができるサービスです。テキストやデータ、チャットを用いて独自のプロトタイプを構築し、プロンプトの作成やデータセットの拡張、独自モデルのチューニングなどを行うことができます。
MakeSuiteでは、普段お使いのPythonやNode.jsなどへのコード出力も可能です。こちらもプライベートプレビューのため利用するには、ウェイティングリストに登録が必要です。
【参考】:MakerSuite 【参考】:Google Developers: PaLM API & MakerSuite
Vertex AI
Vertex AIは、Google Cloudの機械学習プラットフォームです。企業向けのAIサービスで、モデルのデプロイおよび維持を迅速に行うことができます。「Generative AI Studio」のシンプルなUIや、Vertex AI APIで生成AI機能を操作していきます。
本サービスは、最新のAI機能をTrusted Tester Programのウェイティングリストに登録して使用します。
【参考】:Vertex AI 【参考】:Google Cloud Blog: Google Cloud、ジェネレーティブ AI を 開発者、企業、政府に提供
Workspace
Workspaceは、ビジネス向けスイート製品です。Gmailやカレンダー、Meet・Chat・ドライブ・ドキュメント・スプレッドシート・スライド・フォーム・サイトなどが含まれます。Workspaceでは、生成AIがドキュメントと Gmailに組み込まれ、文章の下書きや書き出しなどのサポートを予定しています。
PaLM 2はGoogleの生産性を向上させる
PaLM 2は、GeckoやOtter、Bison・Unicornと名付けられたいくつかのモデルがあります。モバイルデバイス向けには、「Gecko」という軽量でオフライン利用できるモデルが提供される見込みです。
「Gemini」と呼ばれる、Googleのツール統合を想定した次世代マルチモーダルUIも開発中です。これらの新機能は、順次Googleの製品・サービスに統合されていき、利用者の操作性や生産性を向上させるでしょう。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから