Gemini Proとは?
Google社のAIボットとしては「Bard」が知られていましたが、名称が「Gemini」に変更されました。「Gemini」はGoogle社が開発し、提供する会話型AIチャット、生成AIの全般を表す新ブランド名です。
Geminiはこれまでの「大規模言語モデル」という名称に加え、対話型AIチャット、Google WorkSpace、Android向けのアプリなどでもGeminiブランドが用いられています。
この記事では、Geminiの上位モデルであるGemini Proの概要、メリットやデメリットについて解説します。新たに生成AIを利用してみたい方、ChatGPTと比較・併用してみたい方、ビジネスや研究開発での利用を検討している方はぜひ参考にしてください。
【参考】:Gemini Pro|Google DeepMind | Google 【参考】:Gemini と話してアイデアを広げよう | Google
Gemini Proでできること
Gemini Proは、Google AIが開発したマルチモーダル(多機能)生成AIモデルです。Gemini Proにおけるマルチモーダルとは、テキストや画像、音声、動画などの様々な種類の情報を処理して、精度の高いアウトプットを提供することです。
では、具体的にマルチモーダル生成AIと言われるGemini Proでは何ができるのかを見ていきましょう。
テキストの生成
テキスト生成において、文章や詩、ソースコード、劇の台本、音楽作品、メール、手紙など、まるで人が作成したかのような、自然言語によるテキストの生成ができます。また、音声ファイルから文字起こしを行うこともできます。
画像の生成
人が口語体で指示した説明を理解し、意図を読み取り、指示者の意図に合う画像を生成することができます。
ただし、過剰な補正によって不自然な画像を生成したり、肖像権やプライバシー保護に抵触する画像が生成されたり、倫理的に問題がある画像が生成されたりといった問題があり、Googleは2024年6月現在(執筆時点)では画像生成機能の提供を止めています。
多言語間の翻訳
高い精度で100以上の言語を自然な文章で翻訳ができるだけでなく、動画などマルチモーダルデータの翻訳にも対応しています。
コードの生成
Python、Java、C++、Goなど、様々なプログラミング言語を理解します。コード生成からコードレビュー、デバッグからテストデータの生成まで実行することができるため、プログラミングの効率化を図れます。
質問への回答
自然言語を理解しつつ、複雑な論理でも理解して推論を行えます。また、様々な分野に関する専門的な知識を蓄積しており、あらゆる質問に迅速に回答することが可能です。
Gemini Proの利用シーン
Gemini Proはどのような利用シーンに適しているのか、確認しておきましょう。ここで挙げる4つの利用シーンが想定されます。
研究開発分野
論文調査や分析、仮説検証や実験結果の解析、新しいアイデアの創出などで、新薬の開発や、新しい材料の開発など、研究開発における複雑なタスクを実行するのに役立ちます。
ビジネス領域
ターゲット顧客に合わせた広告やマーケティング資料の作成、顧客からの問い合わせ対応の自動化など、営業資料の作成、商品開発などビジネスにおける様々なタスクを効率化することができます。
教育分野
eラーニング教材などの学習支援ツールの作成や、生徒個々人のニーズやレベルに合わせた個別指導など、教育における様々なタスクを支援することができます。
エンターテイメント分野
小説や脚本の作成、音楽制作、ゲーム開発、映像作成など、エンターテイメント業界における様々な創作活動に役立てることができます。
Geminiのラインアップ
GeminiにはGemini Pro以外にもいくつかラインアップがあり、種類によって性能や用途が異なります。また料金も有償と無償とがあり、執筆時点(2024年6月)では、次の4種類がGeminiとして提供されています。
Gemini Nano
Androidスマホなどモバイルデバイス向けに最適化されたモデルですが、Web版であれば、デバイスを問わず利用できます。Gemini Nanoは処理速度が速く、軽量で低遅延な動作が特徴です。
商用利用はできず、リクエスト数や文字数には制限がありますが、一般的な使い方をする限り、無料枠内で不足を感じることはありません。
【参考】:Gemini Nano|Google DeepMind | Google
Gemini Flash
2024年5月15日に登場した新モデルです。Googleによると、Gemini FlashはGemini Nanoの10倍のスピードを実現しており、また100万トークンのコンテキストウィンドウを有することで、大規模かつ高頻度のタスクに最適化されています。
また無料プランも用意されています。Gemini Flashのインターフェースは英語のみで、日本語対応が遅れていますが、日本語入力は可能です。使い方は他のGeminiと同じで、プロンプトに日本語で入力し、右側にある[Run]ボタンをクリックするだけです。
【参考】:Gemini Flash|Google DeepMind | Google
Gemini Pro
幅広いタスクに対応できる汎用性の高いモデルです。高精度な文章の生成や翻訳、コード生成などの機能が備わっています。無料プランは設けておらず、月額1,000円のGemini Pro Basicから、月額5,000円のPro Advancedがありますが、2ヶ月間は無料お試しができます。
Basicでは1日あたりのリクエスト数は20,000回までですが、Advancedは無制限です。他に法人向けのGemini Pro Enterpriseがあります。法人向けでは、セキュリティとコンプライアンスに重点を置いた機能が強化され、オンプレミス版のオプションも提供されます。
【参考】:Gemini Pro|Google DeepMind | Google
Gemini Ultra
最も高性能な最上位モデルで、複雑なタスクや大規模なデータ処理にも対応できます。研究開発や高度な分析などに利用されています。研究開発、高度な分析や大規模なデータ処理に向いています。
Gemini Ultraは、Gemini Advancedという有料プランで利用できます。Gemini Advancedの月額料金は2,900円であり、登録から2ヶ月間は無料で利用可能です。
【参考】:Gemini Ultra|Google DeepMind | Google
Gemini Proのメリットとデメリット
ここでは、Gemini Proのメリットとデメリットについて見てみましょう。Geminiを利用する際には様々な選択肢がありますので、他のモデルと比較したメリットとデメリットを理解し、納得した上で利用することをおすすめします。
メリット
Gemini Proは無料で利用できるGemini Nanoと比較して、以下の挙げるように、主にパフォーマンス面でメリットがあります。
▪高い処理速度 従来の無料プランやNanoモデルと比較して処理速度が速いため、短時間で複雑なタスクを実行することができます。
▪コンテキストウィンドウが長い Gemini Proは従来の無料プランやNanoと比較して長いコンテキストウィンドウを持っており、長文や音声、動画を処理することができます。
▪Google Cloud Platformとの連携 Gemini Proは、Google Cloud Platformとの連携により、大規模なデータセットを処理することができます。
デメリット
Gemini Proは優れたパフォーマンスがメリットである反面、以下のようなデメリットもあります。利用する際はデメリットを認識しておくことが大切です。
▪無料プランがない Gemini Proは有料プランのみの提供です。個人利用ではBasicプラン(1,000円/月額)とAdvancedプラン(5,000円/月額)の2種類と選択肢が少なく、無料プランがないのが難点です。他、法人向けのEnterpriseプランがあり、利用料金については要相談となっています。
▪リクエスト数の制限 Basicプランはリクエスト数の制限があり、リクエスト数が多い業務などには不向きです。利用に際してはリクエストをあらかじめ見積もっておく必要があります。
Gemini Proを活用してみよう
ここまでGoogleのマルチモーダル生成AI、Geminiの中から上位モデルであるGemini Proの概要、メリットとデメリットなどについて紹介してきました。
Geminiはまだ新しい生成AIであり知名度や実績はまだ少なめですが、「Gemini Pro vs GPT-4」という観点ではほぼ互角のパフォーマンスを示しているという評価もあります。Gemini Proは有料版しかありませんが、Gemini Nanoや新たに登場したGemini Flashは無料で利用できます。
まだGeminiは発展途上であり、画像生成機能に欠陥が見つかり、画像生成機能を使えないといった問題もありますが、試してみる価値は十分でしょう。ProやUltraプランも2ヶ月間の無料お試しができますので、ぜひ実際に使って評価してみることをおすすめします。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから