GPT-3.5 Turboの微調整機能
ChatGPT開発元の米国OpenAI社は現地時間の8月22日に、同社の大規模言語モデル「GPT-3.5 Turbo」の微調整(Fine-tuning)機能を公開しました。この機能によって、利用者は独自のデータを用いて、モデルの最適化やカスタマイズが可能になり、より高いパフォーマンスを得られるようになっています。
また、特定のタスクではGPT-4以上の性能を発揮したとの報告も上がっており、2023年秋にGPT-4にも適用される予定です。
この記事では、ChatGPT3.5 Turboに新たに搭載された微調整機能によって何が変わるのか、メリットとデメリット、微調整の手順、今後の展望と可能性について解説をしていきます。
【参考】:ChatGPT | OpenAI 【参考】:GPT-3.5 Turbo fine-tuning and API updates| OpenAI
大規模言語モデルとは
大規模言語モデル(Large Language Models:通称LLM)は、大量のデータセット及びディープラーニング技術を駆使して構築された、自然言語処理モデルのことを指します。
大規模言語モデルでは、一般的な自然言語モデルと比較して、計算量、データ量、パラメータ数(ディープラーニング特有の係数の集合体)の3つの要素が巨大化されている点が特徴です。
ChatGPTは、このLLMに大量のテキストデータを学習させ、まるで人間が発したような自然な言葉や文章を生成できる自然言語処理機能を用いた仕組みです。
GPT-3.5 Turboとは
GPTとは「Generative Pretrained Transformer」の略で、米OpenAI社が開発した自然言語AIシリーズの名称として使われています。
GPT-3.5はChatGPTで使われている言語モデルのバージョンです。GPT-3.5はGPT-3と最新のGPT-4の間に位置し、自動翻訳や文章作成、質問応答などの多様なタスクに対応できるよう設計されています。
GPT-3.5 Turboは、OpenAIのGPT-3.5モデルの最新バージョンである「gpt-3.5-turbo-0613」に由来しています。このTurboバージョンは、従来のバージョンよりも高速化されており、新しい機能として関数呼び出しが追加されています。
またGPTの最新バージョンであるGPT-4は、ChatGPT PlusやChatGPT Enterpriseなどの有償サービスでは利用できますが、無償提供されているChatGPTではGPT-3.5が使われています。
【参考】:GPT-35-Turboの操作方法 - Azure OpenAI Service | Microsoft Learn
GPT-3.5 Turboの微調整とは何か?
GPT-3.5 Turboの微調整機能は、GPT-3.5 TurboのAPIを利用している開発者向けに提供される機能です。これによって何が変わるのかを見ていきましょう。
微調整によって何が変わる?
GPT-3.5 Turboに新たに搭載された微調整機能を利用することで、開発者は特定のユースケースやタスクに合わせて、モデルの微調整やカスタマイズが行えるようになります。
これにより、出力フォーマットに一貫性を持たせる、特定言語による応答を固定する、特定自社ブランドのトーンに合わせる、要件に合わせた回答結果を得るといった調整が行えるようになります。
微調整機能のユースケース
微調整機能のユースケースについて整理すると、以下の通りとなります。
▪操作性向上 モデルが指示通りに動き、期待する結果に近づく可能性が高くなります。例えば、日本語のプロンプトには日本語で応答する、不要な長い出力を削る、といった形で操作性を向上することができます。
▪出力フォーマットの一貫性 一貫した応答によって、利用者からの出力フォーマットに対する信頼性を高めることができます。
▪出力トーンの調整 モデルの出力トーンを調整することができ、自社プランドにトーンを合わせることで、ブランドイメージのアップにつなげることができます。
安全性やセキュリティ面の改善
モデルの安全性確保のために、微調整機能を用いたプロセスにおいては、すべてのトレーニングデータはOpenAIのモデレーション機能を通じた細心の精査を受け、安全性を損なうコンテンツはフィルタリングされます。
また、微調整に使用したデータは顧客の所有物として、OpenAIがそのデータをモデルのトレーニングに使用できないようセキュリティ面の配慮がなされています。
コスト面
ここまで述べたように、良いこと尽くめの微調整機能に思えますが、注意すべき点があります。それは新たなコストの発生です。仮にモデルのトレーニングに1,000トークン(1,000語)を利用すると、約1.17円のコストが課金されます。
例えば、10万トークンの学習データを1回分学習させると、コストは0.8ドル(約120円)掛かります。従って、微調整機能の利用は、費用対効果で判断をすることが求められます。
GPT-3.5 Turboの微調整のメリットとデメリット
ChatGPTの自然言語モデルGPT- 3.5 Turboは、OpenAI APIを利用してモデルの微調整が行えます。微調整機能についてメリットとデメリットを整理してみましょう。
メリット
GPT-3.5 Turbo 微調整機能を利用することで、開発者および利用者は次のようなメリットを期待することができます。
▪3つの異なるユースケースにおいて優れた結果をもたらし、モデルのパフォーマンス向上に役立ちます。 ▪指示することで、モデルの出力結果を調整できるようになり、カスタムトーンが可能になり、出力の一貫性が向上します。 ▪プロンプトサイズを90%削減したり、効率的なAPIコールを実現したりすることで、APIコールの高速化とコスト削減を実現できます。
デメリット
GPT-3.5 Turbo 微調整機能には様々なメリットがある反面、次のようなデメリットがありますので、利用に当たっては費用と効果のバランスに注意する必要があります。
▪微調整を利用すると、トレーニングコストや利用コストが想定外にかかる可能性があります。出力の微調整では、通常モデルの約8倍のコストが掛かります。 ▪微調整を行うには、エンジニアやデータサイエンティストなどのスキルが求められ、一般の利用者には利用が難しいという問題があります。ただし、OpenAIは微調整UIの開発を予定しており、アップロードや微調整が容易に行えるようになる予定です。
GPT-3.5 Turbo 微調整の手順
GPT-3.5 Turboの微調整の大まかな手順は以下の通りです。詳細は、OpenAIが公表しているガイドに従ってください。
微調整の手順
GPT-3.5 Turboで微調整機能を用いる手順は以下の通りです。
1.データの準備 モデルをトレーニングするためのデータを準備します。
2.APIキーの使用 利用するAPIのキーをOpen AIより取得します。
3.モデルのトレーニング モデルのトレーニングを微調整するためのジョブを作成し、トレーニングを行います。学習サンプルは最低10個は必要で、50〜100個で明確な改善が見られます。また学習データのサンプルはそれぞれ4,096トークン以内である必要があります。
4.APIコールによる使用 OpenAIのAPIをコールして、微調整されたGPTを実際に利用します。
微調整における留意事項
微調整に要するコストは、元のモデルと比較して約8倍の費用が掛かります。またトレーニングにおいても$2.4が必要です。微調整したモデルは、通常のモデルと同様に月間APIコール数や最大トークン数などのAPI制限が適用されます。
またアップロードされたデータは顧客側の所有物であり、OpenAIやその他の組織によって流用されるリスクはありません。
微調整機能の今後の展望と可能性
GPT-3.5 Turboに追加された微調整機能は、大規模言語モデルの利用者にとって画期的な機能です。この機能により、利用者は目的やニーズに合わせたモデルの出力についてカスタマイズが可能となり、より高度なタスクやアプリを実現できるようになる可能性があります。
例えば、以下のような応用が考えられます。
1.新たなチャットボットや対話システムの開発 微調整を利用して、チャットボットや対話システムの音声、キャラクターの性格をカスタマイズできるようになり、ユーザの利便性や満足度を高められます。また、特定の領域や業界に特化した知識や用語をモデルに学ばせることで、より専門的な対話を実現できます。
2.テキスト生成や文章作成の支援 微調整を利用して、テキスト生成や文章作成における形式やトーンの指定が可能になり、より効率的かつ高品質なテキスト生成が実現します。
3.テキスト分析や自然言語能力の強化 微調整によって、テキスト分析や自然言語理解に必要な特徴や指標を指定できるようになり、より自然で高い精度や信頼性を持つアウトプットを実現できます。
よりユーザの期待に応えられるチャットボットを目指して
GPT-3.5 TurboはOpenAIが開発した大規模言語モデルであり、2023年8月に微調整機能が追加されました。この記事では、微調整機能によって何が変わるのか、メリットとデメリット、微調整の手順、今後の展望と可能性について解説をしてきました。
ChatGPTの有効活用を図る上では、より利用者のニーズに沿った効率的、効果的なカスタマイズが利活用の鍵となってくるでしょう。その実現のために微調整機能は大変重要だということが理解できたと思います。ぜひ皆さんも微調整機能を習得して、より良いAIチャットボットの開発に活かしてみてください。
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから