単純なチャット機能を超え、ChatGPTでプロジェクトの作成とコーディングをするための新しいインタフェース「canvas」をご紹介します。
「canvas」では、ChatGPTとの共同作業の新しい方法を実現します。公開された「canvas」のベータ版では、独立したウィンドウが開かれ、会話をするだけではなく、アイディアを生み出し、段階的に課題を改善していくことができるようになります。
canvasはGPT-4に基づき開発され、ベータ版の段階ではモデルピッカーにより手動で選択をすることにより利用可能。2024年10月3日から、世界中のChatGPT PlusとTeamユーザーにcanvasを展開します。エンタープライズ、教育関係のユーザーは同日の翌週からアクセスできるようになりました。またベータ版完了後は、すべての無料を含むChatGPTユーザーが利用できるようになります。
ChatGPTとの優れたコラボレーション
多くの人々がChatGPTを利用して、文章を書いたりコーディングをしていることと思います。チャットインタフェースは使いやすく、多くのタスクでうまく機能しますが、編集や修正などの作業が必要なプロジェクトでは制限を感じることもあるでしょう。canvasは、このような作業に新しいインタフェースを提供します。
canvasを利用すると、ChatGPTは、達成しようとしているコンテキストをより正確に理解できるようになります。特定のセクションを強調選択することで、どこに焦点を当てたいかをChatGPTに正確に伝えることができます。ChatGPTは、文章校正者やコードレビュワーのように、プロジェクト全体を念頭に置いてフィードバックや提案を提供できるようになります。
つまり、canvasを利用してプロジェクトを進められるようになるのです。テキストやコードを直接編集でき、長さの調整、コードのデバッグ、その他のアクションを迅速に実行させるためのショートカットメニューが備えられています。また、戻るボタンを使用して、以前のバージョンに復元することもできます。
ChatGPTが可能性のあるシナリオを検出すると、canvasが自動的に起動します。また、プロンプトで「canvasを使用」と指示することで、既存のプロジェクトをcanvsで開いて作業することもできます。
ショートカットメニューでは次のようなことができます。
- 編集の提案:ChatGPTは指示された箇所の提案とフィードバックを提供します。
- 長さの調整:指示された箇所のドキュメントを長くしたり短くしたりします。
- 文章レベルを変更する:指示された箇所のドキュメントの文章レベルを、幼稚園レベルから大学院レベルにまで調整します。
- 最終的な仕上げ:文法、明快さ、一貫性をチェックします。
- 絵文字を追加:強調と見た目のために関連する絵文字を追加します。
canvasでのコーディング
コーディングは反復的な作業であり、チャットインタフェースですべての改訂を行うのは難しい場合があります。canvasを使用すると、ChatGPTの変更を簡単に追跡し、理解することができるようになります。Open AIでは、「より理解しやすく改善を今後も続けていく予定」としています。
コーディングのショートカットメニューでは次のようなことができます。
- コードのレビュー:指示された箇所のレビューを行います。
- ログの追加:コードをデバッグするときに理解しやすくするために、print文を追加します。
- コメント:コードを理解しやすくするために、コメント文を追加します。
- バグの修正:問題のあるコードを検出して修正し、エラーを解決します。
- 言語の移植:コードをJavaScript、TypeScript、Python、Java、C++、PHPに変換します。
協力者になるためのモデルのトレーニング
利用者にとって創造的な同僚として協業できるように、GPT-4oをトレーニングしました。モデルは、いつcanvasが起動し、特定箇所の編集を行い、どのように書き換えたかを把握します。また、正確なフィードバックと提案を提供するために、広いコンテキストを理解するようになっています。
このような性能を実現するために、Open AIでは以下のコア機能を開発しました。
- 書き込みとコーディングのトリガー機能
- 多様なタイプのコンテンツの生成機能
- ターゲットを絞った編集機能
- 文章の書き換え機能
- インライン評価機能
Open AIは、自動評価により20以上の性能を測定。OpenAI o1-previewから出力を蒸留するなど、新しいデータ生成手法を用いて、モデルのコア機能をトレーニング。このアプローチにより、人間が生成したデータに頼らずに、高い品質と新しいユーザーインタラクションに迅速に対処することができました。
最も重要な挑戦といえるのは、canvasをトリガーするタイミングを定義することでした。「夕食の新しいレシピをつくるのを手伝ってください」などの一般的なQ&Aタスクではcanvasを起動することなく、「コーヒー豆の歴史に関するブログ投稿を書く」などのプロントの場合にのみ、canvasを起動するようモデルに教えました。ライティングタスクでは、求められた時にcanvasが起動することを優先し(canvasが起動すべきない時に起動してしまうという問題は置いて)、プロンプトで指示されたゼロショット状態のGPT-4oとの比較で83%にまで到達しました。
特定のプロンプトに非常に敏感であるという品質はまさに注目に値します。プロンプトを変えてもcanvasが起動するという品質は改善しないものの、ライティングとコーディングなどの手法の違いにより品質が異なってきます。
Open AIでは、パワーユーザーが困惑をしないようにに、意図的にコーディングでの不適切なトリガーを抑えるようにモデルをトレーニングしました。今後、ユーザーのフィードバックに基づいて、洗練させ続けていきます。
2番目の課題は、canvasがトリガーされて起動した後、編集動作を調整することでした。具体的には、ターゲットを絞った編集を行うのか、コンテンツ全体を編集するのかを判別することです。ユーザーがインターフェースを介して特定のテキストを明示的に選択した場合は、ターゲットを絞った編集を行うようにモデルをトレーニングしました。それ以外の場合は、コンテンツ全体を編集するようになります。モデルを洗練されていくにつれ、この動作は進化し続けます。
高品質のコメントを生成するようにモデルをトレーニングするには、慎重な積み重ねが必要でした。自動評価で可能になるケースとは異なり、自動化された手法で品質を測定することはできません。したがって、コメントの質と正確さの評価は、人間の手で行いました。その結果、canvasはプロンプトで指示されたゼロショットGPT-4oと比べて、精度で30%、品質で16%上回りました。詳細に指示をしなければならないゼロショットプロンプトと比べて、canvasが応答品質と動作を大幅に向上させることが示されました。
今後の予定
AIをより有用で使いやすいものにするには、AIとのインタラクションを再考する必要があります。canvasは新しいアプローチであり、2年前に始まったChatGPTのビジュアルインタフェースの最初のメジャーアップデートとなります。
canvasはまだベータ版の初期段階にあり、その能力を急速に向上させていく予定です。
【記事出典】 OpenAI「Introducing canvas: A new way of working with ChatGPT to write and code」
【関連リンク】 ChatGPTとは?今話題のAIチャットボットの概要や仕組みを解説! OpenAIのGPT-4とは?ChatGPTの進化版について解説! ChatGPT-4oとは?特徴や新機能を使い方とともに解説
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから