問題点が懸念されるChatGPTとは
ChatGPTとは、OpenAIが公開したAIチャットシステムです。学習済みのデータから高度な文章を作成できるだけでなく、表計算の数式の質問にも回答できます。自然言語処理が可能ですので、日本語で問いかけると自然な日本語で回答してくれます。
AIチャットシステムは非常に便利ですが、あらゆる用途に対応できるわけではありません。ここでは危険性や潜在的な問題点ついて述べ、より安心で安全な利用方法について考えていきます。
ChatGPTの特徴
これまでChatGPTは当初よりGPT-3.5上で学習データを用いて、人間による微調整を繰り返して性能を向上させてきました。従来よりも大規模なデータセットを用いた大規模言語モデル(LLM)であり、2022年11月にプロトタイプが公開されて以降、社会に大きなインパクトを与えています。
これまでは、機械が応答するシステムはチャットボットと呼ばれていました。ChatGPTは汎用的な応答が可能で人間の対話を模倣するレベルを超えており、人間の想像力を超える自然な回答を生成します。
ChatGPTのメリット
ChatGPTのメリットとして、創造的でかつこなれた文章に簡単に回答できる点が挙げられるでしょう。得られる回答は自然言語処理に優れており、滑らかな文章が特徴です。
言語処理能力が高く、小説などの文章や提案書を生成したり議題を整理したりするなど、ビジネスでも活用が進んでいます。ドキュメントの和訳や英訳も難なくこなし、表計算の集計も得意です。
プログラミングにおいても、作成したプログラムのコードをレビューしたり、新規のコードを提案したりすることも可能です。
ChatGPTのデメリット
ChatGPTのデメリットは、回答の範囲が学習データに依存し、回答情報が制限されることです。
基本的な学習データは、2023年9月までの蓄積情報に制限されます。(2024年9月現在)情報量もその範囲に限定されるために、情報量の少ないマイナーな領域は明確な回答を得られません。将来予測についても、学習データに基づいたものとなり、最新の情報が反映されていません。
しかし、Webブラウジング機能を利用することでChatGPTでWebから最新の情報を得て回答させることも可能です。ChatGPTをカスタマイズできる「GPTs」でウェブブラウジングに関する機能を追加することで利用可能です。
【参考】:Explore GPTs
ChatGPTの問題点5つ
ChatGPTはAIを活用しており便利な反面、問題となる点があります。OpenAI社も問題を認識し、対策を講じています。しかしながら利用者自体がそれを理解して使用することが重要です。ChatGPTの利便性を高めるための使用上の注意事項にもなりますので、ここから問題点を具体的に紹介します。
【参考】:OpenAI: ChatGPTと当社の言語モデルはどのように開発されたか
データ倫理やAI倫理上の危険性をはらんでいる
最初に紹介するのは、データ倫理やAI倫理上の問題点です。ここでは最初に問題点の概要を述べるとともに、ChatGPTの回答例を図で紹介していきます。
・問題点の概要 文章の生成を依頼した場合、回答には著作物の無断利用や権利侵害などのリスクが含まれます。個人情報についても、個人情報保護に違反する恐れもあるでしょう。
このような情報の盗用や、差別的な情報については、AIの倫理的な規定や制限に従うとともに利用者も意識する必要があります。学生の利用では、教育上の観点から各学校から指針が出されるなど、関心が高まっています。
【参考】:OpenAI: プライバシーポリシー 【参考】:OpenAI: Security & privacy
・ChatGPTの回答例 入力プロンプトに違法性のある問いかけができませんので、ここではChatGPTに問題点をどのように考えているか聞いてみることにします。
上記問い合わせに対して、次の図のように回答を得ました。
ChatGPT自体も問題を認識しており、時折問題が発生すると述べています。問題が生じた時点で、ユーザからのフィードバックにより対応策を講じると述べています。
犯罪行為やスパムなどへの利用、情報漏洩などのセキュリティリスク
続いて、犯罪行為やスパムなどへの利用、情報漏洩などのセキュリティリスクについて考えてみます。この点についても問題点の概要を述べて、ChatGPTの回答例を図で紹介します。
・問題点の概要 ChatGPTでは文章の生成に強みがあり、文章の捏造や犯罪への加担のリスクも高まります。虚偽の情報を吹き込むことで、新たな虚偽情報を生成するなど、悪意を持つ利用者に都合が良い文章が生成できます。これは社会問題として、利用上の懸念点に挙げられます。
・ChatGPTの回答例 ここでは次の図のように、犯罪行為を助長する懸念について質問しました。
得られた回答は、次の図の通りです。
回答によると、ガイドラインを設けて違反を監視していることや、コンテンツフィルタリングの実施などを行い対策を行っているとしています。なお、OpenAIでは、オプトアウトをしない限りは会話の内容によって学習すると記されています。
機密情報の流出のリスクもあるので、むやみに個人情報や機密情報をプロンプトに入力するのは避けましょう。
【参考】:OpenAI Help: Data usage for consumer services FAQ 【参考】:OpenAI Help: How your data is used to improve model performance
回答の正確性が判断できない
次は、回答の正確性について考えていきます。ここでも問題点の概要を述べるとともに、ChatGPTの回答例を図で紹介します。
・問題点の概要 ChatGPTの学習データは2023年9月までの蓄積情報に制限されますので、新たな出来事の回答ができないだけでなく、学習済みデータによる回答が正確なのか判断できない場合があります。内容が文章の滑らかさに問題ない場合も、事実に基づかない場合があります。
出典情報が不明のため、ChatGPTによる創作文章の可能性も否定できません。
【参考】:OpenAI Community: Knowledge cutoff date of September 2021 【参考】:OpenAI Community: What is the actual cutoff date for GPT-4?
・ChatGPTの回答例 ここでは、回答の正確性を図るためにウナギの養殖について質問します。ウナギの完全養殖は2010年に研究レベルで成功にたどり着きました。しかしながら、コスト面や大量生産が必要な商用化の面では課題があります。
2023年10月26日には、大学として初めて近畿大学が完全養殖に成功したものの、商用化は今後の課題とされています。
【参考】:水産研究・教育機構 ウナギ完全養殖達成 【参考】:近大ニュース 近畿大学がウナギ完全養殖成功
2023年の状況は回答できないとしても、商用化がまだできていないことは2019年のChatGPTの学習時点で明らかです。この点が事例通りに回答できるか、ChatGPTに質問してみます。
ChatGPTからは、次の図のように回答が得られました。
ChatGPTによると、ウナギの完全養殖はすでに一般的な手順になっているそうです。少し怪しい回答なので、さらにどこで完全養殖のウナギを食べられるか聞いてみます。
回答は、次の図の通りです。
この回答が、シラスウナギを用いる養殖ウナギのことを示しているのであれば適切な回答かもしれませんが、完全養殖のウナギの回答としては、まだ商用化がされておらず誤った情報ということがわかりました。
補足情報として最新のトピックスを調べたい場合は、Webブラウジング機能を活用しましょう。
【参考】:Explore GPTs
毎回回答が変わっていく
毎回回答が変わっていくことも、気になる方が多いでしょう。この件も、問題点の概要を述べて、ChatGPTの回答例を図で紹介します。
・問題点の概要 同じ質問を何度か送信していくと、その都度回答が更新されていきます。質問の回数とともに回答がブラッシュアップされているようです。これは会話に続く単語を予測していることにより、出現する確率を変動させてランダムに会話を調整しているためです。
・ChatGPTの回答例 変動要素が高い質問として、未知の生物ツチノコがどのような生物なのか、あえて質問してみます。
上の図では、納得感のあるそれらしい回答が得られました。質問の角度を変えて何度か繰り返すこともできますが、ここでは「Regenerate」のボタンを押して質問を再度投げかけてみます。
広い意味では同様の回答とは言え、論調やまとめ方に違いがあります。また何度か質問を繰り返すと逆の意味合いの回答をすることもあります。
回答例のように以前と同じ回答を再度得られない場合もありますので、得られた情報はその都度保存しておくか履歴を残すなども必要です。ChatGPTの回答例については、並行してエビデンス情報を探しておきましょう。
なおOpenAIによると、回答を生成する際に、入力した内容や会話に基づいてトレーニングされていることが示されています。会話に基づいてトレーニングされることは、時として危険性を含むこともあります。意見の多いものが正しいと誤認するなど、中立性での問題も含んでおり注意が必要です。
【参考】:OpenAI Help: Data usage for consumer services FAQ 【参考】:OpenAI Help: How your data is used to improve model performance
プログラムコードの妥当性が分からない
最後にプログラムコードの生成について考えてみます。ここでも問題点の概要を述べて、ChatGPTの回答例を図で紹介していきます。
・問題点の概要 プログラムコードの生成はChatGPTの強みでもありますが、本当にすべてを任せて良いのかは議論の余地があります。現状はプログラマーが単純な作業や繰り返し業務などを行う際のサポート機能として活用されています。
しかし、未経験者や言語知識が十分でない方が、ChatGPTが生成したプログラムコードの良し悪しを理解するのは難しいでしょう。
・ChatGPTの回答例 懸念点を確認するために、あえて難易度の高いコード生成を依頼してみます。対戦型のゲームはアルゴリズム実装や対戦ロジックなど多くの要素があります。ここでは、オセロゲームの作成をChatGPTに依頼してみます。
ChatGPTからの回答は、次の図のようにコードの量が多くて回答できないというものでした。アルゴリズムの実装なども必要だという認識は正しいものと言えます。
上の図の中間部分には、生成したプログラムコードが共有されています。次の図は、コード部分の前半です。
上の図には、配列定義と表示部分があります。実装すべきアルゴリズム部分は、次の図をご確認ください。
上の図で示すプログラムコードの後半は、歯抜け状態でほとんど記述できていません。主要なコードは、自身で埋め込む必要があります。上記の他に、プログラムコードの生成で無関係なコードを提示する場合もあります。
このようにプロンプトの工夫で精度が高まるとはいえ、プログラムコードの生成は限界があるので、全面的に信頼せずに補助的に使用するなど、十分な考慮が必要です。また、生成したコードが作者の著作権を侵害していないのかも気になるポイントです。
文章生成と同様に、むやみに生成コードを自身の作品として公開することのないように、より注意が必要となるでしょう。
ChatGPTを使用するリスク
ここまでChatGPTが抱える問題点を紹介しました。ここでは、ChatGPTを使用する上でのリスクについてピックアップします。
誤った情報の拡散
ChatGPTは日々進化を遂げており、リリース当初に比べると回答の精度は段違いに向上しました。とは言え、知識のカットオフは2023年9月までであること、さらにAIが回答を創作する場合もあるなど、ChatGPTからの回答を鵜呑みにして情報を信じてしまうのは危険です。
ましてやその回答が誤った情報であり、それをそのままSNSなどで拡散してしまうと、内容によっては大きな混乱を招く場合があります。ChatGPTに限ったことではありませんが、ユーザには情報を正しく読み解いて活用できる能力である情報リテラシーが求められます。
ChatGPTからの情報を拡散する場合は、得られた回答が本当に正しいかどうかをきちんと精査する必要があります。
情報収集や判断能力の低下
日々さまざまな情報が溢れる中、情報の真偽までもChatGPTに頼り切ってしまうと、情報収集力や判断能力の低下が懸念されます。自分自身にとって有益で興味を引く情報は、それがどういったところから発信されているかを確認しなければなりません。
ChatGPTはあくまで作業を効率化させるためのツールの1つであり、情報収集や判断においては過度に信頼し過ぎないように注意しましょう。
ChatGPTの問題点を理解して有効活用しよう
ChatGPTは、AIをこれまで定期的に訪れたブームから、現実的に利用価値の高い実用段階まで引き上げました。ChatGPTは問題が内包するものの、それを上回る利便性を提供してくれます。OpenAIは、問題を把握し課題解決を進めています。
ChatGPTの問題を理解しながら、安心安全にAIを活用することが利用者にも求められており、有効活用のポイントになるでしょう。
マイナビエージェントに無料登録して
転職サポートを受ける
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから