ChatGPTでPDFファイルを読み込むには
2024年5月13日、OpenAIから最新のGPT-4oが発表されました。その中でこれまで有料サブスクリプションで提供された機能も無料アカウントにも提供することが示されています。
2024年5月29日には、全ての無料アカウントにリリースを開始したと表明され、すでに多くの機能が無料アカウントで提供されています。
ファイルアップロード機能は、ファイルを添付しプロンプトに指示する機能です。ChatGPTでPDFを読み込むには、このファイルアップロード機能を使用します。これまでPDF読み込みは有料サブスクリプションで提供されていましたが、同様のことが無料アカウントでも使用できます。
【参考】:Introducing GPT-4o and more tools to ChatGPT free users 【参考】:X: All ChatGPT Free users can now use browse, vision, data analysis, file uploads, and GPTs.
PDFファイルをアップロードしてできること
ファイルアップロード機能は、CSVやMicrosoftのワードやパワーポイント、PDFなどがサポートされます。
PDFファイルでは、ファイル内のテキストを抽出し、特定の項目や章立てを読み取ったり、重要なポイントを抽出して要約を作成したりすることができます。
また、使用しているキーワードやフレーズを検索し、関連情報を提供することも可能です。日本語から英語、英語から日本語など、翻訳も可能です。
【参考】:ChatGPT: File uploads FAQ
PDFファイルを使うにはアカウントログインが必要
ファイルアップロード機能は、無料版においても最新のGPT-4oで提供されます。使用するには、アカウントログインが必要です。アカウントログインによって、履歴に基づいてやり取りが行われます。ログイン不要な無料版のGPT-4o miniはテキストプロンプトしか解釈できません。
無料アカウントと有料サブスクリプションの違い
有料サブスクリプションのアカウントでは、最新機能の先行リリース版を使用したり、用途に応じてGPT-4、GPT-4o、GPT-4o miniを使い分けしたりできます。
無料アカウントではGPT-4oの機能が提供されますが、使用回数などに制限があります。少しずつ試すには、無料アカウントから始めて問題ないでしょう。
【参考】:ChatGPT: Pricing
ファイルアップロード機能の使用上の注意
ファイルアップロード機能のデータは、PDFを学習させるとともにChatGPT自体の学習データに活用されます。
そのため、プライバシー情報などの機微情報を含むファイルは使用を避けるべきです。企業の機密情報や社外秘情報などの非公開情報も、同様の理由により使用を避けなければなりません。
また、自身の作成した文章を分析するのは自身の判断で問題ありませんが、第3者の文章は使用許諾や著作権上の侵害となるものです。このようなプライバシー、セキュリティ、ライセンスなどを理解して使用しましょう。
同様に、不正確な情報が回答に含まれるリスクがあるため、返信内容を確認するのを忘れずに行うことをおすすめします。
ChatGPTでPDFを読み込んで使ってみる
これまでに、PDFファイルアップロードでできることや、ファイルアップロード機能の注意点などを紹介しました。
ここからは、実際にChatGPTでPDFを読み込み、プロンプトで指示を伝えていきます。ChatGPTへのログインから、ファイルアップロードの仕方、そしてプロンプトの指示と結果を図解していきます。
ChatGPTにログインする
まず初めに、PDFファイルアップロードを行うためにChatGPTにログインします。アカウントログインによって、使用するGPTがGPT-4o miniからGPT-4oに切り替わります。同時に、次のようにプロンプト領域の左端に添付を意味するクリップ型のアイコンが表示されます(①②)。
ChatGPTのプロンプトでファイルを添付する
ChatGPTのプロンプトでファイルを添付するには、表示されるクリップ型のアイコンをクリックします。
具体的には、次のようにクリップ型のアイコンをクリックすることで、「Google Drive に接続する」や「Microsoft OneDriveに 接続する」、そして「コンピューターからアップロードする」の格納フォルダが選択できます(①②)。
「Google Drive に接続する」を使用するには、Google Driveのアカウントが、「Microsoft OneDriveに 接続する」の場合は、Microsoft OneDriveのアカウントが接続時に求められます。なお、Microsoft OneDriveを使う場合は、個人用と職場や学校との使い分けも可能です。
【参考】:Google Drive 【参考】:Microsoft OneDrive
ChatGPTにPDFファイルアップロードでできることを確認する
ChatGPTに、PDFファイルアップロードが可能かプロンプトで確認してみます。この場合は、単純に「PDFファイルをアップロードできますか?」と確認の文面を入力してみます。
これは念のために回答を確認したものですので、通常はファイル添付を意味するクリップ型のアイコンが表示される場合は、そのまま利用して問題ありません。
続いて、無料アカウントを使用していることから、PDFファイルのURLを使ってできることを確認してみます。
回答を見ると、PDFファイルのアップロードを使ってほしい旨が表示されます。有料サブスクリプションでのURLの貼り付けや、GPTs「Link Reader」なども活用できますが、このような制限が見られます。
ChatGPTではリリースバージョンや有料と無料のサブスクリプションの違いがありますので、どのようなことができるのか、ChatGPTに確認しながら進めるのが良いでしょう。
PDFファイルを添付して要約文を作成する
ここでは、ファイルアップロード機能を使って、PDFファイルを添付し要約文を作成していきます。
使用するPDFファイルは、例示するために政府系機関の示す白書を使用します。掲載する政府系機関が発行するデータは出典を明示することで使用できることが説明されています。
今回は、総務省が開示する「情報通信白書」を使用し、使い方を説明します。「情報通信白書」は、日本の情報通信の状況をまとめた白書で、年次公開されている情報です。
次のように、あらかじめローカルフォルダに保存しておいた「令和6年版情報通信白書」のPDFファイルを、ファイルアップロード機能を使って指定します(①②)。
このファイルは、「第1章 令和6年能登半島地震における情報通信の状況」が12ページ、「第2章 情報通信が果たした役割と課題」が21ページの特集です。PDFファイル全体を見ると、ファイルサイズは約19.5MB、ページ総数が320ページと非常に大きいファイルです。
プロンプトでは、PDFファイルの概要を伝えるとともに、「第Ⅰ部:特集① 令和6年能登半島地震における情報通信の状況」を要約してほしいことを伝えました。
回答を得るまでは十数秒程度で、以下の要約文が表示されます。
PDF要約はテキスト分析が高速で、違和感のない回答が得られました。日本語の要約も問題なく、無料のPDF要約機能と考えると優秀です。今回はPDFファイルの要約文の作成を指示しましたが、特定の項目のテキストをそのまま抽出する文字起こしも可能です。
【参考】:総務省: 情報通信統計データベース掲載データ等の取扱いについて 【参考】:令和6年版情報通信白書
PDFファイルの頻出フレーズを分析する
PDFファイルのアップロード機能では、頻出フレーズを分析したり、英語と日本語を相互に翻訳したりするなどに利用できます。これらの手順は、この要約文を作成した手順同様に、添付するPDFファイルを指定し、プロンプトに指示を入力する流れです。
ここでは、先ほどの要約文同様に「情報通信白書」の中から、「令和6年版情報通信白書(概要)」のPDFファイルを用いて使い方を例示します。PDFファイルはサイズが2.2MB、10ページの概要スライドで構成されています。
ここでも、プロンプトにPDFファイルの概要を伝えて、フレーズ分析を指示するプロンプトを入力していきます。
得られた結果は以下の通りです。災害対策とデジタルテクノロジーの活用に力点を置いていることが分かります。
【参考】:令和6年版情報通信白書(概要)
ChatGPTのPDFファイル読み込みは作業効率が改善します
ChatGPTはGPT-4oで進化を遂げており、その恩恵は無料アカウントでも得られます。このようにAI活用が進む現代において、ChatGPTが重要な役割を担っています。ChatGPTのPDFファイル読み込みは、PDF要約や文字起こしなど、作業効率の改善や生産性向上が期待できるおすすめの活用方法です。
マイナビエージェントに無料登録して
転職サポートを受ける
編集部オススメコンテンツ
アンドエンジニアへの取材依頼、情報提供などはこちらから