目次
はじめに:AIチャットの「無料」の本当の代償
ChatGPTの登場以来、生成AIは私たちの生活に急速に浸透しました。わからないことを質問すれば即座に回答が返ってくる。 文章の下書き、コードの生成、アイデアの整理――まさに魔法のようなツールです。
しかし、その便利さの裏側で、あなたがAIに入力したすべての会話データがどう扱われているか、考えたことはありますか? AIチャットサービスは基本的に「無料」または「低額のサブスクリプション」で提供されていますが、その代償として あなたの会話データがモデルの学習や品質改善に利用されているケースがほとんどです。
この記事では、主要なAIチャットサービス(ChatGPT、Google Gemini、Microsoft Copilot)が どのようにデータを収集・利用しているかの実態を明らかにし、安全にAIを活用するための具体的な方法を徹底解説します。
この記事を読む前に理解しておくべき最重要ポイント:
AIチャットサービスの「無料版」はあなたが製品であるという現実があります。 つまり、あなたの会話データはAIモデルの改善という名目で収集・分析され、時には人間のレビュアーによって読まれている可能性すらあります。 機密情報や個人情報を何も考えずに入力するのは、見知らぬ人に日記を公開するのと同じくらい危険です。
AIチャットはあなたの何を収集しているのか?
まずは、AIチャットサービス全般が収集するデータの種類を理解しましょう。 以下のデータは、主要なAIサービスのプライバシーポリシーに共通して記載されているものです。
1. 会話の内容(プロンプトと応答)
あなたが入力したすべてのプロンプト(質問・指示)と、AIが生成した応答が記録されます。 これには、個人の悩み、仕事の機密情報、コード、アイデア、健康情報など、あらゆる内容が含まれます。
2. フィードバック(高評価・低評価)
あなたが「いいね」や「よくないね」を押した情報、さらには回答をコピーしたかどうか、再生成を求めたかどうかといった インタラクションも記録され、モデルの品質評価に使われます。
3. 利用状況メタデータ
アクセス日時、IPアドレス、ブラウザ情報、デバイス情報、おおよその地理位置情報など。 これらはサービスのセキュリティ維持や利用傾向の分析に使われます。
4. アップロードされたファイル
ChatGPTへの画像やPDFのアップロード、Geminiへのファイル添付――これらのファイル内容も全て解析・記録されます。 画像に写り込んだ個人情報(顔写真、住所、クレジットカードなど)も例外ではありません。
5. 音声入力データ
音声でAIと会話した場合、その音声データも収集・分析されます。声のトーンや話し方からも 追加の情報が抽出される可能性があります。
ChatGPT(OpenAI)のデータ利用実態と対策
AIチャットブームの火付け役であるChatGPT。そのデータ利用ポリシーは、2023年から2026年にかけて何度も更新されており、 当初よりは改善されたものの、注意すべき点は多く残っています。
OpenAIのデータ利用の実態
- 会話データの学習利用:ChatGPTの無料版およびPlus版では、デフォルトで会話データがAIモデルの学習に利用されます(改善のための学習)。つまり、あなたの会話が将来のAIモデルの訓練データとして使われる可能性があります。
- 人間によるレビュー:OpenAIは、モデルの品質向上と安全性確保のために、ランダムに抽出された会話を人間のレビュアーが確認するシステムを採用しています。完全に自動化されているわけではありません。
- データ保持期間:会話データは通常30日間保持された後、削除されるか匿名化されます。ただし、法的義務が生じた場合はこの限りではありません。
- API利用時の扱い:ChatGPT API(開発者がアプリに組み込む形)で利用したデータは、原則としてモデルの学習には使われません。これはWeb版とAPI版でポリシーが異なる点です。
ChatGPTでできるプライバシー対策
ChatGPTの設定メニュー → 「データコントロール」 → 「会話履歴をオフにする」(Chat History & Training)を有効にします。 これにより、新しい会話がモデルの学習に使われなくなります。ただし、過去の会話は影響を受けないため、過去データも削除しましょう。
※この設定はChatGPT Web版でのみ利用可能です。モバイルアプリでも同様の設定があります。
設定 → 「データコントロール」 → 「すべての会話を削除」で過去の履歴をクリアします。 定期的に削除する習慣をつけることをおすすめします。
ChatGPTには「一時的なチャット(Temporary Chat)」機能があります。このモードで行った会話は、 履歴に残らず、モデルの学習にも使われません。機密性の高い内容を扱う場合は、必ずこのモードを利用しましょう。
ビジネスでChatGPTを利用する場合、TeamまたはEnterpriseプランでは会話データがモデルの学習に使われないことが 契約上保証されています。プライバシーが重要な業務での利用は有料プランへのアップグレードを検討しましょう。
ChatGPTデータエクスポート(自分データの確認)
設定 → 「データコントロール」 → 「データのエクスポート」を選択すると、OpenAIが保持しているあなたのデータを ZIPファイルでダウンロードできます。これにより、どの程度のデータが保存されているかを実際に確認できます。
Google Geminiのデータ利用実態と対策
Googleが提供するGemini(旧Bard)は、Googleアカウントと統合されていることが最大の特徴であり、 同時に最大のプライバシーリスクでもあります。
Google Geminiのデータ利用の実態
- 会話データの学習利用:Geminiの会話データは、Googleのプライバシーポリシーに基づき、AIモデルの改善に利用されます。無料版ではこの利用を完全にオフにすることはできません。
- Googleアカウントとの紐づけ:Geminiでの会話はGoogleアカウントに紐づいて保存されます。つまり、Googleが保有するあなたの検索履歴、YouTube視聴履歴、位置情報などと組み合わせてプロファイリングされる可能性があります。
- 人間によるレビュー:GoogleもOpenAIと同様に、品質改善のためにランダムな会話を人間のレビュアーが確認するシステムを採用しています。
- データ保持:Geminiの会話データはデフォルトで最大18ヶ月間保存されます(設定により変更可能)。
Geminiでできるプライバシー対策
Google アクティビティ管理 にアクセスし、 「Gemini Apps アクティビティ」のトグルをオフにします。これにより、今後Geminiでの会話履歴が保存されなくなります。
同じアクティビティ管理画面で、過去のGemini Appsのアクティビティをすべて削除します。 また、「自動削除」機能を設定して、新しいアクティビティを3ヶ月または18ヶ月で自動削除するようにしておきましょう。
Googleアカウントの設定 → 「データとプライバシー」 → 「サードパーティのアプリとサービス」で、 Gemini Appsに与えたアクセス権限を定期的に見直しましょう。必要以上に多くの権限を与えていないか確認します。
Google Workspace(旧G Suite)のアカウントでGeminiを利用する場合、組織の管理者がデータ利用ポリシーを 設定している可能性があります。職場のアカウントでGeminiに機密情報を入力する前に、必ず組織のポリシーを確認しましょう。
Microsoft Copilotのデータ利用実態と対策
Microsoft Copilot(旧Bing Chat)は、OpenAIの技術をベースにしながらも、Microsoft独自のポリシーで運用されています。 Windowsに深く統合されているため、気づかないうちに利用しているケースも多いのが特徴です。
Microsoft Copilotのデータ利用の実態
- 会話データの学習利用:Copilotの会話データもMicrosoftの製品改善に利用されます。無料版ではオプトアウト(拒否)が制限されています。
- Microsoftアカウントとの紐づけ:Copilotでの会話はMicrosoftアカウントに関連付けられ、Bingの検索履歴やEdgeのブラウジングデータと統合されます。
- 商用データ保護(Enterprise):Microsoft 365 Copilot(ビジネス向け)では、会話データがモデルの学習に使われず、組織外に共有されないことが契約上保証されています。
- Bingとの統合:Copilotの会話はBingの検索データとしても扱われるため、検索履歴の管理設定がCopilotにも影響します。
Copilotでできるプライバシー対策
Microsoft プライバシーダッシュボード(account.microsoft.com/privacy/)にアクセスし、 「検索履歴」をクリアします。また、「新しい検索データが保存されないようにする」設定を有効にします。
Copilotの設定画面で「詳細な応答」や「コンテキスト(会話の文脈)を記憶する」といった機能をオフにすると、 収集されるデータの範囲を限定できます。
前回(トラッキングを防ぐには?)および前々回(検索エンジンのプライバシー)の記事でも紹介した通り、 Edgeの「トラッキング防止」を「厳密」にすることで、CopilotとBingの間でのデータ共有をある程度制限できます。
Windows 11ではタスクバーにCopilotボタンが統合されています。使用しないのであれば、 設定 → 「個人用設定」 → 「タスクバー」 → 「Copilot」をオフにして無効にしておきましょう。 これにより、誤って呼び出してしまうリスクを減らせます。
主要AIチャットのプライバシー比較
ここで、主要なAIチャットサービスをプライバシーの観点から比較します。
| サービス | 会話の学習利用 | 学習利用の停止可否 | 履歴の保持期間 | 人間レビュー |
|---|---|---|---|---|
| ChatGPT(無料/Plus) | 利用する | 可(設定でオフ) | 最長30日 | あり(一部) |
| ChatGPT Team/Enterprise | 利用しない | 不要(契約保証) | ポリシーによる | なし |
| Google Gemini | 利用する | 一部制限あり | 最長18ヶ月 | あり(一部) |
| Microsoft Copilot | 利用する | 一部制限あり | 最長18ヶ月 | あり |
| Microsoft 365 Copilot(企業) | 利用しない | 不要(契約保証) | ポリシーによる | なし |
※「学習利用の停止可否」は、一般ユーザーが自身の設定で変更できるかどうかを示しています。 企業向けプランでは、契約上データが学習に利用されないことが保証されていますが、一般ユーザー向けでは設定変更が必要か、 完全に停止できないサービスもあります。
絶対に入力してはいけない情報
これはどんなAIチャットサービス(無料版・有料版問わず)においても共通して言えることです。 以下の情報をAIに入力するのは絶対に避けてください。
❌ クレジットカード情報・金融情報
カード番号、有効期限、セキュリティコード、銀行口座情報、暗号資産の秘密鍵などは絶対に入力しないでください。
❌ 個人識別情報
本名、住所、電話番号、メールアドレス、マイナンバー、パスポート番号、運転免許証番号など。 仮名やニックネームを使う習慣をつけましょう。
❌ ログイン認証情報
パスワード、PINコード、二要素認証のバックアップコード、APIキー、アクセストークンなど。
❌ 業務上の機密情報
社内の未公開情報、顧客データ、ソースコード(会社のポリシーに抵触する場合)、 特許関連情報、営業秘密など。会社のポリシーを必ず確認してください。
❌ 医療・健康情報の詳細
診断結果、処方箋、検査数値など具体的な医療情報。一般的な健康相談(「頭痛の原因は?」など)は問題ありませんが、 個人を特定できるレベルの詳細情報は避けましょう。
❌ 第三者の個人情報
家族や友人の個人情報、同僚の情報なども含まれます。「自分の情報じゃなければ大丈夫」ではありません。
黄金のルール: AIチャットへの入力は、「もし漏洩しても困らない情報だけ」に限定しましょう。 「AIだから安全」という幻想は捨ててください。過去にはOpenAIのバグで他人の会話履歴が見えてしまうインシデントも実際に発生しています。
プライバシー重視のAI代替サービス
どうしても機密情報を扱う必要がある場合や、AIにデータを学習されるのが許せない場合、 以下のようなプライバシー重視の選択肢があります。
ローカルLLM(完全オフラインAI)
完全にオフラインで動作するAIモデルを自分のPC上で動かす方法です。 インターネットに一切接続しないため、データが外部に漏れるリスクはゼロです。
- Llama.cpp / Ollama:MetaのLlamaモデルなどをローカルで動作させるフレームワーク。技術者向けだが、導入手順は年々簡略化されている。
- GPT4All:Nomic AIが提供するローカルLLMランチャー。日本語対応は限定的だが、英語であればそこそこ使える。
- LM Studio:GUIベースでLLMをダウンロード・実行できる。最も簡単に始められる選択肢のひとつ。
プライバシー重視のクラウドAI
ローカル実行が難しい場合、以下のサービスはデータ利用に関する透明性が比較的高いとされています。
- Perplexity AI Pro:検索連動型AI。Proプランでは、会話データが学習に利用されないことを明示。ただし価格はやや高め。
- Anthropic Claude API:API経由で利用する場合、会話データはモデルの学習に使われない。Anthropicは「憲法的AI(Constitutional AI)」の理念を掲げ、安全性を重視。
- Mistral AI:フランス発のオープンなAI企業。APIで利用するデータは学習に使われないと明言。
オフライン特化のライティングツール
ライティングやアイデア出しであれば、クラウドAIに頼らなくても十分なツールがあります。
- Obsidian:ローカル動作のナレッジベース。プラグインでAI補完も可能(ローカルモデルを利用)。
- Logseq:オープンソースのアウトライナー。データはすべてローカル保存。
今すぐ実践できる安全な使い方7か条
最後に、この記事で紹介した知識を実践に移すための7つのアクションをまとめます。 すべてを一度にやる必要はありません。できるものから少しずつ始めてみてください。
使用中のAIサービスの設定で、会話履歴の保存と学習利用をオフにしましょう。 ChatGPTなら「会話履歴をオフ」、Geminiなら「Gemini Appsアクティビティ」をオフ。
一度設定をオフにしても、過去のデータは残ったままです。定期的に削除する習慣をつけましょう。 カレンダーに「毎月1日はAI履歴を削除する日」と入れるのも手です。
名前は仮名やイニシャル、住所は「東京都内の駅前」など抽象化する。 「このコードをレビューして」と聞くときも、APIキーやパスワードがコード中にハードコードされていないか事前に確認。
機密性の高い質問をするときは、ChatGPTの一時的チャット(Temporary Chat)や、 シークレットモードでの利用を習慣にしましょう。
業務でAIを使う場合、個人のアカウントではなく、業務用のアカウントを使用しましょう。 会社が契約しているEnterpriseプランであれば、データの学習利用が防止されているケースが多いです。
AIサービスのプライバシーポリシーは頻繁に変更されます。少なくとも数ヶ月に一度は、 使用しているサービスのプライバシーポリシーを確認する習慣を持ちましょう。
どうしても機密情報をAIで処理する必要があるなら、ローカルLLMの導入を本格的に検討しましょう。 完全オフラインで動作するAIなら、データが外部に漏れるリスクは事実上ゼロです。 技術的なハードルはありますが、一度設定してしまえば安全に使い続けられます。
まとめ:賢く使うために知っておくべきこと
AIチャットは非常に便利なツールですが、「何でも教えてくれる便利な機械」ではなく「あなたの会話をすべて記録しているサービス」であるという現実を忘れてはいけません。
この記事で最も伝えたかったことは、たった3つです:
- 設定を変えよう — 会話履歴の保存をオフにし、過去のデータを削除する。たったこれでデータ収集の大部分を防げます。
- 個人情報を入れない — 名前、住所、金融情報、パスワードは絶対に入力しない。抽象化して質問する習慣をつけましょう。
- 目的に応じて使い分ける — 日常的な相談はChatGPT/Gemini(設定済み)、機密情報はローカルLLMや一時的チャット、業務はEnterpriseプラン。
AI技術は日々進化していますが、プライバシーを守る姿勢は変わりません。 ぜひ今から、設定の見直しと安全な使い方を始めてみてください。
関連記事
- 第1回:トラッキングを防ぐには? 手軽な方法でプライバシーを守る — Firefox + uBlock Originの導入方法
- 第2回:検索エンジンはあなたの何を知っているのか? — Google/Bingのプライバシー設定と代替検索エンジン
文責:運営者倫理アライアンス(OEA) 編集部
公開:2026年5月27日