atom.office-automator.data-anonymization

機密データをマスキングしてからAIに渡す

機密データをマスキングしてからAIに渡す最近の職場では、ChatGPTやClaudeなどのAIツールを使って、売上データの要約やメールの下書きを頼む場面が増えています。ところが、そこに顧客名や電話番号をうっかりそ...

mask-pii-before-ai

想定時間未設定公開状態: draft

学習メモ

成果物

種類: markdown_doc検証: basic_manual_check_v1

証跡

screenshot

メディア

diagramscreen_capture

レッスン本文

機密データをマスキングしてからAIに渡す

最近の職場では、ChatGPTやClaudeなどのAIツールを使って、売上データの要約やメールの下書きを頼む場面が増えています。ところが、そこに顧客名や電話番号をうっかりそのまま貼り付けてしまうと、情報がAIサービスのサーバーに送信されてしまいます。

このレッスンでは、「AIに頼みたいけれど、個人情報は見せたくない」という場面で使えるマスキング（＝見せたくない部分をダミーの文字に置き換えること）の手順を学びます。15分ほどで完了できるよう、必要なステップだけに絞って進めます。

マスキングの全体像

たとえで理解する — はがきと封筒

あなたが友人に手紙を送る場面を想像してみてください。はがきは配達途中に誰でも裏面を読めてしまいます。一方、封筒に入れれば、中身は見えません。

AIにデータを送るのは「はがきで情報を送る」のに似ています。マスキングは、はがきの内容のうち「名前」「住所」「電話番号」を黒塗りしてから送る作業だと考えてください。黒塗りしておけば、配達員（＝AIサービス）に中身を見られても安心です。

機密データを見つける

まず、あなたがAIに渡そうとしているデータの中に、次のような情報がないか確認します。すべてチェック対象です。

種類	具体例
氏名	田中太郎、佐藤花子
メールアドレス	tanaka@example.com
電話番号	03-1234-5678
住所	東京都渋谷区…
ID番号	マイナンバー、社員番号、顧客番号
認証情報	パスワード、APIキー（＝外部サービスと通信するための合言葉）

見落としやすいポイント: メール本文の署名欄や、Excelのシート名に個人名が入っていることがあります。データ本体だけでなく周辺情報もチェックしてください。

AIに「どこが機密か」を聞いてみる

どの情報が機密にあたるか迷ったら、まずダミーデータ（あなたが作った架空の情報）でAIに相談できます。ChatGPTやClaudeに以下のプロンプト（＝AIへの指示文）を送ってみましょう。

以下のサンプルデータに含まれる個人情報（PII）の項目を一覧にしてください。
なお、これはダミーデータで実在の人物ではありません。

名前: 山田太郎
メール: yamada@example.com
住所: 東京都千代田区1-1-1
社員番号: EMP-0042
部署: 営業部
売上: 350万円

AIが「名前、メール、住所、社員番号が個人情報です」と回答してくれるので、マスキング対象の抜け漏れを防げます。

良い例: ダミーデータ（架空の名前・住所）でAIに確認してから、本番データに同じルールを適用する。

悪い例: 本番の個人情報をそのままAIに送って「どれが機密ですか？」と聞く。送った時点でマスキングの意味がなくなります。

マスキングのルールを決める

データを書き換える前に、次の3つのルールを決めておきます。あとから混乱しないための準備です。

一貫性 — 同じ人には常に同じ仮名を使います。「田中太郎」→「顧客A」と決めたら、どのシートでも「顧客A」に統一します
元に戻せるか決める — 後で元のデータが必要な場合は、「田中太郎 = 顧客A」という対応表を別のファイルに保存しておきます
分析に必要な情報は残す — 「30代・男性・営業部」のような属性は個人を特定しないので残してOKです。AIの回答精度を保つために必要です

良い例と悪い例で比べる

良い例: 「田中太郎、03-1234-5678」→「顧客A、電話番号A」に書き換える。文脈が保たれるのでAIは正しく分析できます。

悪い例: 名前の列をまるごと削除する。AIが「誰のデータか」区別できなくなり、「同じ人が3回購入した」といった分析ができなくなります。

マスキングを実行する

ここからは具体的な作業です。2つの方法を紹介します。

方法1: スプレッドシートの置換機能を使う

GoogleスプレッドシートやExcelを使った手順です。

元のデータをコピーして、新しいシートに貼り付ける（元データは絶対に上書きしない）
機密データが入っている列を特定する
「検索と置換」機能（Ctrl+H / Cmd+H）で仮名に書き換える
すべての機密データが置き換わったか、検索機能で最終確認する

スプレッドシートでのマスキング手順

置換の具体例:

元のデータ	マスキング後
田中太郎	顧客A
tanaka@example.com	email-a@dummy.com
03-1234-5678	000-0000-0001
佐藤花子	顧客B
sato@example.com	email-b@dummy.com

方法2: AIにマスキング作業を手伝わせる

データ件数が多い場合は、AIにマスキング作業自体を手伝わせると効率的です。ただし、最初は必ずダミーデータで試してください。

以下のプロンプトをChatGPTまたはClaudeに送ります。

以下のデータの個人情報（氏名、メールアドレス、電話番号）を仮名に置き換えてください。
ルール:
- 同じ人物には同じ仮名を使う
- 「顧客A」「顧客B」の形式で置き換える
- メールは「email-a@dummy.com」の形式にする
- 電話番号は「000-0000-0001」の形式で連番にする
- 部署名・役職・金額はそのまま残す

---
（ここにダミーデータを貼り付ける）

手順のコツ:

まず3〜5行のダミーデータ（自分で作った架空データ）で試す
AIの出力が正しいことを確認する
問題なければ、本番データを同じプロンプトで処理する
出力されたマスキング済みデータを確認してからAIの次の作業に使う

重要: AIにマスキングを依頼するときも、最初のテストはダミーデータで行ってください。本番データをいきなり送ると、マスキング前のデータがAIに渡ってしまいます。

マスキング結果を確認する

書き換えが終わったら、以下のチェックリストで確認します。すべてにチェックが入ったら完了です。

氏名がすべて仮名（顧客A、顧客Bなど）に置き換わっている
メールアドレスに本物のアドレスが1件も残っていない
電話番号がすべてダミーの番号になっている
同じ人物には同じ仮名が一貫して使われている
分析に必要な情報（部署名、金額、日付など）が保たれている
シート名やファイル名に個人名が残っていない

最終確認のコツ: スプレッドシートの「検索」機能（Ctrl+F / Cmd+F）で元の名前を検索し、ヒット0件になることを確認するのが一番確実です。

つまずきポイントと対処法

よくある失敗	対処法
置換し忘れ — 同じデータが複数シートにある	検索機能で全シートを対象に本名が残っていないか確認する
対応表をなくした	対応表は別ファイルに保存し、パスワードをかけておく
過剰なマスキング — 統計情報まで消す	「30代・男性」など個人を特定できない情報はそのまま残す
AIの出力を確認しない	AIが仮名を間違えることもある。目視チェックは必ず行う
ファイル名に個人名が残る	ファイル名・シート名も確認対象に含める

まとめ

このレッスンでは、AIにデータを渡す前のマスキング手順を4ステップで学びました。

見つける — 機密データ（氏名・メール・電話番号・住所・ID）を特定する
ルールを決める — 一貫性・元に戻せるか・文脈の維持の3点を決める
実行する — スプレッドシートの置換機能、またはAIにダミーデータで試してから処理する
確認する — チェックリストと検索機能で漏れがないことを検証する

この手順を習慣にすれば、情報漏えいのリスクを抑えながら、安心してAIツールを業務に活用できるようになります。

あなたの成果物: マスキング済みのデータファイル（スプレッドシートまたはテキスト）と、元データとの対応表。この2つが手元にあれば、このレッスンは完了です。

成果物

種類: markdown_doc

検証: basic_manual_check_v1

証跡とメディア

証跡

screenshot

メディア

diagramscreen_capture

前提 atom

必須

なし

あると楽

なし

学習完了