メインコンテンツへスキップ
レッスン一覧に戻る

atom.training-designer.output-quality-baseline

AI出力の品質基準を設定する

AI出力の品質基準を設定する 料理をするとき、「味見」をしますよね。塩加減はどうか、火は通っているか、盛り付けはきれいか。この「味見の基準」があいまいだと、毎回ちがう味になってしまいます。 AIが書いた文章や作った...

create-quality-checklistcreate-quality-checklist「create quality checklist」に関するスキルがこのレッスンで身につきます。evaluate-ai-outputevaluate-ai-output「evaluate ai output」に関するスキルがこのレッスンで身につきます。
想定時間未設定公開状態: draft
学習メモ

成果物成果物このレッスンが終わったとき、あなたの手元に残る具体的な成果物です(例: 公開済みの Web ページ、動作するフォームなど)。

種類: markdown_doc検証: basic_manual_check_v1

証跡証跡成果物が正しく作れたことを確認するためのチェックリストです(例: ブラウザで動作する、フォーム送信で値が保存される)。

screenshot

メディアメディアレッスン内に出てくる図や動画のスロットです。実際の画面やイメージで理解を補助します。

diagramscreen_capture

レッスン本文

AI出力の品質基準を設定する

料理をするとき、「味見」をしますよね。塩加減はどうか、火は通っているか、盛り付けはきれいか。この「味見の基準」があいまいだと、毎回ちがう味になってしまいます。

AIが書いた文章や作った資料も同じです。「なんとなくよさそう」で終わらせず、「ここをチェックすればOK」という明確な基準を持っておくと、何度使っても安定した結果が出せるようになります。

この Atom では、AIの出力を評価するための「品質チェックシート」をあなた自身の手で作り、実際にAIの出力を評価するところまで行います。

品質基準設定フロー

前提を確認する

この Atom は、次の条件を想定しています。

  • すでに ChatGPT や Claude などの AI ツールを使ったことがある
  • AIに何かを出力させた経験が少なくとも1回ある

もし AI ツールをまだ触ったことがなければ、まずは AI に「自己紹介文を書いて」と頼んでみることから始めてください。

品質の「軸」を3つ決める

AIの出力を評価するとき、なんでもかんでも見ようとするとチェックが大変です。まずは3つの軸に絞ります。

料理でいうと「味・見た目・温度」のように、最低限押さえるポイントを決めるイメージです。

よく使われる軸の例を紹介します。

軸の名前何を見るか
正確性事実と合っているか数字・日付・名前が間違っていないか
期待との一致依頼内容に沿っているか「300字以内で」と頼んだのに1000字になっていないか
読みやすさ文章がわかりやすいか専門用語が多すぎないか、段落が適切か

あなたが普段 AI に頼む仕事に合わせて、3つの軸を選んでみてください。

良い例と悪い例

良い例: 「正確性」「期待との一致」「読みやすさ」の3軸を選び、それぞれに「合格/不合格」のラインを決めている

悪い例: 「なんとなくいい感じか」だけで判断している(基準が人によって変わってしまう)

チェックシートを書く

3つの軸が決まったら、それぞれについて**「これならOK」という具体的な条件**を書きます。

料理でいうと「鶏肉の中心温度が75℃以上なら火が通っていると判定する」のような明確なルールです。

AIにチェック項目の案を出してもらう

条件を自分だけで考えるのが難しいときは、AIに手伝ってもらいましょう。次のようなプロンプト(=AIへの指示文)をコピーして、ChatGPT や Claude に貼り付けてください。

私はAIの出力を評価するためのチェックシートを作っています。 評価軸は「正確性」「期待との一致」「読みやすさ」の3つです。 それぞれの軸について、合格・不合格を判定するための具体的な条件を2つずつ提案してください。 条件は「〜であること」という肯定形で、数字や個数を含めてください。

AIが出してきた案をそのまま使う必要はありません。あなたの仕事に合うように書き換えて大丈夫です。大事なのは最終的な基準を自分で決めることです。

書き方のコツ

  • 「〜であること」という肯定形で書く
  • 数値や個数で表せるものは数字を入れる
  • あいまいな言葉(「適切に」「それなりに」)は避ける

良い例と悪い例

良い例:

  • 「依頼したトピックについて3つ以上の具体例が含まれていること」
  • 「文章の長さが指定した文字数の±10%以内であること」

悪い例:

  • 「内容がそれなりに詳しいこと」(「それなり」の基準が不明確)
  • 「全体的によく書けていること」(どこを見ればよいか分からない)

AI出力を実際にチェックする

それでは、チェックシートを使ってみましょう。

  1. AI に何かを出力させる(例:「新入社員向けに、社内研修の目的を3行で説明して」)
  2. 出力結果をチェックシートの各項目に照らし合わせる
  3. すべての項目をクリアしていれば「合格」とする
  4. 1つでも不合格があれば、AI に修正を依頼する

チェック実施画面

修正を依頼するプロンプト例

「もっと良くして」ではなく、どの軸が不合格で、どう直したいかを伝えます。AIに次のように頼んでみてください。

さっきの出力について修正をお願いします。 チェック結果:「期待との一致」が不合格でした。 理由:3行以内と指定しましたが、5行になっています。 修正内容:3行以内に収めてください。それ以外は合格です。

このように「どの軸が」「なぜ不合格で」「どう直すか」の3点をセットで伝えると、AIは一発で的確な修正をしてくれます。

  • 良い依頼: 「『期待との一致』が不合格でした。3行以内に収めてください」
  • 悪い依頼: 「なんか違うので直して」

チェックシートを保存して使い回す

一度作ったチェックシートは、次回以降も同じように使えます。

メモアプリやテキストファイルに保存しておきましょう。AI に同じような依頼をするたびに、このシートを横に置いて確認する習慣をつけると、出力のブレがぐっと減ります。

チェックシートの完成イメージ

保存するシートは、たとえばこんな形になります。

【AI出力 品質チェックシート】
作成日: 2026年4月13日
対象: 社内研修資料のAI生成

■ 正確性
  □ 固有名詞(社名・製品名)が正しい
  □ 数字やデータに出典元がある、または事実確認済み

■ 期待との一致
  □ 指定した文字数の±10%以内
  □ 依頼した構成(見出し数、段落数)と一致

■ 読みやすさ
  □ 1文が80字以内
  □ 専門用語には括弧書きで説明あり

判定: 全項目クリア → 合格 / 1つでも× → 修正依頼

検証する

最後に、あなたのチェックシートが本当に機能するか確認します。次の2つを試してください。

  1. 再現性テスト: AI に2回同じような依頼をして、両方とも同じ基準で合格/不合格を判定できるか
  2. 他者テスト: 「合格」と判定した出力を別の人に見せたとき、その人も「よさそう」と思えるか

この2つがともに「はい」なら、あなたの品質基準は実用レベルです。もし「いいえ」がある場合は、チェック条件があいまいになっていないか見直しましょう。

つまずきやすいポイント

つまずき対処法
軸が多すぎてチェックが大変最初は3つまで。慣れてから増やす
「正確性」をどう判定していいかわからないAI の出力の中から1カ所だけ選び、Google検索で事実確認する。全部確認しなくてOK
毎回ちがう結果になってしまうチェック条件に数字が入っているか見直す。「適切に」「十分に」は数字に置き換える
AIに修正を頼んでも直らない「どの軸が不合格か」「具体的にどう変えてほしいか」を伝え直す。上の修正プロンプト例を参考に
チェックシートを作ったが面倒で使わなくなった最初の1週間は「AIを使うたびに必ずシートを開く」とルール化する。習慣になったら自然にできるようになる
成果物成果物このレッスンが終わったとき、あなたの手元に残る具体的な成果物です(例: 公開済みの Web ページ、動作するフォームなど)。

種類: markdown_doc

検証: basic_manual_check_v1

証跡とメディア

証跡証跡成果物が正しく作れたことを確認するためのチェックリストです(例: ブラウザで動作する、フォーム送信で値が保存される)。

screenshot

メディア

diagramscreen_capture
前提 atom

必須

なし

あると楽

なし

学習完了