atom.training-designer.output-quality-baseline

AI出力の品質基準を設定する

AI出力の品質基準を設定する料理をするとき、「味見」をしますよね。塩加減はどうか、火は通っているか、盛り付けはきれいか。この「味見の基準」があいまいだと、毎回ちがう味になってしまいます。 AIが書いた文章や作った...

create-quality-checklistevaluate-ai-output

想定時間未設定公開状態: draft

学習メモ

成果物

種類: markdown_doc検証: basic_manual_check_v1

証跡

screenshot

メディア

diagramscreen_capture

レッスン本文

AI出力の品質基準を設定する

料理をするとき、「味見」をしますよね。塩加減はどうか、火は通っているか、盛り付けはきれいか。この「味見の基準」があいまいだと、毎回ちがう味になってしまいます。

AIが書いた文章や作った資料も同じです。「なんとなくよさそう」で終わらせず、「ここをチェックすればOK」という明確な基準を持っておくと、何度使っても安定した結果が出せるようになります。

この Atom では、AIの出力を評価するための「品質チェックシート」をあなた自身の手で作り、実際にAIの出力を評価するところまで行います。

品質基準設定フロー

前提を確認する

この Atom は、次の条件を想定しています。

すでに ChatGPT や Claude などの AI ツールを使ったことがある
AIに何かを出力させた経験が少なくとも1回ある

もし AI ツールをまだ触ったことがなければ、まずは AI に「自己紹介文を書いて」と頼んでみることから始めてください。

品質の「軸」を3つ決める

AIの出力を評価するとき、なんでもかんでも見ようとするとチェックが大変です。まずは3つの軸に絞ります。

料理でいうと「味・見た目・温度」のように、最低限押さえるポイントを決めるイメージです。

よく使われる軸の例を紹介します。

軸の名前	何を見るか	例
正確性	事実と合っているか	数字・日付・名前が間違っていないか
期待との一致	依頼内容に沿っているか	「300字以内で」と頼んだのに1000字になっていないか
読みやすさ	文章がわかりやすいか	専門用語が多すぎないか、段落が適切か

あなたが普段 AI に頼む仕事に合わせて、3つの軸を選んでみてください。

良い例と悪い例

良い例: 「正確性」「期待との一致」「読みやすさ」の3軸を選び、それぞれに「合格/不合格」のラインを決めている

悪い例: 「なんとなくいい感じか」だけで判断している（基準が人によって変わってしまう）

チェックシートを書く

3つの軸が決まったら、それぞれについて**「これならOK」という具体的な条件**を書きます。

料理でいうと「鶏肉の中心温度が75℃以上なら火が通っていると判定する」のような明確なルールです。

AIにチェック項目の案を出してもらう

条件を自分だけで考えるのが難しいときは、AIに手伝ってもらいましょう。次のようなプロンプト（＝AIへの指示文）をコピーして、ChatGPT や Claude に貼り付けてください。

私はAIの出力を評価するためのチェックシートを作っています。評価軸は「正確性」「期待との一致」「読みやすさ」の3つです。それぞれの軸について、合格・不合格を判定するための具体的な条件を2つずつ提案してください。条件は「〜であること」という肯定形で、数字や個数を含めてください。

AIが出してきた案をそのまま使う必要はありません。あなたの仕事に合うように書き換えて大丈夫です。大事なのは最終的な基準を自分で決めることです。

書き方のコツ

「〜であること」という肯定形で書く
数値や個数で表せるものは数字を入れる
あいまいな言葉（「適切に」「それなりに」）は避ける

良い例と悪い例

良い例:

「依頼したトピックについて3つ以上の具体例が含まれていること」
「文章の長さが指定した文字数の±10%以内であること」

悪い例:

「内容がそれなりに詳しいこと」（「それなり」の基準が不明確）
「全体的によく書けていること」（どこを見ればよいか分からない）

AI出力を実際にチェックする

それでは、チェックシートを使ってみましょう。

AI に何かを出力させる（例：「新入社員向けに、社内研修の目的を3行で説明して」）
出力結果をチェックシートの各項目に照らし合わせる
すべての項目をクリアしていれば「合格」とする
1つでも不合格があれば、AI に修正を依頼する

チェック実施画面

修正を依頼するプロンプト例

「もっと良くして」ではなく、どの軸が不合格で、どう直したいかを伝えます。AIに次のように頼んでみてください。

さっきの出力について修正をお願いします。チェック結果：「期待との一致」が不合格でした。理由：3行以内と指定しましたが、5行になっています。修正内容：3行以内に収めてください。それ以外は合格です。

このように「どの軸が」「なぜ不合格で」「どう直すか」の3点をセットで伝えると、AIは一発で的確な修正をしてくれます。

良い依頼: 「『期待との一致』が不合格でした。3行以内に収めてください」
悪い依頼: 「なんか違うので直して」

チェックシートを保存して使い回す

一度作ったチェックシートは、次回以降も同じように使えます。

メモアプリやテキストファイルに保存しておきましょう。AI に同じような依頼をするたびに、このシートを横に置いて確認する習慣をつけると、出力のブレがぐっと減ります。

チェックシートの完成イメージ

保存するシートは、たとえばこんな形になります。

【AI出力 品質チェックシート】
作成日: 2026年4月13日
対象: 社内研修資料のAI生成

■ 正確性
  □ 固有名詞（社名・製品名）が正しい
  □ 数字やデータに出典元がある、または事実確認済み

■ 期待との一致
  □ 指定した文字数の±10%以内
  □ 依頼した構成（見出し数、段落数）と一致

■ 読みやすさ
  □ 1文が80字以内
  □ 専門用語には括弧書きで説明あり

判定: 全項目クリア → 合格 / 1つでも× → 修正依頼

検証する

最後に、あなたのチェックシートが本当に機能するか確認します。次の2つを試してください。

再現性テスト: AI に2回同じような依頼をして、両方とも同じ基準で合格/不合格を判定できるか
他者テスト: 「合格」と判定した出力を別の人に見せたとき、その人も「よさそう」と思えるか

この2つがともに「はい」なら、あなたの品質基準は実用レベルです。もし「いいえ」がある場合は、チェック条件があいまいになっていないか見直しましょう。

つまずきやすいポイント

つまずき	対処法
軸が多すぎてチェックが大変	最初は3つまで。慣れてから増やす
「正確性」をどう判定していいかわからない	AI の出力の中から1カ所だけ選び、Google検索で事実確認する。全部確認しなくてOK
毎回ちがう結果になってしまう	チェック条件に数字が入っているか見直す。「適切に」「十分に」は数字に置き換える
AIに修正を頼んでも直らない	「どの軸が不合格か」「具体的にどう変えてほしいか」を伝え直す。上の修正プロンプト例を参考に
チェックシートを作ったが面倒で使わなくなった	最初の1週間は「AIを使うたびに必ずシートを開く」とルール化する。習慣になったら自然にできるようになる

成果物

種類: markdown_doc

検証: basic_manual_check_v1

証跡とメディア

証跡

screenshot

メディア

diagramscreen_capture

前提 atom

必須

なし

あると楽

なし

学習完了