AI_Control_Blueprint

>100 Views

June 25, 26

#ai

スライド概要

profile-image

はじめまして、yukikoと申します。 IT教育支援や、DX推進が可能です。 ◆ スキル LPIC レベル2 AI / Python Splunk BI(データ可視化・分析) ◆ その他 新卒・未経験の学生向けに、エンジニア転職を応援する資料を趣味で作成しています。 もしよろしければご活用ください。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

業務AIの暴走を防ぐ「制約と評価」の設計図 システム開発(レビュー)から動画制作(コンテンツ)まで、生成AIを制御する実践的プレイブック AIの「魔法」に頼るな。「仕組み」で勝て。

2.

AI運用: 単体 vs. 設計された制約 AI単体での運用 ・一貫性の欠如(毎回出力がブレる) ・ハルシネーション(根拠のない情報の生成) ・高コスト(無駄な生成の繰り返し) 設計された制約 ・RAGによる根拠の強制 ・フォーマットと評価ゲートによる出力制御 ・「新規生成ゼロ」による一貫性担保

3.

Part 1: 設計書レビューのAI基盤 (Input & Evaluation) 検索・評価・複数モダリティを活用し、仕様と実装の「乖離」を論理的に検出するアーキテクチャ。 Part 2: 研修動画の生成テンプレート (Output & UX) 「新規描画ゼロ」の制約、PiP、カラー心理学を用いて、ブレない動画を低コストで量産する枠組み。 両者を貫く共通哲学: 人間の設計した「型」がAIの品質を決める

4.

RAG精度向上の好循環 (The Virtuous Cycle of RAG Accuracy Impt) 2. 検索 (Retrieve) ハイブリッド検索 (BM25+Vector) / リランク (cross-encoder)。 根拠の質を上げる。 チャンク設計 (500~1000字 + 重複)。 3. 生成 (Generate) 典拠必須 / 典拠必須 / CoT (Chain-of-Thought) / 構造化・低温設定。 最後にモデルを調整。 1. 評価 (Evaluate) RAGAS / Judge. 最初に「測れる仕組み」を作る。回帰テスト。 大原則 (Golden Rule) 「精度は1か所では決まらない。評価を最初に作り、検索と根拠で底上げし、モデル変更は最後に行う。」

5.

テキスト (Text) 設計書・標準 → BERT/LLMの文脈埋め込み → 用語ゆれ・曖昧さの検出 音声 (Audio) 会議の発言 → Whisper/ESPnet + 話者分離 → 設計書の論点へ紐づけ 画像・図面 (Images/UI) UML・構成図 → LayoutLM / ViT → 本文との不一致・記載漏れ検出 コード (Code) 実装・I/F → CodeBERT → 「未実装・仕様外」の乖離検出 観点別・根拠付きの構造化所見 (Structured Findings by Perspective & Rationale) 評価・ゲート (Judge/RAGAS)

6.

1. 構造化 表をMarkdown化し、引用可能な単位に分割。 2. タスク分解 抽出(用語)・要約(要旨)・分類(観点)。 3. RAG突合 ドメイン用語辞書・社内標準と照合。(Tips: 辞書搭載で固有表現抽出の精度が急上昇)。 4. 言い換え提案 「等」「適切に」などの多義表現を検出し、具体化を促す。 生成される構造化所見 観点 該当箇所 重大度 根拠 観点1 文書A, P.2, L.5 高 規程B-123 観点2 音声記録, 15:30 中 ガイドラインC.2.1

7.

1. Whisper/ESPnet (専門用語は辞書で補正) 2. 話者分離+時刻 (誰が、いつ発言したか) 3. アクション抽出 決定 (Decision) 宿題 (Task) 未決 (Pending) 4. 設計書へ紐づけ (議事の論点を設計書の該当章へダイレクトにリンク)

8.

ビジュアルデータ LayoutLM (要素抽出) ViT (関係・矢印の把握) テキストデータ Specifications Document Section 1.2 Node A is connected to Node B Process involves data transformation The output is stored in Database X Requirements: Fast processing Secure storage 不一致・記載漏れ (Mismatch / Omission) 図では「Database Y」だが、本文は「Database X」 図と本文を相互参照して矛盾を検出。「図にあるが本文に無い/値が違う」を所見化する。(Tips: ベクタ元データがある場合はそれを最優先。画像解析は最終手段)。

9.

仕様 (Specification) 実装 (Code/CodeBERT) テスト (Test Code) トレーサビリティ・マトリクス (Traceability Matrix) 隠れ仕様 (Hidden Specs) Key Insight 「仕様⇔テスト⇔実装」の三点照合にすることで、仕様にもテストにも無い実装=隠れ仕様を発見できる。未実装・仕様外・値の乖離を抽出。

10.

上位要件 下位要件 設計 コード (Code) テスト (Test) 所見+典拠 → Judge (妥当性採点) & RAGAS (忠実性 定量化) → 閾値判定 合格 (Pass) → マージ (Merge) 未達 (Fail) → 差戻し (Return) Key Insight 全所見に「典拠」を必須化。CIに組み込み、横断的に「抜け」と「劣化」を止める。

11.

映像制作フェーズの課題と「新規描画ゼロ」の法則 全生成: Full Generation ・コスト大 (High Cost) ・一貫性リスク (Inconsistency Risk) ・生成のたびにブレる 制約動画: Constraint-Based/PiP ・コスト小 (Low Cost) ・完璧な一貫性 (Perfect Consistency) ・既存素材の使い回し Core Rule 動きや奥行きは「レイアウト」「色」「カメラワーク」で演出する。

12.

デザイントークン (三面図・カラーパレット) を全カットの色味基準とし、ブレを許さない。 メイン画面 (可変)。説明内容に応じて画像を切り替える。 PiP / 小窓固定 (講師役)。常に人の存在感を残し、安心感を演出する。(非対称設計)。 下部テロップ。Tipsや要点の繰り返しを常時ループ表示し、情報密度を高める。

13.

3部構成のストーリーボード: 安心→重要→行動 Act 1 安心感/Basic. 講師役の挨拶 Act 2 重要/Alert. 背景変更+情報合成 Act 3 行動/Action. パンによる視線誘導 Key Mechanics ・カラー心理学: 色を情報の重要度と1対1で対応 (最大3色まで)。集中モードのトリガー。 ・カメラワーク (ズーム/パン): 単なる動きではなく「次に見てほしい場所への視線誘導」。

14.

The Envelope Concept 入力を縛る (Bounding Inputs) ・RAG ・三点照合 ・チャンク設計 ・辞書。 Human Constraints AI Model / LLM 出力を縛る (Bounding Outputs) ・PiPレイアウト固定 ・フォーマット指定 ・カラー心理学。 品質ゲート (Evaluation) Judge, RAGAS, 閾値判定。 精度や品質はAI単体では決まらない。AIの前後に設けた「人間の設計 (検索・制約・評価)」こそが、実務レベルのAI活用を成功させる鍵である。

15.

成功のための「仕組み化」チェックリスト 開発・レビュー (Engineering) □ 評価指標 (RAGAS/Judge) をモデル選定より先に構築しているか? □ 音声や図面情報は、設計書のテキスト本文と紐づけているか? □ 仕様・テスト・実装の「三点照合」で隠れ仕様を検出しているか? □ すべての所見に「典拠(ソースリンク)」を必須化しているか? 制作・クリエイティブ (Production) □ 動画の毎フレームで新規生成せず、静止画とPiPを流用しているか? □ メイン画面 (可変) と小窓 (固定) の非対称レイアウトを守っているか? □ 情報の重要度を示す色は「3色以内」に制限しているか? □ カメラワーク (ズーム/パン) を明確な視線誘導の目的で使っているか? 参考文献: Transformer (Vaswani 2017), RAG (Lewis 2020), LLM-as-a-Judge (Zheng 2023)