コミュニケーションとAI ~システム開発における「2つのエンジン」を統括する

>100 Views

June 22, 26

スライド概要

査読済み論文をメルヘン可愛いしろうさぎアナウンサーに説明してもらいました!

profile-image

はじめまして、yukikoと申します。 IT教育支援や、DX推進が可能です。 ◆ スキル LPIC レベル2 AI / Python Splunk BI(データ可視化・分析) ◆ その他 新卒・未経験の学生向けに、エンジニア転職を応援する資料を趣味で作成しています。 もしよろしければご活用ください。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

システム開発における「2つのエンジン」を統括する コミュニケーション(対人)とプロンプト(対AI)で回す、負担ゼロのプロジェクト推進術 人間中心の コミュニケーション AIによる アルゴリズム実行 うさうさ研修工房 | 2026年6月 | 国内・海外最新文献準拠 NotebookLM

2.

AIに手を動かさせ、人間が検証と判断を担う ① コミュニケーション術 認識をそろえる「言い方」 ・お客様に負担をかけない ・曖昧さを排除し、合意を形成する ② AIサポートプロンプト 手を動かす「指示」 ・成果物を自動生成させる ・依存関係のマッピングとデータ整形 小さく回す 仮で進める 合意 未確定を 可視化する 全部決めてから作らず、 最小で作って見せ、 反応で要求を固めます。

3.

開発ライフサイクルの全11シーンを2軸で突破する 上流設計 (Upstream) 実行と検証 (Execution) 適応と修正 (Adaptation) 評価と着地 (Landing) 継続的合意 (Continuous) 01 要件定義 02 詳細設計 03 実装 04 テスト 05 バグ修正 06 仕様変更 07 修正報告 08 リリース 09 PoC・ 評価 10 MTG・ 会議 11 トラブル 対応 この11シーンを、人とAIの2つの エンジンで乗り越えていきます。

4.

Phase 1: 曖昧な要求を解像度の高い設計図へ変換する 01 要件定義 / 02 詳細設計 お客様への言い方 AIへのプロンプト ・「私の理解では〇〇です が、合っていますか?」 (仮説確認) ・“速く”は何秒以内が理想 でしょう?」 (形容詞の数値化) ・「A案(〇〇優先)とB案 (△△優先)、業務上どちら が大事ですか?」 (優先順位の強制) ・機能要件(FR)と非機能 要件(NFR)を厳格に分離 ・UML/Mermaid形式で 設計図を出力 ・未確定な前提条件を別 リストで抽出 原則:設計判断はAIに任せず、「人が決める論点」としてAIに提示させる

5.

Phase 2: AIによる制約付き生成と、 人間による網羅的検証 03 実装 / 04 テスト お客様への言い方 - 期待値調整 AIへのプロンプト - 厳格なガードレール 【進捗の可視化】 「現在〇〇まで完了、残り △△。リスクは□□、対 応案はこうです」 【事実に基づく報告】 「〇件中△件PASS、 〇件中△件PASS、未達 は□□。事実と原因を分 けます」 【実装の制約】 単一HTMLや標準ライブラ リのみに強制。生成コード は人間の実行・レビューが 前提であると明記。 【テストの網羅性】 正常/境界/異常/同時操作 を網羅。「まぐれPASS」を 排除するため、同条件で 複数テストケースを生成。

6.

Phase 3: 変更と不具合を歓迎し、影響範囲を正確に制御する 05 バグ修正 / 06 仕様変更 / 07 修正報告 お客様への言い方 - 信頼構築 AIへのプロンプト - 影響範囲のシステム的マッピング 〔結論〕 完了 〔詳細〕 原因と対応 〔次〕 再発防止 ・客観的事実と、 主観的所感/見込みを 完全に分離する ・謝罪は適度に留め、 「再発防止」の徹底 に注力する 【バグ修正】 再現条件 → 原因(仮説と確定を分離) → 恒久対応。エラーの握りつぶ し(bare catch等)を禁止。 【仕様変更】 機能、データ、互換性、 移行、テスト全体への影 響を洗い出す。 トレードオフ(今やるか/ 次期か)を算出。

7.

Phase 4: 環境移行の依存関係を洗い出し、 完了基準を事前合意する DEV PRO 商用 (Prod) Go/No-Go ゲートウェイ 08 リリース / 09 PoC・評価 お客様への言い方 - 事前合意 AIへのプロンプト - リスク低減 【リリース準備】 「反映日時・影響・切り戻し手順を事前に共有し ます」 【PoCの枠組み】 ・「“成功”をどの精度/状態でOKとするか先に合 わせたい」 ・「PoCは検証です。確かめる一点を絞りましょ う」 【環境マッピング】 ・DEV/PRO商用間のデータ、設定、依存関係の差 分を洗い出す。 【評価の厳格化】 ・事前にNo-Go基準を設定。AIの過信を排除し、 事実ベースのみで厳密に精度を測定させる。 判定(Go/No-Go/Pivot)を 下すのは常に人間です。

8.

Phase 5: 会議の時間を奪わず、事実とネクストアクションだけを残す 10 MTG・会議 / 11 トラブル対応 事前 (Before) 会議中 (During) 事後 (After) 【AIの自動化】 ゴール、論点、選択肢をまとめ た「ペライチ(1枚)のブリーフィ ング資料」を事前生成。 【人間のファシリテーション】 「本日のゴールは〇〇の合意。 論点は3つ、20分で進めます」と 宣言し、決断のみに集中する。 【人間】 「決定事項①②と宿題 ③(誰がいつ)を確認します」 【AI】 時系列の事実と推測を分 離して要約を生成。顧客への確 認メッセージを「期限」と「二択」 の厳格なフォーマットで作成。 会議は準備が9割。AIが資料と 議事録を担い、人間は意思決定 と関係構築に注力します。

9.

技術深掘り編:精度の向上だけでは、本番運用の壁は越えられない プロンプト技術 CoT フォーマット制御 RAG構成 出力の正確さ これまで見てきた領域 (精度とプロンプト) セキュリティの 脆弱性 実運用の巨大な死角 (The Blind Spots) 法務・著作権 リスク 評価の妥当性 (LLM-as-judge) 公平性とバイアス 運用コストと レイテンシ 組織の過信と 定着 「プロンプトの精度が上がる」ことと、 「システムが安全に実運用できる」ことは同義ではない。

10.

実運用に潜む8つの死角:未検証の問いを可視化する 検証済み(データ裏付けあり) ✅セキュリティ (Security) ✅評価の妥当性 (Evaluation Validity) 未検証(今後の調査が必要) ⚠️コスト・レイテンシ ⚠️法務・著作権 ⚠️公平性・バイアス ⚠️組織・過信 ⚠️再現性・更新 ⚠️日本語・固有差 原則『嘘つかず』= 存在しない精度値は作らない。 測り方と前提を示す。

11.

PREMIUM TACTICAL CONTROL BOARD 死角① セキュリティ:RAGの外部文書が攻撃の入り口になる Threat-Modeling Architecture Diagram 外部文書 (PDF/Web) Prompt Injection 1. 入出力フィルタ (Filters) RAGシステム 2. 最小権限の原則 (Least Privilege) LLM出力の 汚染 2. 破認入学力の権利 (DINLの確認) 3. 人による承認 (Human Approval) 不正な エージェント 操作 情報漏えい 出典: OWASP Top 10 for LLM Applications 2025 (2年連続1位の脅威)

12.

死角② 評価の妥当性:AIによる採点 (LLM-as-judge) を 鵜呑みにしない 選択肢1 (先に提示) 選択肢2 (後に提示) 選択肢2 (先に提示) 選択肢1 (後に提示) 位置バイアス(Position Bias)による判定の反転 【AI採点に潜むバイアス】 ・自身の出力を好む傾向 ・冗長な回答を好む傾向 ・選択肢の順番で評価が変わる位置バイアス 【防御策(Defense)】 ・選択肢の順番を入れ替えて複数回テストする ・複数の異なる審査モデル(Judges)を使用する ・必ず人間のベースライン評価と突合する 出典: Shi et al., Position Bias in LLM-as-a-Judge, 2024

13.

PREMIUM TACTICAL CONTROL BOARD 次なる問い:実運用に向けた検証ロードマップ 法務・規制 コスト・運用 再現性 日本語格差 【問い】 学習/入力データの 権利・契約・AI規制 はどうなっているか? 【確認先】 各社規約、法務部門 【問い】 RAGや推論のレイテン シと運用負荷は、 ROIに見合うか? 【確認先】 自前ベンチマーク の実施 【問い】 モデル更新によって出 力が変動し、テストが 通らなくなるリスクは? 【確認先】 自前の回帰測定 環境の構築 【問い】 英語圏の論文の知見 は、日本語環境でも そのまま成り立つか? 【確認先】 国内事例の追加調査 エンジニアリングの誠実さ: 不確実性を隠さず、仮説を持って検証し続けること。 「未知」を「既知」に変える、 組織としての学習プロセスです。

14.

PREMIUM TACTICAL CONTROL BOARD まとめ:人間とAIの協調による、次世代のシステム開発 ① 対人コミュニケーション 認識のズレを未然に防ぎ、 顧客の負担をゼロにする 対話術を駆使する。 ② AIによる手作業の自動化 AIに手を動かさせ、人間は 「検証と判断」という本 来のエンジニアリングに 集中する。 ③ 死角の直視と検証 精度の追求にとらわれず、 セキュリティやバイアス など「実運用の死角」を 直視し、嘘をつかない検 証を行う。 【出典・参考文献集】 ・IPA要件定義ガイド / 超上流の原理原則 ・要求 volatility (Informatics/MDPI 2024) ・OWASP Top 10 for LLM Applications 2025 ・LLM4SE (TOSEM 2024) / テスト (TSE 2024) ・Position Bias in LLM-as-a-Judge (Shi et al., 2024)