ループエンジニアリングで再考する仕様書駆動開発

25.3K Views

June 14, 26

#ループエンジニアリング #仕様書駆動開発 #AIエージェント #文脈管理 #開発プロセス

スライド概要

仕様駆動開発を、AIエージェント時代の「文脈を設計する技術」として捉え直す。仕様、計画、検証、エビデンスを一度きりの成果物ではなく、次の実行へ戻るループとして扱い、ドキュメントが開発の判断と再現性をどう支えるかを整理、ソフトウェア開発の関心レイヤーがコードからドキュメントに移っていることをまとめます

laiso 𝕏

@laiso

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

AIで技術発表スライドを作るコツ

laiso 𝕏 4K

Flutter Android Plugin v1 Embedding APIの廃止について

laiso 𝕏 2K

【OpenClaw】VPSでセルフホストしているエージェントの作業を、人間にもLLMにも参照できる場所にしたメモ

laiso 𝕏 1.7K

【OpenClaw】格安VPSでAIボット運用基盤を作ったメモ

laiso 𝕏 1.1K

AIの出力をHTML化する価値はどこにあるのか？

laiso 𝕏 1.1K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

各ページのテキスト

ループエンジニアリングで再考する仕様書駆動開発

仕様書駆動開発とは実装前に合意を作る型要求、設計、タスク、完了条件を先に言葉にして、何を作るかを揃えてから実装する。先に書くのは、きれいな仕様書そのものではない。実装前に、目的、制約、受入条件、作業単位を揃える。その合意が、エージェントへ渡す最初のコンテキストになる。仕様、計画、タスク、実装の順に進む各段階でMarkdown成果物を作るエージェントへ構造化した文脈を渡す GitHub Spec Kit

https://github.github.com/spec-kit/

登場時の目的仕様、設計、タスクで出力範囲を狭め、AIが逸れないようにする。最初は、コード生成を制御する方法論として読めた。仕様を先に書き、作るものを固定する設計とタスクへ分け、出力のブレを減らす人間が作ったレールの上でAIにコードを書かせる要求、設計、タスクを3つのファイルに分ける高レベルのアイデアを実装計画へ変えるタスク実行の進捗を追跡する Kiro docs / Specs

https://kiro.dev/docs/specs/

ループエンジニアリングとは Addy Osmaniの記事では、Peter SteinbergerとBoris Chernyの発言を並べて、人間が毎回promptする段階から、loopがagentをpromptする段階への変化として整理している。 Peter Steinberger: coding agentを毎回promptするのではなく、 agentをpromptするloopを設計する。 Boris Cherny: Claudeをpromptするloopが走り、人間の仕事は loopを書くことになる。仕様書駆動開発も、コード出力の制御からループの文脈設計へ読み替えられる。 Peter Steinberger と Boris Cherny の発言を並べて紹介 loop engineeringを、agentにpromptする systemを設計することとして説明 recursive goalと完了までの反復として捉える記事: Addy Osmani / Loop Engineering

https://addyosmani.com/blog/loop-engineering/

ゴール単位の委任 Ralph Loopは、ゴールを置き、完了条件を確認し、未完了なら同じゴールへ戻す発想を示した。そのコンセプトは、/goalのような標準機能に取り込まれつつある。 Ralph Loop: ゴール、完了条件、未完了時の再実行をひとつのループにする。 /goal: 達成したい状態を渡し、計画、実行、確認をエージェントに委ねる。仕様は、ゴール、制約、受入条件としてループに渡す文脈へ変わる。 Ralph Loop -> ゴール + 完了条件 -> /goal -> 計画 -> 実行 -> 確認 Stop hook が終了を止める completion promise で完了条件を置く未完了なら同じプロンプトを戻す GitHub: Ralph Wiggum Plugin

https://github.com/anthropics/claude-code/blob/main/plugins/ralph-wiggum/README.md

人間はループを設計する Anthropicの文脈では、agentのループは実行のたびに履歴、ツール結果、外部データを増やす。人間は、その中から次の推論へ何を戻すかを設計する。ループが回るほど、次のターンに使えそうな情報は増える。全部を入れると、文脈は重くなり、重要な情報が埋もれる。だから、目的、観測結果、判断、未完了の理由を選び直して戻す。実行 -> 観測 -> 選別 -> 次のコンテキスト -> 再実行 agent loop は次ターンに関係し得る情報を増やす context engineering は限られた文脈へ何を入れるかを選ぶこと promptを書く一回の作業ではなく、毎ターンの反復的な調整になる Anthropic / Effective Context Engineering

https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

ループを次回へつなぐには、コード差分だけでなく、何を目指し、何を確認し、なぜ戻すのかが必要になる。それらはソースコードだけには残らない。ゴール制約判断検証未完了理由次の入力何を達成しようとしているか守る条件は何かなぜその進め方にしたか何で完了と見たかなぜ戻す必要があるか次回に何を渡すか agent loop は情報を増やす次の推論に必要な文脈を選ぶ文脈は毎ターン更新される作業対象になる Anthropic / Effective Context Engineering

https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

コードだけでは意図と理解が残らないエージェント時代は、コードを生んだ会話や途中の編集も開発履歴になる。最終差分だけでは、なぜそう書かれたかを次の人間やエージェントが追いにくい。コードを生成する会話がソフトウェアの実質的なこれまでこれから sourceになりつつあるコード差分 -> テスト -> あと追いの説明ゴール -> 判断 -> 検証 -> コード + エビデンス -> 次の入力メッセージとその編集を並べて記録するエージェントもコードの背後にある文脈を参照できる Zed Blog / Software Is Made Between Commits

https://zed.dev/blog/introducing-deltadb

エビデンスで意図を記録するコードだけで失われやすい意図を、説明、実行コード、出力、検証条件として残す。次のエージェントは、主張ではなく再現できる証拠から再開できる。説明実行出力検証なぜ確認したかどのコードを動かしたか何が返ったか完了条件と合っているか説明、実行コード、出力をMarkdownにまとめる verifyでコードブロックを再実行し、出力差分を確認するエージェントの作業を読める文書と再現可能な証拠にする GitHub: simonw/showboat

https://github.com/simonw/showboat

10.

ストックとフローあらかじめ設置しておく文脈と、実行中に生まれる文脈を分ける。エビデンスは基本的にフローで、次回も使うものだけ仕様、ルール、スキルへ戻す。ストックストックフローフロー昇格 AGENTS.md / CLAUDE.md / rules SKILL.md / hooks / settings plan / tasks / tests Artifacts / evidence / recordings 次回も使うものだけ戻す Artifact はagentが作る構造化されたdeliverable タスクを進めながら進捗と思考を人間へ伝える plans、diffs、browser recordingsなどを検証可能な形にする Google Antigravity Docs / Artifacts

https://antigravity.google/docs/artifacts

11.

残した文脈が次の作業の入力になる仕様、判断、検証、エビデンスが次の実行で再利用されるなら、それは一度きりのメモではなく保守すべき資産になる。仕様判断検証エビデンス何を作るかを再利用する同じ議論を繰り返さない完了条件を引き継ぐ次の実行を始める毎ターン、必要な文脈を選ぶ蓄積した情報を次の行動へ渡す文脈の管理がエージェントの性能に直結する Anthropic / Effective Context Engineering

https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents

12.

ドキュメントによるループエンジニアリング仕様書駆動開発は、コード生成を制御するための仕様作成に限られない。仕様、判断、検証、エビデンスを更新しながら次の実行へ戻すループとして捉え直せる。仕様判断検証エビデンス何を作るかを次の実行へ渡すなぜそうしたかを残す再確認できる形にする次の実行へ戻す保守は仕様を進化させることになるチームの意図は自然言語、設計資産、原則で表される仕様が中心のsource of truthになり、計画とコードは出力側になる GitHub Spec Kit / spec-driven.md

https://github.com/github/spec-kit/blob/main/spec-driven.md

13.