AI時代のフィードバックサイクル設計 AI の速度を殺さない開発フローの作り方

1.

CircleCI スポンサーセッション | 2026年5月27日 AI時代のフィードバックサイクル設計 AI の速度を殺さない開発フローの作り方岡本秀高 ( @hidetaka_dev ) Senior Field Engineer #QiitaConference 1

2.

自己紹介 Hidetaka Okamoto (岡本秀高 ) ● CircleCI Senior Field Engineer ● 年間100本ペースで記事を書く人 ● CircleCIJapan ( Qiita )にて4月は平日毎日更新 https://qiita.com/CircleCIJapan 2

https://qiita.com/CircleCIJapan

3.

CircleCI について AI 速度でコードを検証する、世界トップクラスの CI/CD プラットフォーム 10K 200万 9,000万 300+ 顧客企業ユーザー（開発者）従業員数（全世界）月間ビルド数 3

4.

AI駆動開発におけるソフトウェア企業の課題 4

5.

AI駆動開発におけるソフトウェア企業の課題 AIに書かせたコードの多くが本番環境にデプロイされていない 5

6.

State of Software Delivery Report 2026 デリバリーのパイプラインから、分析出典: CircleCI State of Software Delivery Report 2026 https://circleci.com/resources/2026-state-of-software-delivery/ 6

https://circleci.com/resources/2026-state-of-software-delivery/

7.

State of Software Delivery Report 2026 世界的にコードの⽣成量は増加 +59% 前年⽐ / 全プロジェクト平均過去7年で⾒たことのない規模の変化が開発の現場で発⽣している出典: CircleCI State of Software Delivery Report 2026 https://circleci.com/resources/2026-state-of-software-delivery/ 7

https://circleci.com/resources/2026-state-of-software-delivery/

8.

Validation Gapの発生ただし多くのコードがデリバリーされていないブランチ別中央値チームのスループット変化メインブランチでの成功率 8

9.

成功した企業との格差がより拡⼤する上位5%チームのWF実行量中央値チームの WF 実行量 97%+ +4% 下位25%チームの WF 実行量前年比大幅な生産性向上を実現 0% 生成したものをどれだけリリースできているかが、 AI導入効果の差を生み出す 9

10.

AIが介在する前コード生成（手元の開発）とリリースまでのWFは均衡していた Inner Loop Debug Outer Loop Plan 変更 (Change) Release Build Deploy Test フィードバック (Feedback) Validate Code 10

11.

After AI コード生成だけが加速し、ループが詰まり出した Inner Loop Debug Outer Loop Plan 変更が大量に流れ込む Release Build Deploy Test フィードバックは追いつかない Validate Code 11

12.

開発におけるボトルネックが、後ろの工程にシフトしたコーディングレビューテストデプロイリリース 10x 12

13.

開発におけるボトルネックが、後ろの工程にシフトしたコーディング 10x レビューテストデプロイリリース ⚠ ⚠ ⚠ ⚠ 1x 1x 1x 1x 13

14.

LLMと20分作業して、 CIの実行に 2時間かかるなら、それは機能しない。フィードバックループの各段階は、同じオーダー（桁）の時間で揃っていなければならない。 — Liz Fong-Jones Honeycomb Technical Fellow) 14

15.

AI の速度に追従できるフィードバックの形が必要 15

16.

フィードバックを 4 つの観点で再設計する速度 AI と同じオーダー（桁）の時間で返るか粒度適切な粒度とタイミングで検証を実施できているか形式人間・エージェント、どちらでも実行できる形か記憶揮発する文脈・暗黙知が、リポジトリやCI に外在化されているか

17.

loop.circleci.com CircleCI Research（Loop Lab）による AI駆動開発の実験 17

18.

実験1 デバッグ‧修正は⼀⼈でやるか、みんなでやるか https://loop.circleci.com/one-agentvs-a-team-what-benchmark-data-sa ys-about-multi-agent-debugging 18

https://loop.circleci.com/one-agent-

19.

実験1: デバッグ・修正は一人でやるか、みんなでやるかバグの修正方法をソロ vs チームで比較検証 52個のバグを仕込んだ ECアプリで検証セキュリティ・性能・コード品質・ロジックの 4カテゴリ。同じClaude Opus 4.6を、ソロと「専門特化チーム」で比較。重み付けスコア (Security ×3.0, Logic ×2.5, ...) で評価。 19

20.

実験1: デバッグ・修正は一人でやるか、みんなでやるかバグの修正方法をソロ vs チームで比較検証 52個のバグを仕込んだ ECアプリで検証セキュリティ・性能・コード品質・ロジックの 4カテゴリ。同じClaude Opus 4.6を、ソロと「専門特化チーム」で比較。重み付けスコア (Security ×3.0, Logic ×2.5, ...) で評価。チーム構成で改善量が +75% 性能・ロジックなど、文脈を横断するバグでチームが圧勝。同じモデル × 同じコードベース × 同じ重み。違いは「並列に走らせて分担させたか」だけ。 20

21.

実験1: デバッグ・修正は一人でやるか、みんなでやるか複数のバグ修正は、分割・並列して修正する • • バグの数だけコンテキストが肥⼤化する ○ エラーの再現 ○ ログやコードの調査 Context Rot が発⽣しやすくなる ○ 抜け漏れやハルシネーション Subagentあるいはチケットシステムなどを使い、１つの問題に集中させる Solo Agent 🤖 1 Agent Security Performance Logic Quality vs Team Agents 🤖 Security 🤖 Performance 🤖 Logic 🤖 Quality 21

22.

実験2 AI の「チェックOK」は信⽤に値するか？ https://loop.circleci.com/we-let-an-ai -agent-say-i-passed-was-it-actuallygood 22

https://loop.circleci.com/we-let-an-ai

23.

実験2: AI の「チェックOK」は信用に値するか？ AI も「自分の環境では動作する」と主張する • ⾃律的なコーディングエージェントを利⽤ ○ RalphループをベースにCI対応した研究⽤の独⾃OSS ○ CIのFBも待って取得できる ○ • https://github.com/CircleCI-Research/ralph-ci 同じゲームアプリ開発を指⽰ CI チェックの有無だけを変更 23

https://github.com/CircleCI-Research/ralph-ci

24.

実験2: AI の「チェックOK」は信用に値するか？ AI も「自分の環境では動作する」と主張する • ⾃律的なコーディングエージェントを利⽤ ○ RalphループをベースにCI対応した研究⽤の独⾃OSS ○ CIのFBも待って取得できる ○ • CI チェックを必須化 100% CIが成功 CI チェックをスキップ 20％しかCIをパスできなかった https://github.com/CircleCI-Research/ralph-ci 同じゲームアプリ開発を指⽰ CI チェックの有無だけを変更 24

https://github.com/CircleCI-Research/ralph-ci

25.

実験2: AI の「チェックOK」は信用に値するか？ AI も「自分の環境では動作する」と主張する • ⾃律的なコーディングエージェントを利⽤ ○ RalphループをベースにCI対応した研究⽤の独⾃OSS ○ CIのFBも待って取得できる ○ • CI チェックを必須化 100% CIが成功 CI チェックをスキップ 20％しかCIをパスできなかった https://github.com/CircleCI-Research/ralph-ci 同じゲームアプリ開発を指⽰ CI チェックの有無だけを変更 Code is cheap. Green CI is priceless. コードの生産者による「自己申告」ではなく、CIによる検証で完了を定義すべき 25

https://github.com/CircleCI-Research/ralph-ci

26.

実験2: AI の「チェックOK」は信用に値するか？ Learn: エージェントの作業中にできる限りの FBを出すコーディング中 Push - PR作成まで Review / マージまで Inner Loopでのフィードバックレビュー前の最終チェック Outer Loopでの検証 Type Check CI や実環境ベースのビルド Staging / Branch Deploy Lint より広範囲なテスト E2E / Smoke Unit Test Whyの明文化セキュリティスキャン 26

27.

実験2: AI の「チェックOK」は信用に値するか？ Learn: エージェントの作業中にできる限りの FBを出すコーディング中 Push - PR作成まで Review / マージまで Inner Loopでのフィードバックレビュー前の最終チェック Outer Loopでの検証 Type Check CI や実環境ベースのビルド Staging / Branch Deploy Lint より広範囲なテスト E2E / Smoke Unit Test Whyの明文化セキュリティスキャン早く手に入る検証 / FB はコード生成の近くで行う 27

28.

Chunk Sidecar PREVIEW Inner Loop（ローカル環境）にて、CIの検証を実施する mirrors CI な環境 <60秒でフィードバック主要コーディング AI に対応 $ brew install CircleCI-Public/circleci/chunk 28

29.

Smarter Testing Beta テスト結果を継続分析し、必要なテストのみを選別‧実⾏する最適化機能影響のないテストの⾃動スキップコードの変更差分を瞬時に解析し、関係のないテストを排除してCI時間を⼤幅に削減並列実⾏の動的最適化選別されたテストを複数ジョブへ⾃動分割し、コンテナの計算リソースを無駄なく活⽤次回の⾼速化に向けた⾃動学習実⾏後のカバレッジを継続分析し、次回の選別精度を⾼める影響度データを⾃動更新 29

30.

実験3 オンボーディングを Wiki でやるか、スキルにするか https://loop.circleci.com/team-onbo arding-buddy-claude-code-skills-vsthe-wiki-maze 30

https://loop.circleci.com/team-onbo

31.

Wikiの迷路を、実行可能な Skillに置き換えるチーム配属時のオンボーディングを Claude CodeのPluginとして配布 Agent Skills + MCPで「実際に読んで」検証を行う team-name/ ├── plugin.json └── skills/ ├── onboarding/SKILL.md ← 入口 ├── access/SKILL.md ← MCP実検証 31

32.

Wikiの迷路を、実行可能な Skillに置き換えるチーム配属時のオンボーディングを Claude CodeのPluginとして配布 Agent Skills + MCPで「実際に読んで」検証を行う Wiki: ⾃分で探索して発⾒し、解釈が必要古い⼿順書を12個読み、13個⽬を⾒逃し、 3⼈にDMして相談。セットアップ時の１⾏のtypoで半⽇が消える team-name/ Skill + MCP が伴⾛しながらチェック ├── plugin.json └── skills/ ├── onboarding/SKILL.md ← 入口 ├── access/SKILL.md ← MCP実検証設置の抜け漏れがないかなどをその場で相談。エージェントが設定を検証し、フィードバックをリアルタイムに実施 32

33.

情報を増やすのではなく、学びのルートを整備する "Onboarding is not an information problem. It is a routing problem." オンボーディングは情報の問題ではない。正しい順序で動かすための、設計の問題だ暗黙知は Skill で外在化。情報を増やすのではなく、必要な時に検証が走るルートを与える。 33

34.

Chunk CLI + Claude Code PREVIEW 明⽂化されていないコードレビューの基準を、過去の PR ベースで明⽂化する $ brew install CircleCI-Public/circleci/chunk $ chunk build-prompt \ --org myorg --repos api,backend --top 5 Step 1/3 Discovering Top Reviewers [1/1] web-ui-consolidated ✓ Details written to .chunk/context/review-prompt-details.json ✓ PR rankings written to .chunk/context/review-prompt-details-pr-rankings.c sv Step 2/3 Analyzing Review Patterns Sending 194 comments (~97387 tokens) ✓ Analysis written to .chunk/context/review-prompt-analysis.md Step 3/3 Generating PR Review Prompt ✓ Prompt written to .chunk/context/review-prompt.md ⏺ Review Summary Files reviewed: 4 Issues identified: 2 Findings 1. Component name suffix swapped between CI and deploy configs .circleci/config.yml:45 and .circleci/deploy.yml:33 | Critical The two changes swap the -artifact suffix between the files in opposite directions: config.yml drops the -artifact suffix from the component name, 34

35.

AI 時代に必要なフィードバックの 4 形式速度 AI と同じオーダー（桁）で返らないとフィードバックは機能しない粒度 1つのジョブに詰めず、 Inner / Push / Review に目的を分ける形式人間しか読めない手順を、エージェントが実行できる形式に置き換える記憶揮発する文脈・暗黙知を、リポジトリ・ CI・MCP に外在化する → 実験2 / Chunk Sidecar が Inner Loop で <60秒の検証を提供 → 実験2 / Smarter Testing で変更影響だけを検証 → 実験3 / SKILL.md・MCP・Chunk CLI build-prompt → 実験1 (Context Rot) と実験3 (Skill での暗黙知外在化 ) 35

36.

自社の開発フローを検証する 4 つの問い速度 AI が書いてから CI フィードバックが返るまで、何分かかっているか粒度変更影響に絞って検証する仕組みがあるか形式新人・エージェントが最初に読む手順は、実行可能な形式か記憶過去の失敗パターンや暗黙知が、リポジトリや CI に外在化されているか 36

37.

Thank you. Q & A / Feedback Welcome 岡本秀高 / CircleCI合同会社 loop.circleci.com / circleci.com 37

AI時代のフィードバックサイクル設計 AI の速度を殺さない開発フローの作り方

Hidetaka Okamoto

関連スライド

Cloudflare Pages & Functionsで Astroサイトを運用している話

WordPressとhonoで、 Cloudflare Workersプロキシパターンをやってみた

個人のポートフォリオサイトを CloudflareとAstroで作った話

大規模言語モデルではじめる自動化ー LLMはWordPress 制作・運用をどう変えるのか？

個人のポートフォリオサイトを NetlifyからPagesに移した話

LangChainとWorkers AI / Vectorizeを使ってイベント情報RAGを作ってみた話

各ページのテキスト

AI時代の フィードバックサイクル設計 AI の速度を殺さない開発フローの作り方

Hidetaka Okamoto

関連スライド

Cloudflare Pages & Functionsで Astroサイトを運用している話

WordPressとhonoで、 Cloudflare Workersプロキシパターンをやってみた

個人のポートフォリオサイトを CloudflareとAstroで作った話

大規模言語モデルではじめる 自動化 ー LLMはWordPress 制作・運用をどう変えるのか？

個人のポートフォリオサイトを NetlifyからPagesに移した話

LangChainとWorkers AI / Vectorizeを使ってイベント情報RAGを作ってみた話

各ページのテキスト

AI時代のフィードバックサイクル設計 AI の速度を殺さない開発フローの作り方

大規模言語モデルではじめる自動化ー LLMはWordPress 制作・運用をどう変えるのか？