エージェント開発のAIワークフロー

602 Views

March 12, 26

#codex #札幌 #agent #エージェント #システム開発 #llm #arize phoenix #クラウドネイティブ #lanngraph #AIエージェント開発 #AIワークフロー #LLMOps #インナーループ #アウターループ

スライド概要

20260311 https://seb-sapporo.connpass.com/event/384654/
での前座登壇です。

エージェント開発の個人的なプロセス整理です。プロセスにおいて３つのループにエージェント開発を分類する中で、最新のモデルによってかなりの作業を委譲できるようになった中での、継続的な評価や評価のためのエンジニアリングがエンジニアリングとしては比重が重くなっていってるという自分の体験を整理したものです。

掲載にあたり、「エージェントに何でも任せられる中でのエンジニアとしてのあり方についてどうなるか？」
質問が出た点について私如きが高尚な回答（）をしたので、補足のためにスライドを追加しました。

エージェント基盤はSoAと呼ばれており、SoRを前提としておりそれを通じたデータアクセスやガバナンスなどの統制要素が必要となってきます。改めて眺めても大きなものであり、自社のドメインやウィルに即したシステム仕様を翻訳できるエンジニアの存在は以前として必須であるというのが私の考えです。

会場の雰囲気は良くて普段あまり接点のない若い方々が一杯いたので最初だけ緊張したのですが、
いい雰囲気の中でストイックな質問もらったので非常に楽しかったです。

ryoppippiさんに声かけて良かった

n_okubo

@n_okubo

スライド一覧

札幌市在住のアプリケーションエンジニアです。Azureとアプリケーション開発についての勉強会スライドを公開しております。内容は個人活動によるもので、所属組織や公式見解ではありません。内容についてのご指摘等ございましたら、twitterなどでご連絡いただけると幸いです。 bio: application developer, Java, python, typescript. concern at agentic app and Local LLM. opinion is on my own.

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

Codexについて

openai codex

n_okubo 870

LangGraphの設計で悩んだこと_2025_08_23_JMLT

llm lanngraph langchain architecutre アーキテクチャ

n_okubo 700

第一回 Jazug_Sapporo rebootイベント「ゆるいAzure Functions」

札幌 azure azure functions

n_okubo 239

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.5M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.3M

各ページのテキスト

エージェント開発のAIワークフローインナーループからアウターループまでの実践記録株式会社エーピーコミュニケーションズ大久保直紀 1

大久保直紀 ‣ ロール：バックエンド寄りの何でも屋最近の業務：エージェントアプリケーションの企 ‣ 画、設計、開発 ‣ 好きな技術：会議で暴れること ‣ 趣味：自転車、食べ歩き年齢：３９歳 ‣ ‣ 所属：株式会社エーピーコミュニケーションズコードを書く機会が減ったのに、仕事が増えているんだよなぁ😢

エージェント開発とは？

エージェント開発とは？ AIがツールやデータを使ってタスクを実行するワークフローを設計することプラットフォームを作ったことがなくても誰でも知っている存在 4

エージェントの設計パターン：Planner-Executor 計画を立てるAgentと処理を実行するエージェントを分離して実行する設計パターン計画と実行を分離して動的にワークフローを実行する、あらかじめ用意されたワークフローの実行だけではなく、インテントから動的にワークフローを生成するものもある。 5

エージェントの設計パターン：Re ection/ReAct 生成した結果を元に次のステップの決定や別ロールで検査・改善するパターン。終端でネクストステップを決める場合は ReAct, 自己改善に向かうとRe eciton fl fl 6

エージェントの設計パターン：Router 入力に応じた振り分け先のエージェントを呼び出すパターン。 Routerとなるノードには振り分け先とルールを実装することで、入力に対応するケイパビリティや権限を持つAgent まで自然言語の入力によりシームレスなUXで呼び出すことができる。 7

エージェントの設計パターン：Multi-Agent 複数のエージェントをヒエラルキーやネットワーク、ワークフローグラフなどのパターンで連携する 8

エージェントプラットフォームの成立要件エージェントプラットフォームは昨今 System of Action（SoA）と呼ばれ初めており、SoR・SoEなどと同列で扱う向きがある。基盤としてツール利用のために安全な認証・認可とインターフェースを持ったSoRやサービスが必要であり、成立要件である。 9

10.

エージェントプラットフォームの成立要件 ‣ SoAとSoRのフルスクラッチ統合基盤構築を推奨するクラウドベンダー ‣ 既存資産を活用を売りにするGemini Enterprise ‣ 大規模にエージェントAI向けに事業を準備としてSoRを推奨するAWS ‣ エージェントの活動は情報の統合であるとしSoRを必須とするAzure ‣ 基盤の不足をツールやSaaSで補うスタイル（小規模・個人利用・抜け穴的） ‣ 各種SaaSを開発したAgentから叩く ‣ Computer-useにより端末操作から契約しているSaaSや組織の基盤に接続するパターン。（Claude,OpenAI, OpenClaw, Moltbook…) 10

11.

私のエージェント開発 AIワークフローとは？

12.

三つのループで表現した開発プロセス 12

13.

インナーループ：開発ワークフロー設計はdrawioからコード生成し、コーディング、ビルド、デバッグはほぼCodexに任せてる Codex 13

14.

ミドルループ：開発物評価・ゴールデンデータセットの評価：データサイエンティスト中心・出力テスト：トレースからLLM as a Judege ・コードレビュー：致しません Observable in local No review Span Export Judge 14 Push

15.

ミドルループ：Arize Phoenixのトレース画面 15

16.

ミドルループ：LLM as a judgeによる評価 16

17.

アウターループ：継続的な評価運用・デプロイ：Github Actions/Argo CD/Container Registry ・観察：Arize Phoenixと監視基盤連携（未対応）・フィードバック：Arize Phoenixやユーザーレビューユーザーチェックフィードバック開発チーム traceId: xxxxx スコアや感想通知継続的蓄積異常なトレースチェックスコアや感想 17 Prometheus

18.

まとめ

19.

私のAIワークフローまとめ ‣ エージェント開発は既存のSoRの上に成り立っており、これを利用することを前提とした開発つまり基盤拡張や新規でもある種の基盤拡張的なパラダイムと考えている。 ‣ ３つのループに分けて開発フローを定義している ‣ インナーループ：drawioを中心としたハーネスを組んでほとんどCodex任せ ‣ ミドルループ：コードレビューはせずモデルを信用、LLMOps基盤をローカルレベルから導入して結果判定しCodexにPushはissueを書かせている ‣ アウターループ：LLMOps基盤を中心に人とトレースからのフィードバックを自動化しながら評価している。 ‣ 余談ではあるが、プラットフォーム構築は5.3-codex以降はほぼ全任せである 19

20.

でも仕事減ってないんだよね