「小さく壊す」は許し「一発アウト」は防ぐ Agentic AI 時代のプラットフォームが備えるべきガードレールを再考する

「小さく壊す」は許し「一発アウト」は防ぐ Agentic AI 時代のプラットフォームが備えるべきガードレールを再考する株式会社 CAM / 株式会社サイバーエージェント岡麦 PEK 2025

プロフィール岡麦 - 2022年度新卒入社株式会社サイバーエージェント /株式会社CAMへ出向 - SRE Unit manager / Platform Engineering Unit member - 社内プラットフォームの運用・保守をメインとして活動 #Kubernetes #Istio #Datadog @mugiokax @mugioka

3.

会社紹介株式会社 CAM 2025年で設立 25周年サイバーエージェントで最初にできた子会社エンタメコンテンツ、ビジネスバラエティメディア、ライフスタイルメディアを主軸に 20サービス以上を開発・運用エンジニアは約30名

4.

本セッションで話すこと「高品質なサービスを、より早くユーザーに提供」し、開発者によるビジネスインパクトを最大化するために、独自のマルチテナント型プラットフォームを構築しています 20以上のサービスがプラットフォーム上で稼働 2019年から運用開始

5.

本セッションで話すこと

6.

本セッションで話すこと AI や AI Agent の普及により Platform Engineering の実践における優先度が変わってきたその中の一つが「ガードレール」「不確実性の高い大量の作業」を安全に受け入れるために「ゴールデンパスの提供」だけでなく、よりシステム的なアプローチができるプラットフォームが求められるようになってきたと思っている

7.

本セッションで話すこと弊社の Platform Engineering 実践の道のりを振り返りつつ AI Agent 元年の今、プラットフォームが備えるべきガードレールを実際の現場視点で再考します

8.

1.Platform Engineering 実践の振り返り 2.AI Agent の登場による変化 3.何を恐れているのか、防ぎたいのか 4.なぜ「小さく壊す」は許すのか 5.「これまで」と「これから」のガードレール 6.ガードレールの実践事例の紹介 7.終わりに

9.

Platform Engineering 実践の振り返り

10.

これまでの振り返り（2022 - 今）大きなコンセプト「不必要な認知負荷を軽減し、開発生産性を高める」その結果としてビジネスがより加速している状態を目指す

11.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充

12.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充

13.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充開発者の生の声をベースによりよい Platform Engineering をしたい定期的な勉強会アンケートツール利用率の可視化デプロイ頻度の計測

14.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充技術的負債の返済多すぎるマイクロサービスの統合モジュラーモノリスの採用 K8s クラスタの統合 etc… 分散しすぎて管理できない、わかりにくいものを適切な粒度で集約

15.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充

16.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充

17.

具体的に何をやってきたか 1. 2. 3. 4. 5. 6. ローカル開発環境の改善開発生産性の観測不必要な複雑性の排除内部開発者ポータルの提供セルフサービス化の推進ドキュメント拡充誰でもすぐプラットフォームを利用した開発ができる属人化させないオンボーディングドキュメントの継続的な見直し How To ドキュメントの拡充

18.

後回しにされがちだったもの「ゼロトラスト的思考なアーキテクチャの構築」もちろん全くやっていないわけではない例えば、 CI / CD の分離による明確な権限の棲み分けなど ... ただ、これはセキュリティの強化がメインではない「GitOps の推進によるセルフサービス化の加速」という攻めのアプローチを行いたいことが背景であり、セキュリティの強化は副次的な効果の一つ

19.

なぜ後回しにされがちだったのか？「限られたエンジニアリソースで開発生産性を改善」し、ビジネスをより加速させるため「守りのアプローチ」より「攻めのアプローチ」に重点が置かれてきた

20.

振り返りをまとめるとセルフサービス化などトレンドに沿った「攻めのアプローチ」をしてきた一方で、特に大企業のようなエンジニアリソースがない我々は、様々な内情からゼロトラスト的思考なシステムの構築など「守りのアプローチ」は後回しにされがちだった

21.

AI Agent の登場による変化

22.

AI Agent に「これやって」をお願いする時代「攻めのアプローチ」で作り上げた便利なプラットフォーム大変だったけど、開発者に「開発しやすくなった」と言ってもらえるところまでやっときたけど今は？

23.

AI Agent に「これやって」をお願いする時代コードの記述？もちろん AI Agent にお任せ

24.

AI Agent に「これやって」をお願いする時代コードレビュー？もちろん AI Agent にお任せ

25.

AI Agent に「これやって」をお願いする時代サーバー増強？もちろん AI Agent にお任せ

26.

AI Agent に「これやって」をお願いする時代サーバー増強の振り返り？もちろん AI Agent にお任せ

27.

AI Agent に「これやって」をお願いする時代開発フロー？ NotebookLM に仕様を貯める NotebookLM に GitHub Issue の雛形書いてもらう GitHub Issue 作ってラベルを付与したら実装開始！！

28.

AI Agent すげえええ今までやったどんな施策より圧倒的にぶち上がる開発生産性一方で不安要素もある

29.

不確実性セッションが長くなると意味わからないことをしだす全く同じプロンプトでも出力は毎回異なるハルシネーション暴走

30.

AI Agent の登場による変化開発生産性はめちゃくちゃ上がった一方で「守りのアプローチ」が充分でないプラットフォームは AI の「不確実性」によりサービスの継続を脅かすような「一発アウト」に見舞われてしまうのではないかプラットフォームを育ててきた、育てていく人たちが抱える「漠然とした不安」

31.

何を恐れているのか、防ぎたいのか

32.

漠然とした不安は何なのか？ AI Agent という革新的だが不確実性の高いツールの登場が「プラットフォーム」や「サービス」にどのような侵害を与えることを恐れているのか 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な⾏動 a. 環境の破壊 b. サプライチェーン攻撃

33.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な⾏動 a. 環境の破壊 b. サプライチェーン攻撃提供しているサービスやプラットフォームによって異なる我々は、特に 4 つを恐れている

34.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃プラットフォームで提供している共通機能に大きなバグが混入複数のテナントが影響を受ける信頼を失う ...

35.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃対策動作確認文化（ビジ職と共同）テストリポジトリ分割による管理の厳格化

36.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃 OWASP Top 10 に入るような攻撃されやすい脆弱性を仕込んでしまう情報漏洩 ...

37.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃対策静的解析 WAF 脆弱性診断

38.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃重要なリソースやデータが削除された結果復旧困難な状態になってしまい、サービスが長期間提供できなくなってしまう ...

39.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃対策最小権限の徹底リストアできる状態でのバックアップの保持バックアップの分離

40.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃マルウェアに感染した結果情報漏洩 ... 金銭要求 ...

41.

何が一発アウトに繋がりやすいのか？ 1. 2. コード品質 a. 保守性 b. バグ c. 脆弱性 d. スケーラビリティ内部システムの不適切な行動 a. 環境の破壊 b. サプライチェーン攻撃対策最小権限の徹底 SIEM GHA の管理ちょっと弱め？？

42.

全く何もしていないわけではないリストアップした上で対策できているかを確認していくと、何も対策していないわけではないでも、不安を感じるのは何故なのか？

43.

シフトレフトとサプライチェーン「守りのアプローチ」の優先度を高くしてこなかった AI Agent がもたらした「不確実性の高い生産性の向上」により後手に周りがちだった課題が浮き彫りになってきたシフトレフトとサプライチェーンの保護に対する不安が大きくなってきた https://cloud.google.com/solutions/shifting-left-on-security?hl=ja

https://cloud.google.com/solutions/shifting-left-on-security?hl=ja

44.

なぜ「小さく壊す」は許すのか

45.

利便性と制約のバランスを取りたい AI Agent の普及で「制約」の重要性も高まってきている全ての事象を防ぐことはできないし、闇雲にガードレールを増やせば「利便性」を損なう「小さく壊す」ことは許容した上で、「一発アウト」対策は取ることで両者のバランスを取りたい

46.

たくさんデプロイすればそりゃ障害も増える “障害のほとんどはデプロイによって引き起こされる。 ” AI による爆発的な生産性の向上によってデプロイが増えることは当たり前で、我々もそれを望んでいる一方で、大きな障害の発生頻度が増えたり、開発者が疲弊することは望んでいない

47.

「小さく壊れる」にはどうしたら良いのか Platform Engineering という取り組みを通して、AI Agent が調査を行える環境を準備その上で、 AI Agent に作業を移譲することで、例え障害が増えたとしても開発者が疲弊せず、「小さく壊れる」ことが可能な状態を目指す調査ができる状態にできれば様々な部分で応用が効く - CI のエラーを自動で修正定期的なキャパシティプランニング

48.

ここまでの流れをざっくりまとめこれまでの、 Platform Engineering ではセルフサービス化など「攻めのアプローチ」が重要視されてきた AI Agent の普及により「不確実性の高い大量の作業」が発生する中、「漠然とした不安」を感じるようになり「守りのアプローチ」も重要視されるようになってきた一方で、これまで通り「利便性と制約のバランス」は担保したい「小さく壊す」ことは許容することで、「一発アウト」は防ぐ必要最小限なガードレールを整備したい

49.

「これまで」と「これから」のガードレール

50.

「これまで」のガードレールゴールデンパスの提供組織規模、開発している物、開発文化に合っている

51.

「これまで」のガードレールゴールデンパスの提供開発者に準拠してもらうことで、ある一定の品質が保たれる組織規模、開発している物、開発文化に合っているコストセキュリティ信頼性 etc...

52.

「これまで」のガードレールゴールデンパスの提供開発者が納得いく形での合意形成を取る組織規模、開発している物、開発文化に合っているガードレールの存在意義の明確化利便性と制約のバランス etc...

53.

「これから」のガードレール本質的には変わらないが、 AI Agent の登場により「変わったこと」や「変わっていくこと」がある「不確実性の高い」大量の作業を高速に実行可能にエンジニアの人数だけでは測ることのできない、組織規模

54.

「これから」のガードレールゴールデンパスの提供性善説のゴールデンパスの提供だけでは不十分かも？組織規模、開発している物、開発文化に合っ不確実性の高い AI Agent が必ず準拠してくれるとは限らないている準拠していない状態が「一発アウト」を招くかもしれないシステム的なアプローチ（仕組み）もより必要になってくる

55.

「これから」のガードレールゴールデンパスの提供利便性と制約のバランスがより難しく、より重要に？組織規模、開発している物、開発文化に合っている自社のサービスにおける「一発アウト」は何なのか、対策をより明確に「一発アウト」を防ぐにはこれまでの延長線上ではない大きな改革も必要かもしれない

56.

ガードレールの実践事例の紹介

57.

開発ツールキットの提供実装レベルのベストプラクティスを提供 1. 2. 3. 4. 5. 6. etc... アプリケーション起動共通機能の SDK をラップ認証・認可データ永続化 OpenAPI 統合オブザーバビリティ

58.

開発ツールキットの提供実装レベルのベストプラクティスを提供 1. 2. 3. 4. 5. 6. etc... アプリケーション起動共通機能の SDK をラップ認証・認可データ永続化 OpenAPI 統合オブザーバビリティメリットフルスクラッチでの実装を AI Agent にさせないので、複数のサービスの品質を保ちやすい

59.

開発ツールキットの提供実装レベルのベストプラクティスを提供 1. 2. 3. 4. 5. 6. etc... アプリケーション起動共通機能の SDK をラップ認証・認可データ永続化 OpenAPI 統合オブザーバビリティデメリット AI Agent に開発ツールキットの知識を Context として詰め込む必要がある Devin MCP Server 等を用いてシームレスに Context を詰め込むことにトライしている

60.

コアとなる共通機能の分離コア機能をマイクロサービスとして提供 1. 2. 3. etc... 認証決済通知

61.

コアとなる共通機能の分離コア機能をマイクロサービスとして提供 1. 2. 3. 認証決済通知メリット品質を保ちやすい etc...

62.

コアとなる共通機能の分離コア機能をマイクロサービスとして提供デメリット 1. 2. 3. etc... 認証決済通知 AI Agent にマイクロサービスの知識を Context として詰め込む必要がある Devin MCP Server 等を用いてシームレスに Context を詰め込むことにトライしているマイクロサービスあるあるは多少なりともある...

63.

積み上げ式の開発がフィットした少人数でたくさんのサービスを開発し、運用するため色々なレイヤで共通化を行ってきたサービス開発・運用において「やることを減らした」ことが結果として AI Agent の行動を抑制しておりガードレールとなっている一方で、独自のレイヤを増やしたためフルスクラッチ開発と比べると Context の詰め込みには苦労している Devin の DeepWiki を MCP Server から利用することで課題をクリアできないか検証している

64.

終わりに

65.

まとめ伝えたかったこと 1. 2. 3. 4. 不安を漠然としたもののまま放置しない小さく壊れることは許容しようこれまで以上に利便性と制約のバランスに注意する組み込まれたガードレールの重要性

66.

不安を漠然としたもののまま放置しない AI Agent の登場で Platform Engineering における「守りのアプローチ」に「漠然とした不安」を抱えている人は自社のサービスにおける「一発アウト」の言語化と、その対策が充分かどうかを考察してみよう意外と対策されていて、不安が解消される人もいるかも？

67.

小さく壊れることは許容しようデプロイが増えれば障害も起きやすくなる障害を起こさないことに執着しない「小さく壊れる」にはどうすれば良いのか、「開発者を疲弊させない」ためにはどうすれば良いのかを考えよう

68.

これまで以上に利便性と制約のバランスに注意する AI Agent の普及により「守りのアプローチ」が重要視されてきているガードレールという How に執着するとやれることは無限に出てきてしまう自分たちが防ぎたいことを明確にした上で、それをするために必要最小限なガードレールとは何なのかを考察しよう闇雲なガードレールの整備による利便性の低下には注意しよう

69.

組み込まれたガードレールの重要性 AI Agent の登場により「不確実性の高い大量の作業」が実施可能になり、ゴールデンパスに準拠しない可能性が高くなってきたプラットフォームにガードレールを組み込むというシステム的なアプローチ（仕組み）をすることで準拠していないことを早期に検知し、強制的に準拠させるようにしよう

70.

ご清聴ありがとうございました

「小さく壊す」は許し「一発アウト」は防ぐ Agentic AI 時代のプラットフォームが備えるべきガードレールを再考する

mugi

関連スライド

SRE文化の導入とプラットフォームの信頼性向上の取り組み

Backstage のプラグイン使って色々可視化してみた

うちのチームにAIの新人くん(Devin)が配属された件

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

Unreal Engine5 Lumenの仕組みと肝心なところ

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

各ページのテキスト