激増するAI悪用攻撃に対抗する守りのAI活用最前線 @ GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」

12.3K Views

June 05, 26

#AI #サイバーセキュリティ #脆弱性対策 #インシデントレスポンス #フォレンジック調査

スライド概要

GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」
https://ierae.connpass.com/event/391105/

GMOサイバーセキュリティ byイエラエ株式会社

@ierae

スライド一覧

GMOサイバーセキュリティ byイエラエ株式会社

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

カルチャーデック　GMOサイバーセキュリティ byイエラエ株式会社

カルチャーデック

GMOサイバーセキュリティ byイエラエ株式会社 90.3K

各ページのテキスト

激増するAI悪用攻撃に対抗する守りのAI活用最前線 Shungo Kumasaka / @hinoshiba Shigefumi Sakata / @sys_socket

ディフェンシブセキュリティ部SOCイノベーション課シニアエンジニア, CISSP 熊坂駿吾 (Shungo Kumasaka) 2022年よりGMOイエラエSOC立ち上げメンバとして、自社SOC基盤の開発主幹。また、国内外での大学にてサイバーセキュリティ講師経験を有する。直近の活動では、Botconf 2026 Sprint CFP 採択される。前職では、大手電気通信事業者にて脆弱性調査分析環境を開発し、Apache HTTPDへの脆弱性報告経験を持つ。最近の趣味: Offsec 資格 RTA 2025/08 ~

自己紹介 GMO サイバーセキュリティbyイエラエ株式会社ディフェンシブセキュリティ部フォレンジック課坂田成史 (Shigefumi Sakata) GREM, GCFA, GIAC Advisory Board, QSA, PCI PFI 2017年にセキュリティベンダに新卒で入社し、フォレンジック業務とIoTペネトレーションテスト業務を経て、2020 年から現職。フォレンジック調査やインシデントレスポンス支援業務を担当。IoTデバイスなどのフォレンジック技術検証も担当しつつ、社内のフォレンジックツールの開発を主導する。インシデント発生時の迅速な原因究明と被害拡大防止により、お客様のビジネス継続を支えています ➢ 活動 • HITCON CYBER RANGE 2024 Final – 3 rd place • Hardening Project 2020(H3DX) – Participant of Marktplace • CODE BLUE 2019 ICS Cyber hacking Challenge – 1st place • CODE BLUE 2018 Car Hacking Village – 3 rd place

https://www.cve.org/About/Metrics

https://www.cve.org/About/Metrics

攻めの一点突破守りの全面防御 .

参考: NIST Cybersecurity Framework (CSF) 2.0 / NIST SP 800-61 Rev.3 (Incident Response) / NIST SP 800-86 (Digital Forensics)

量速度とが欲しい。僕らもAI使おうZE

10.

LTでは、ここらへんの一部！参考: NIST Cybersecurity Framework (CSF) 2.0 / NIST SP 800-61 Rev.3 (Incident Response) / NIST SP 800-86 (Digital Forensics)

11.

参考: NIST Cybersecurity Framework (CSF) 2.0 / NIST SP 800-61 Rev.3 (Incident Response) / NIST SP 800-86 (Digital Forensics)

12.

脆弱性検証の巣立ちを目指して。

13.

脆弱性対応の平均日数悪用平均 -1日防御者のパッチ適用平均 137日 4ヶ月以上 https://www.stingrai.io/blog/vulnerability-statistics-2026

https://www.stingrai.io/blog/vulnerability-statistics-2026

14.

企業のネットワークって、複雑

15.

一次対応としてのシグネチャ配布 -1日 n日 137日どれだけ早く配布できるかが勝負

16.

収集検証配布セキュリティ製品A 脆弱性A セキュリティ製品B セキュリティ製品C 脆弱性B セキュリティ製品D

17.

収集検証配布セキュリティ製品A 脆弱性A セキュリティ製品B セキュリティ製品C 脆弱性B セキュリティ製品D With AI

18.

ニュースの集め方: BadWolf2 など

19.

ニュースの集め方: Temporal Burst Filtering 話題A 話題B 話題C

20.

ニュースの集め方: Temporal Burst Filtering 話題A 話題B 話題C

21.

脆弱性検証: スダチテンプレート

22.

脆弱性検証: スダチテンプレート https://developers.gmo.jp/technology/42691/

https://developers.gmo.jp/technology/42691/

23.

脆弱性検証: スダチテンプレート

24.

脆弱性検証: スダチテンプレート x STYRAX STYRAX SRC Snort Rule 中間言語 DST Cloudflare WAF Rule

25.

脆弱性検証: スダチテンプレート Fakenet-NG Victim SPAN(pcap) Snort Attacker

26.

AIエージェントアーキテクチャアプリケーシゲートオーケウスェトイレーショプンロ層キシ層 RAG Agents ョン層外部リソース推基論盤サーバモ層デル層

27.

AIエージェントアーキテクチャアプリケーシゲートオーケウスェトイレーショプンロ層キシ層 RAG Agents ョン層外部リソース推基論盤サーバモ層デル層

28.

AIエージェントアーキテクチャと誤差の累積の防止アプリケーシゲートオーケウスェトイレーショプンロ層キシ層 RAG Agents ョン層外部リソース推基論盤サーバモ層デル層

29.

AIエージェントアーキテクチャと誤差の累積の防止

30.

AIエージェントアーキテクチャと誤差の累積の防止

31.

AIエージェントアーキテクチャと誤差の累積の防止 • 何も出ない • CVE-xxxx-2026 と CVE-xxxx-20261 が混ざる • 近い製品の検証が混ざる（例: 月次パッチでWordを検証していたら、急にExcelを検証する）生成確認

32.

スダチの実際のタスクフローイメージサンプル攻撃コード作成選定概要ソフトウェア確認攻撃検証レポート作成証跡の取得レポート評価詳細調査シグネチャ案作成パッチ前後ソースコード入手遮断試験 PoC入手反復レビュー箇所

33.

お次はこちら参考: NIST Cybersecurity Framework (CSF) 2.0 / NIST SP 800-61 Rev.3 (Incident Response) / NIST SP 800-86 (Digital Forensics)

34.

AIエージェントで爆速フォレンジック調査

35.

AGENDA 本日お話しする5つのこと 01 DFIRと、AI で何が難しいか 02 システム全体像 03 技術詳細 ① 〜 ③ 04 AI ができること / 人間がやること 05 まとめログ・バイナリの非構造性、痕跡の希少性、説明責任 — DFIRに特有の制約プロンプト1行からレポーティングまで — エージェント連携の全体設計コンテキスト管理 / claim と証拠の紐づけ / Wiki を AI に読ませる behaviors の構造化は AI、context と attribution の判断は人 LLM × DFIR の設計に収束した 3 つの原則

36.

01 / 何が難しいのかフォレンジック調査での AI 利用の難点 #01 #02 #03 #04 #05 AIが読みづらいアーティファクト数百 GB × 数万件インシデント情報の不足ハルシネーション機密性の壁 EVTX / Registry / $MFT / Prefetch は元はバイナリファイル AI 可読 (CSV / JSONL) への変換パースしても EVTX 数十万行 / Registry 数万キー何も考えずに入力すれば、コンテキストテキストウィンドウが一発で埋まる AIが出すエビデンスの根拠が曖昧で間違っているケースがあるそれっぽく言ってくるので信じてしまう AIによるデータ学習、 AIエージェントによる勝手な操作の懸念データ持ち出し不可、ローカル完結が前提インシデント発生時は、インシデント発生した事業者も情報が把握できていない。断片的なインシデントの情報のみでは、AIによる調査でパフォーマンスが出せないケースもある → これらに対するアプローチを一部紹介

37.

02 / 実機で動いているものプロンプト 1 行からレポーティングまで約30分 /full-investigate evidenes/diskimage_E01 ↓ orchestrator が指令塔配下のエージェント (段階別 / 調査用エージェント / Validator) が動く ↓ 抽出 + バイナリ → CSV/JSONL 化アーティファクト自動抽出 → 既存のツールやPowerShell で AI 可読化 ↓ データベース+ アーティファクトWiki + 根拠付け検索 / 状態 / 主張の 3 軸 ↓ 概要/タイムライン/Attack Flow/IoC/ペイロード … レポートテンプレートを元にタイムライン / MITRE / 横展開 artifact を AI 可読化 → 検索 → claim 化 → レポート1 プロンプトで通す対象サンプルディスクイメージ https://www.iblue.team/ctf-challenges/compromised-windows-server-2022simulation

https://www.iblue.team/ctf-challenges/compromised-windows-server-2022-

38.

03 / バイナリ → AI 可読化アーティファクトを AI が読める形に変換するディスクイメージ → 抽出 → PowerShellやパーサでパース → CSV / JSONL に整形ディスクイメージ (E01 / dd / VMDK) ↓ MCPサーバで抽出 Artifacts MFT $UsnJrnl:$J Prefetch EventLog Registry Amcache Web Browsers ↓ PowerShellでパース CSV / JSONL (AI 可読な形式) ↓ データベース投入後、エージェントが SQL で検索 / 集計 AI エージェントが読む Recycle Bin

39.

04 / コンテキストエンジニアリング ① — LLM の有限コンテキストをどう守るか対策Ⅰ. 三段戦略対策 Ⅱ. 状態を MD へ保存叩く前に件数概算を取る MCP ツールを設計会話履歴は信用しない。長時間調査での健忘耐性 basic / summary 全体感把握 MD 中間ファイル (人 + エージェントが読み書き) tasks/*.md : 調査作業の一覧、ステータス artifact-inventory.md : 調査対象アーティファクトの確認ステータス *_estimate timeline.md : 調査で発見した重要なイベントの整理 cost_hint = low / moderate / high / very_high report-claim-ledger.md : 主張・根拠・反証・制約の対応 queries/*.md : エージェントが使用したクエリを保存(再現性) mode="full" evidence-notes/E*.md : 主張の根拠(証拠)を記録明細 + log_id 取得 DB 索引 (検索の自動足跡) low / moderate → 即 full / high → フィルタ追加 / very_high → summary に倒す investigation_log : search_* 呼び出しを記録で再現性確保 claim_ledger : レポートに乗せる主張を根拠付きで管理する台帳「やってみてから後悔」を構造的に禁止。落ちても別のエージェントが再開

40.

05 / ハルシネーション対策 ② — 主張を必ず証拠に紐づける 2 層分離：発見 -> 解釈 finding (発見) — E001.. annotate_finding(logId=N, finding="...", mitre="...") 3段分離 Generator / Reviewer / Validator 3つの独立したコンテキストで「書く/全体俯瞰/個別に裏取り」を分業 Generator report-writer Claim→レポート文章を書く claim_001.. Reviewer state: hypothesis → supported → final disputed negative レポート + claimを読んで指摘 hypothesis : 仮説 / supported : 2 つ以上の artifact で裏付け final : 最終確定 / disputed : 仮説段階で反証発見 / negative : 痕跡なし supportingLogIds: [38, 39, ...] counterLogIds: [反証 log_id] evidence_refs: [E001, E002] mitreAttack: T1078.002, T1021.001 Validator review claim-validator Reviewerの指摘を1claim単位で再検証裏付けの無い主張は構造的に書けない。どこかを間違えても self-check で弾く

41.

06 / RAG とアーティファクト Wiki ③ — 調査員のナレッジWiki を AI に読ませるアーティファクト Wiki 調査を重ねるほど Wiki が育つ LLMがゼロベースで調査観点を検討するとトークン消費増加、調査作業のムラに繋がる Wiki 差分提案ツール (半自動) base-info/ 基本情報 OS / TZ / ホスト / dataset priority 1 調査完了 MITRE Tactic 12 種 + 「痕跡なし観点」 2 既存のWikiとdiff 三段戦略 / artifact 別クエリ / IoC pivot 3 Wikiの更新を提案 4 人間がレビューし反映重要な各チャネル / Registry / MFT artifacts/アーティファクト別 EVTX / USN / Prefetch ほか deep-dive/ tools/ playbooks/ 深堀調査クエリのコツシナリオ別 anti-patterns/ 失敗例ランサム / フィッシング / DC 侵害ほかクエリ / 調査 / レポート / agent / 実行時の典型的なミス調査を平準化させる

42.

07 / AI と人の境界 AI ができること / 人間がやること AI 人エージェントに任せる人間がやる ▸ 大規模ログの横断検索 estimate API で当たりをつけ、三段戦略で絞り込む ▸ 発見 → 主張の構造化 findings claims を紐づけ、 Generator / Reviewer / Validator で自己検証 ▸ Wiki RAG で観点漏れを防ぐ MITRE 12 種・anti-patterns・playbooks を役割×仮説で読み込み反映 ▸ 大枠のレポーティングレポートテンプレートベースのレポーティング調査員の助けになるようなレポートの作成 ▸ 物理保全 / CoC 連鎖管理オンサイトでの対応。Chain of Custody : 電子的証拠が法的効力を持つために必要。 ▸ インシデントのヒアリングインシデントの状況整理や今後の対応など ▸ 白証明 (観測範囲の定義) 消されたログ・契約で取れない artifact。「無かった」と「未確認」の線引きは人が説明

43.

Wrap-up まとめ — LLM × DFIR の設計に収束した 3 つ Context Grounding Learning コンテキストエンジニアリング estimate API で叩く前に件数概算 / MD 正本で会話履歴に頼らない / エージェントが落ちても再開できる証拠と根拠を必ず紐づける + 3 段分離主張は必ず証拠に紐づく / evidence_refsで実在検証 / 書き手・レビュー・検証を独立した役割にアーティファクト Wiki + 半自動還流調査の均質化/ 調査完了時に Wiki 更新提案・調査すればするほど賢くなる仕組み LLM は誰でも使える — 差別化するためにはその領域の深い知識が必要

44.

防御にAIを活用するデザインは、いつから？

45.

https://developers.gmo.jp/technology/42691/