生成AIを活用した脆弱性調査 @ GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」

8.8K Views

June 05, 26

#生成AI #脆弱性調査 #LLM #バイナリ解析 #プロンプトエンジニアリング

スライド概要

GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」
https://ierae.connpass.com/event/391105/

GMOサイバーセキュリティ byイエラエ株式会社

@ierae

スライド一覧

GMOサイバーセキュリティ byイエラエ株式会社

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

カルチャーデック　GMOサイバーセキュリティ byイエラエ株式会社

カルチャーデック

GMOサイバーセキュリティ byイエラエ株式会社 90.3K

各ページのテキスト

生成AIを活用した脆弱性調査川根健太郎

川根健太郎所属オフェンシブセキュリティ部高度診断課発見した脆弱性 CVE-2025-25257 CVSS Fortinet FortiWeb 9.8 認証前 RCE CVE-2025-20337 保有資格 OSCP / OSEP / OSWE Cisco ISE CVSS 10.0 認証前 RCE CVE-2025-33217 CVSS NVIDIA GPUディスプレイドライバ 7.8 Use-After-Free

Pwn2Own Berlin 2026 Windows11権限昇格に成功！ UAFを2つ組み合わせ低権限からSystemへ昇格 ZDI経由でMicrosoftへ報告賞金 $15000 獲得 https://x.com/thezdi/status/2054990435899125974

https://x.com/thezdi/status/2054990435899125974

Pwn2Own Berlin 2026 Windows11権限昇格に成功！ UAFを2つ組み合わせ低権限からSystemへ昇格 ZDI経由でMicrosoftへ報告賞金 $15000 獲得実はこれもLLMを活用して調査！ https://x.com/thezdi/status/2054990435899125974

https://x.com/thezdi/status/2054990435899125974

LLMを使ってバイナリの脆弱性を探すには？

バイナリ解析のための MCP サーバデコンパイルや逆アセンブルなどを行うツールを LLM に提供する。 IDA Pro MCP github.com/mrexodia/ida-pro-mcp Binary Ninja MCP github.com/fosdickio/binary_ninja_mcp ghidraMCP github.com/LaurieWired/GhidraMCP

実例 ①：接続中のバイナリを確認

実例 ②：関数をデコンパイル

LLM に丸投げするだけでは限界がある自明な脆弱性は LLM に投げるだけである程度見つかる。ただし … ・誤検知が多い ⇒ 脆弱性の精査に時間が奪われる・同じ脆弱性ばかり見つかる ⇒ LLMは特徴的なパターンに引っ張られやすい・主要なターゲットだと脆弱性が見つけられない ⇒ Kernel, Hypervisor, etc…

10.

プロンプトの投げ方で結果は大きく変わる曖昧な指示は「広く浅く」、対象を絞ると「具体的に深く」探索される。プロンプト② プロンプト① 「脆弱性を探して」種別を絞らず浅く広く列挙 $ grep -rn "innerHTML" Grep で SQL 文の使用箇所を抽出 # XSS? # CSRF? # SQLi? ... 10 matches report.py:55 db.execute(stmt) order.py:103 cursor.execute(s) ... 31 matches $ grep -rn "eval(" search.py:88 cursor.execute(q) admin.py:17 raw_sql(stmt) ... 114 matches $ grep -rn "execute" $ grep -rn -E "execute|raw_sql" user_api.py:42 raw_sql(query) ... 78 matches $ grep -rn "csrf_token" 「SQL インジェクションの脆弱性を探して」 # RCE? billing.py:71 raw_sql(q)

11.

[beta]

プロンプトの投げ方で結果は大きく変わる
対象をさらにファイル単位まで絞ると、コードの中身まで読み込む。
プロンプト②

プロンプト③

「SQL インジェクションの脆弱性を探して」

「login.py で SQL インジェクションを探して」

Grep で SQL 文の使用箇所を抽出

login.py を直接読んで SQLi 発見

$ grep -rn -E "execute|raw_sql"

runner = QueryRunner(db)

user_api.py:42 raw_sql(query)

def authenticate (user, pw):

search.py:88 cursor.execute(q)

sql = f"SELECT ... name='{user}’”

admin.py:17 raw_sql(stmt)

return runner.run_query(sql)

report.py:55 db.execute(stmt)
order.py:103 cursor.execute(s)

billing.py:71 raw_sql(q)

12.

プロンプトの組み方モデルが既に知っていることを改めてプロンプトに書かない。書かない脆弱性の発生原因の一般論 memcpy のコピー長がユーザ入力で未検証な × ら BOF 書く脆弱性調査の観点 ✓ × Use-After-Free や Double Fetch の定義など ✓ 関数を意図的に失敗させると、初期化が走らず未初期化メモリがユーザモードに返らないかユーザーモードコールバック前後で、オブジェクトの状態や所有権が変わっていないか

13.

安易に検索ツールを与えない検索ツールがあると LLM が思考を放棄する。バッファオーバーフローを探したい ⇒「コード検索ツールで memcpy を使っているところを探そう！」関数ポインタが指す関数がわからない ⇒「関数検索ツールでそれっぽい関数を探そう！」与えるならTaint解析など高級なツールを与えるべき

14.

仮想的にパッチを当てる実バイナリに仮想的にパッチをあてて AI にはパッチ後を見せることでノイズを減らすバイナリ alloc_and_copy: mov eax, [rbp+len] 整数オーバーフロー仮想パッチ alloc_and_copy: imul eax, 4 mov eax, [rbp+len] mov edi, eax imul eax , 4 call malloc jo mov rdi, rax mov edi, eax mov rsi, [rbp+src] call malloc mov ecx, [rbp+len] mov rdi, rax rep movsd mov rsi, [rbp+src] .fail mov ecx, [rbp+len] rep movsd 。

15.

仮想的にパッチを当てる脆弱性の調査脆弱性の検証再現へパッチの開発を検討デコンパイル逆アセンブルパッチ後デコンパイル逆アセンブル元データパッチ開発 ⇄ パッチレビュー提出 Binary Ninja MCP

16.

脆弱性の検証 — バイアスを避ける検証を同じセッションでやるとバイアスがかかって検証が甘くなる。 ✕ 同セッションで検証 ✓ セッションを分ける Session A Session A 1. 脆弱性を発見 1. 脆弱性を発見 2. 見つけた脆弱性を検証 2. レポートを出力 ⇒ バイアスがかかる・FP 増 Session B 3. レポートを検証 ⇒ バイアスがかかりづらい・FP 減

17.

脆弱性の検証 — 観点毎に検証する観点を混ぜると判定が曖昧になり精度が落ちる。 1. コードが脆弱であるか 2. セキュリティ境界を超えるか ● ロックや検証は本当に抜けているか ● 非特権ユーザから到達可能か ● 検証に本当に不備があるか ● リモートから到達可能か ⇒ レポートの通りに欠陥が存在するかで判断 ⇒ 悪用した際にセキュリティ境界を超えるかで判断

18.

脆弱性の再現 — 環境 Hyper -V Binary Ninja 解析 JSON RPC Claude Code Claude Code Claude Code Binary Ninja MCP server Claude Code HTTP レポート Binary Ninja 検証 Claude Code 検証VM Claude Code VM 1 再現確認検証済 SSH 再現 Claude Code Claude Code VM 2 再現確認

19.

脆弱性の再現 PoC開発原因分析・修正 ✓ 再現成功クラッシュダンプ取得 ✕ 脆弱でない理由をレポート化クラッシュが脆弱性に対応するか脆弱脆弱でない理由が妥当か脆弱でない環境/設定の問題か人間に渡す再現 PoC実行・観測原因分析環境/設定起因理由をレポート化ループ

20.

まとめ LLMは上手く使えば主要な製品で脆弱性リサーチに活用できる ⇒ LLMの動きを理解して脆弱性を探させる工夫や誤検知を排除するための仕組み作りが大事！

21.

生成AIを活用した脆弱性調査 @ GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」

GMOサイバーセキュリティ byイエラエ株式会社

関連スライド

カルチャーデック GMOサイバーセキュリティ byイエラエ株式会社

IERAE NIGHT 2024: Web「業務で役に立ったCTFテク」

激増するAI悪用攻撃に対抗する守りのAI活用最前線 @ GMO IERAE HackNight #4 「AI時代のセキュリティ攻防戦」

アルゴリズムで解決するCTF Web問 @ GMO IERAE HackNight #1 「Webセキュリティ編」

IERAE CTFを支える技術 @ GMO IERAE HackNight #2 「IERAE CTFで学ぶセキュリティ技術&インフラ開発」

IERAE CTFのWeb問から見る次回の予習 @ GMO IERAE HackNight #1 「Webセキュリティ編」

各ページのテキスト

カルチャーデック　GMOサイバーセキュリティ byイエラエ株式会社