AI×品質管理　新しいQAモデルによる生産性倍増への挑戦

15.2K Views

March 12, 26

#dena ai day #AI #品質管理 #生産性向上 #テスト自動化 #品管AIジャーニー

スライド概要

DeNA品質管理部門が進める「QAのAI化戦略」と、AI時代における新しい品質への取り組みを紹介します。開発スピードが加速する中、従来のQAだけでは“利用者にとって安全・安心であること”を維持しつつ効率化を図ることが難しくなっています。当部門では、要件定義支援、テスト設計、テスト実施にAIを導入し、機能的品質・社会的品質の両立を追求。品質を落とさずコスト最適化を実現する、新しいQAモデルと組織のあり方をご紹介します。

DeNA_Tech

@DeNA_Tech

スライド一覧

DeNA が社会の技術向上に貢献するため、業務で得た知見を積極的に外部に発信する、DeNA 公式のアカウントです。DeNA エンジニアの登壇資料をお届けします。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

Roslynアナライザー_ Unityでの開発環境を改善するための静的解析の仕組みの構築

DeNA_Tech 83.3K

ディメンショナルモデルの実導入と実装について

DeNA_Tech 53.9K

Difyによる全社LLMプラットフォーム運用とv1アップデート

DeNA_Tech 49.3K

【DeNA TechCon 2025】 DeNAがマスタデータ管理にOyakataを使う理由

dena techcon 2025

DeNA_Tech 42.6K

【DeNA × AI Day】DeNAスポーツ事業戦略とベイスターズAI強化プロジェクト

dena ai day

DeNA_Tech 35.5K

GraphQLやるならDataloaderを使おう

DeNA_Tech 34.8K

各ページのテキスト

AI×品質管理 TITLE SUBTITLE 新しいQAモデルによる生産性倍増への挑戦品質管理部 NAME藤﨑隆

SUBTITLE 目次 1. イントロ 2. 品管AIジャーニーとは 3. 成果と取り組み 4. 成功要因 5. 今後

SUBTITLE 藤﨑隆（品質管理部）現場の最前線（テスト設計・実行）から、マネジメント（戦略策定・品質管理）までを包括的に対応 AI×品質管理ではPdMとしてサービス開発 QA JSTQB Advanced Level TestManager JSTQB Advanced Level TestAnalyst IVEC アーキテクト情報処理技術者試験プロジェクトマネージャ PM 認定スクラムマスター PHOTO

AI × プライベート AIは私の『パーソナルトレーナー』陸上競技日本マスターズ陸上競技選手権 100m 11秒29(40歳) M40 4×400mリレー優勝日本記録パーソナルトレーナーの役割練習メニュー栄養管理動画分析メンタリング

部門紹介① DeNA 品質管理部ていりつ Mission: QCDの鼎立三つのものが対等に並び立ち、互いにバランスを保っている状態組織の意義はシステムが動き続けること QCグループソーシャル QAグループ開発グループソフトウェア品質管理社会的品質管理ソフトウェア開発支援

部門紹介② DeNA 品質管理部年間 230回リリース／25.4万件のテスト＊game側情報は非公開のため除く収集データテストデータ分析 27種類 Delight品質工数分析 35種類機能的品質社会的品質サービス品質

部門紹介③ DeNA 品質管理部年間 Game 数十億円のQA費 Healthcare Medical Live Streaming Sport SmartCity GWS MSOfﬁce Github JIRA Conﬂuence Notion Miro Figma Backlog draw.io 様々な違いを吸収して QA New AI

SUBTITLE 品管AIジャーニー

品管AIジャーニーとは AIジャーニー DeNAが「AI ネイティブ」を達成するための道のり AIジャーニー品管AIジャーニー他のAIジャーニー AI×品質管理

10.

品管AIジャーニーの成り立ち認算承宣言を発足を予インニーーのルーニーャャー Iオ Iジ A A ジ合宿 I がが A ム南場金子品管チー 2025/2 2025/3 完成 o t o Pr 2025/5 チュングニー開利用社内 2026/1 始

11.

AI化の目的と評価軸生産性倍増 Quality 維持したい Cost 削減したい Delivery 短縮したい

12.

AI化するテーマを設定プロジェクト工数分析からAI化テーマを設定テスト作成仕様書検証、テスト項目書＊「テスト設計」の解釈が広いため、作成＝設計＋実装と定義テスト自動化自然言語指示によるテスト実施／不具合検出社会的品質審査法令・各種規約、倫理・レピュテーションリスクの回避

13.

SUBTITLE 成果と取り組み

14.

コスト削減、デリバリー短縮の実現生産性の倍増テスト作成テスト自動化社会的品質審査テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効テストスクリプト工数 90%削減モバイルアプリ検証中リリース前審査 5日→即日高難易度の審査対応脱俗人化機能テスト 1600項目 2時間表示テスト 22000項目 6時間自然言語によるテスト実行不具合検知と報告誤操作、誤判断の自己検知法令・各種規約・倫理レピュテーションリスク

15.

コスト削減、デリバリー短縮の実現トータルコストは50%減テスト作成テスト自動化

16.

成果と取り組みテスト作成テスト自動化社会的品質審査 16

17.

2024/12/4 生成AIに可能性を感じる 2024/12/4 テスト観点テスト観点テスト手順前モデル最新モデル人間が考える余地があるが、出力はだいぶ具体的になってきたこのままテスト出来そうな内容。後半はエラーケースが網羅されてた電卓の仕様書

18.

2025/2/18 正直、もっと簡単に成功すると思ってた ... 電卓の仕様書 90点実務レベルだと、課題多い・・・プロジェクトドキュメント 20点

19.

すぐ見えてきた課題 No. 課題（品管目線と違ったこと）詳細 ① 正確に「一言一句」処理するは苦手 QAは正確性を問われる仕事「翻訳された仕様」に信頼性が無い ② 他の仕様書、もしかして読んで無い？？一緒に渡した仕様書を読んだ形跡が無い ③ 長いと途中でやめちゃう以降も必要ですか？？と繰り返し、指示への抵抗を示す ④ 画像読めないの？？？画像を渡しても、見ているとは感じられないこのQAさん（AIくん）の成果物は不安

20.

QAに期待される作業精度と記録作業精度・「テストミス」は、絶対にあってはならない・「テスト漏れ」は、絶対にあってはならない＝本番障害記録・作業の「記録」が残っていなければならない・5年前のテスト結果の理由に答えられないといけない後から確認できる状態 QAは安心感を提供することが役割

21.

AI化の基本理念『常に制御可能な状態に置く』 Garbage In，Garbage Out 清浄なデータ清浄な成果物 AI処理

22.

品質管理の Garbage 情報は過剰以外に、不足も Garbage 情報矛盾・更新漏れ・情報が埋もれる品質管理のコンフォートゾーン想像仕様書インスペクション情報

23.

テスト作成仕様書からテスト作成テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効 14のテストタイプ仕様書機能テスト機能テスト項目書表示テスト表示テスト項目書仕様書インスペクション複合テスト：シナリオテスト

24.

テスト作成 INPUT 段階的な情報制御 ①Garbage（情報の過不足）を入れない制御 ②AIに正確に情報を把握させる制御 Processing OUTPUT テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効

25.

テスト作成 PRD テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効 ①Garbage（情報の過不足）を入れない制御１．概要７．技術的要求 Gargabe 議事録プロダクトバックログ体制図２．背景８．スコープ３．製品原則９．リリーススケジュールマイルストーン４．対象ユーザー１０．関連ページ５．ユースケース１１．参照項目スケジュール６．機能要求 ● ● ● ● ● 要望構想感想質問枠外のコメント不要情報は徹底トリミング

26.

テスト作成 ②AIに正確に情報を把握させる制御テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効 MCP RAG VLM 全数保証が必要な情報には、 MCPを行わない RAGの参照先もブレる重要情報の優先度を確保 AIは画像から何を読み取るのか？必要な情報が抽出されるよう制御仕様書 MCP 仕様書

27.

テスト作成 ①②完了テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効 AIには清浄なINPUTがある要件整理 100% テスト実装清浄なINPUTから、Garbage OUT。。。仕様の把握 34% テスト項目書品管伝家の宝刀プロセス改善で制御する

28.

テスト作成 INPUT 三段階の情報制御テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効 ①Garbage（情報の過不足）が入らない制御 ②AIに正確に情報を把握させる制御 Processing OUTPUT ③正しい段取りで情報処理を行う制御

29.

すぐ見えてきた課題は『プロンプト』 No. プロンプトの課題詳細 ① プロンプトが効きづらい長文のプロンプトは AIの理解度が下がる ② 複数内容を同時に教えられない作業内容が複数あり、混乱して作業内容が混ざる ③ 箇条書きなどの一般的な表現が伝わらない Markdown形式の方がお好みの模様 AIに併せた工夫で解決する

30.

テスト作成 ③正しい段取りで情報処理を行う制御テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効精度70%の連続処理はロスが大きい。精度 34%からはリカバれない要件整理テスト分析テスト設計テスト実装 100% 70% 49% 34% 仕様の把握テスト分析書テスト設計書テスト項目書手が付けられない状態 AI ゼネラリスト・いきなり完成品を作るのはやめよう・全部一人でやるのはやめよう

31.

テスト作成 ③正しい段取りで情報処理を行う制御テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効スペシャリスト集団のリレー処理・得意なことに集中・中間成果物をレビュープロセス内部をさらに細分化。人間がレビューして 100%にする。要件整理 100% 仕様の把握テスト分析テスト設計テスト実装 90% 90% 90% 100% 100% 100% テスト分析書テスト設計書テスト項目書軽微なミスは修正可能

32.

テスト作成 ③正しい段取りで情報処理を行う制御リレーに参加したプロンプト達収集データプロンプト数プロンプト成功／失敗事例 42種類 2000件超テスト設計 4年目テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効

33.

テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効テストプロセスも変化するテスト作成仕様変更 QA開始 ★ 従来インスペクション ★ ★ ★ テスト設計 ★ テスト実装テスト実施作業ボリュームがありリードタイムが発生仕様変更による手戻りも常に発生仕様変更 ★ 今後 ★ ★ ★ インスペクション仕様の精度だけを追及確定情報でテスト開始できる ★ テスト設計手動テストテスト実装自動テスト画面の情報を把握出来れば、正確なテスト手順が分かる

34.

成果と取り組みテスト作成テスト自動化社会的品質審査 34

35.

テスト自動化のイメージテスト自動化テストスクリプト工数 90%削減モバイルアプリ検証中項目書からテストを行う最新方針 AIで操作・判断テスト対象システムテスト結果 AIテスト実行テスト項目書不具合報告当初構想 AIでテストコード生成 Playwrite コード生成 Playwrite 実行

36.

テスト自動化大事なところ以外は、大事ではないテストスクリプト工数 90%削減モバイルアプリ検証中 AIの柔軟性はテストと相性◎ テスト目的：購入したチケットに、試合日の日付が記載されていることテスト手順：チケットシステムにログインする 3/27の日付を選択する任意の座席を選択する任意の枚数を選択する任意の決済方法を選択するマイページを開く期待値：購入したチケットに 2026/3/27と記載されていることテスト 3/27のチケットを購入するチケットに試合日が記載されているか指示外は柔軟に

37.

AIの特性に合わせたテスト実行のモデルテスト自動化テストスクリプト工数 90%削減モバイルアプリ検証中柔軟性のメリットは、定常コストの最小化テスト目的：購入したチケットに、試合日の日付が入っていること仕様変更 ※ログイン認証方式の変更テスト項目・影響無いため、テストは修正しない自動化スクリプト・自動化スクリプトを必要としない全工数の15% テスト結果・テストの結果が『変わらず』受け取れる

38.

テストスクリプト工数 90%削減モバイルアプリ検証中柔軟性ゆえに起こる問題テスト自動化テスト実行の頻出課題手順が正しいか AI 自己申告誤っているとちゃんとやったバグ流出の可能性偽陽性をどのように抑えるか期待値通りか失敗した再確認結果OK バグ流出の確定結果NG 再確認専用検証サイトで能力評価

39.

テスト自動化テストスクリプト工数 90%削減モバイルアプリ検証中実際の運用時のケアセルフチェックとクロスチェックテスト対象システムテスト項目書 AIテスト実行テスト結果不具合報告テスト実行報告項目書）テスト手順と期待値実行報告）テスト手順と期待値セルフチェッククロスチェック

40.

系統立てて対処するテスト自動化テストスクリプト工数 90%削減モバイルアプリ検証中上手くいかない何かテーマ分解 LLM 正確性 LLM 妥当性優先度 S,A,B,C 定量評価指標に基づいて１～５・AIが止まらない・サマリ報告しない・指示外のことをする・トークン数超過エラー・PCロックでシステム停止・JIRA番号を間違える・誤解釈して処理する・特定の操作が苦手・うまくいかないと簡単に断念 APP ・もっさり感・スクショを失敗・テスト結果報告が途中まで

41.

テスト自動化トライアル中仕様書不要の完全アドホックテストテスト対象システムテスト項目書画面情報テスト実行テスト結果不具合報告テストチャーターアドホックテストの指示書標準テスト観点テストスクリプト工数 90%削減モバイルアプリ検証中テスト自動化のイメージ 10時間で1400件検証・誤字脱字・データ破損・日時時刻、ロケーションから見た妥当性・一般的見地からの違和感：

42.

成果と取り組みテスト作成テスト自動化社会的品質審査 42

43.

社会的品質審査法令・コンプライアンス『社会的品質審査』の概要倫理プラットフォーム等の規約法令、社内コンプライアンス諸規定を元に、準拠表現内容や社会的な影響を、内規の規範や社プラットフォームの各規約や審査結果例、市場性を評価外事例を元に、許容レベル別に判定調査で得た情報を元に、規約の適合性を評価 💡 事業影響リスクを回避するため、少数精鋭の専門家が慎重な審査

44.

社会的品質保証審査における『 AIの振る舞い』も Garbage ハルシネーション読取精度の低下処理の怠り動画や資料に記載されていない仕様を想像テキスト資料において縦軸と横軸の文章構成解析するファイル数が多いと「検証観点を読し、事実と異なる実装前提でリスク評価を行を正確に読み取れず、リスクの当てはめが正み取れませんでした」と、読取の可否で雑におうとしてしまうしくできない判定結果を下してしまう 💡「情報の過不足（ Garbage）」のもとを排除する徹底した制御が必要

45.

社会的品質保証制御と継承： AIを「審査官」に育てる ■ システムによる制御（ Garbageの排除） ■ 知識による制御（暗黙知の形式知化） ① 入力の清浄化テキストのマークダウン化や動画の分割により、 AIが文脈を見失わない「 100%読み取れるデータ」を作る ① 倫理基準のコード化過去の社内外の炎上事例を分析し、表現に関する「独自の倫理ランク」を定義して AIの判定基準に実装 ② 厳格な事実の評価「わかりにくいか？」という主観を排除し、「〜の描写が存在するか？」という客観的な事実認定へ指示を変換 ② アプリ審査合格のノウハウ継承過去13年の審査事例から「修正が必須な実装」と「説明次第で通過できる実装」の境界線を言語化して AIの判定基準に実装 💡 熟練者の「肌感」と「ノウハウ」を言語化し、組織全体の品質基準として固定化する

46.

社会的品質保証壁は「多重実行 ×総合判定」で乗り越える 2. 独立多重実行 (AI) 4. 対話と最終判断 (人間 +AI) ハルシネーション対策として、清抽出された NG/要確認項目の根浄化された同一データに対し、 AI 拠を目視確認。違和感があればが独立して複数回の検証を実行 AIへ再質問し、専門的知見を加する味して最終確定する 1. データ清浄化 (人間 ) 3. 総合判定 (AI) 仕様書のマークダウン変換、長複数回の検証結果を AI自ら統合時間動画の分割・リネームを行・比較。「統合された判断理由」とい、曖昧さを排除した構造化「リスク抜粋」を抽出し、ブレのなデータを作成するい一次判定を生成 💡 AIによる即時一次判定 + 人間による確定判断＝審査即日完了

47.

再コスト削減、デリバリー短縮の実現掲生産性の倍増テスト作成テスト自動化社会的品質審査テスト作成工数 80%削減作成精度 95%修正不要インスペ指摘 92%有効テストスクリプト工数 90%削減モバイルアプリ検証中リリース前審査 5日→即日高難易度の審査対応脱俗人化機能テスト 1600項目 2時間表示テスト 22000項目 6時間自然言語によるテスト実行不具合検知と報告誤操作、誤判断の自己検知法令・各種規約・倫理レピュテーションリスク

48.

動作デモ ● ● ● ダック DeNA AI Advanced Quality ふくろうはQAを代表する動物、よく見てバグ（虫）をみつける

49.

動作デモ

50.

動作デモ

51.

動作デモ

52.

SUBTITLE 成功要因

53.

二つの成功要因言語化プロジェクト体制

54.

『お風呂が沸いたら入りなさい』お風呂が沸く温度 40℃±1℃ 酸性度 pH 7.5±1.0 お湯のかさ 55cm以上場所神奈川県横浜市中区横浜公園猶予時間沸いてから 10分以内終了期限～19:30までお風呂に入る仕様の裏返し仕様の行間不意な問い合わせを回答出来る

55.

言語化に重きを置く DeNA

56.

品管の言語化社員教育からAI教育へインスペクション教育資料テスト設計教育資料成果物を体系的に点検するための品質を確保するためにテストを体系品質を網羅的に確認するためにあら手法と観点を学ぶ教材。的に設計する方法を学ぶ教材。かじめ定義された共通の確認視点。品質分析レポート標準QAプロセス標準テスト観点当たり前品質品質状況を可視化し、課題と改善方品質を計画的に作り込み、確認し、利用者が意識しないが、欠けると強向を明確にする報告資料。改善する一連の活動。い不満につながる基本的な品質。

57.

ヒト・モノ・カネの三原則１／４品管AIジャーニーの予算承認カネヒトモノ期待値カネは期待値を明確にする

58.

内部の組織・二つの軸２／４開発チーム品管 AIジャーニーシステム開発利用部門 SWET 品質管理部長 AIスペシャリスト業務理解開発部門決裁部門 AI・データ戦略統括部 QA PdM IT本部長 AI試合解説品質管理部

59.

毎週末の steering committee 通称：ステコミ開催：毎週金曜日通算： 42回開催スライド： 523頁３／４ AIプロダクトのアセスメントプロセス・アセスメント理念・事業部との関係と生成AIへの期待・市販品の課題とAJQNによる解決・プロダクトロードマップ・プロジェクト管理方法・プロジェクト報告方法・プロダクト価値のコスト換算式・レーダーチャート・AI能力の点数評価・データダンプの必要性・AI作業の精度と削減工数の関係式・社内ツール調査・子会社とのNDA・多角的なプロンプト構造・プロンプトの分解・表示テストのための要素抽出・アクセス権限の規定・自動化対応のコスト実績・自律操作ツールデモ・Q&A機能・追加予算相談・増員相談・スプリント化・ユーザーストーリーマッピングとイベントストーミング・ユーザーテストのコントロール・評価点数ごとのエンジニアスキルセット・ミラー活動とスケジュール・ノンスクリプトテストの可能性・少数プロンプトによる競合・AIの曖昧性の良し悪し・UIバグが開発ボトルネック・プロンプト改善プロセス・開発生産性向上のAI開発ツール導入・AIはスクリプトテストが苦手・システム分析のデモ・Few-shot Learningの検討・ファインチューニングの可能性調査・自動化ツールのJIRA起票・永年のノウハウがAIに活きる・システムテスト作成のデモ・仕様書インスペクションのデモ・ツール名称・ミラーチームからのフィードバック・デザイナー投入の相談・ツールマニュアルの作成・QAロール別のツール評価差異・人間単体とAI+ミラーチームの成果物比較・テスト自動化の本番投入段取り・表示テストの厳密度の理由・表示テストの工数効果・アジャイルPJへのAI活用計画・現場導入プロセス・ミラーチームの評価方式変更・Notionを INPUT・標準テスト観点生成・手動時代のテスト成果物メトリクス・市場不具合の標準テスト観点化プロセス・画像データのインスペクション・AI×QAのトレンド調査・巨大PJのデータ量の壁・AIリランキング・チャンクサイズの最適化・AIがインスペクションをする構造・AI思考をマインドマッピング出力・コメントがAIのノイズ・ロゴ決定・議事録は仕様と出来ない・リバースエンジニアリングの是非・仕様書を強化するために・AI導入のファーストペンギン・コスト効果の方程式・導入支援準備・アクセス権者の承認・ディシジョンテーブル・シナリオテスト・機能テストの導入・スクリプトテストのロードマップ・テスト結果のAIセルフチェック・再試行の成功率

60.

全社を挙げた取り組み４／４ AIオールイン AIジャーニー品管AIジャーニー https://fullswing.dena.com/archives/100181/

https://fullswing.dena.com/archives/100181/

61.

SUBTITLE 今後

62.

今後の品管 AIジャーニー AI I/F改善テストデータ生成需要予測サービス品質標準テスト観点強化ペルソナ市場障害横展開社会的品質審査損害金額モデルテスト自動化テスト作成スクリプトテスト仕様書生成プロダクト品質分析ドキュメント品質分析ドメイン特化モデルアジャイル対応完全アドホックテスト横断部門は求めに応える品質責任の委譲

63.

QA生産性の倍増は、サービスの倍増既存サービス新規サービス QAの生産性倍増新組織開発の生産性倍増新しいサービスが増える楽しみ

64.

どうぞお声がけください AI×品質管理興味ある方、DeNA品管にお声がけを！

65.

おわりに得意な分野を言語化してAIを育て切ろう今からでも遅くない、AIがたたき台作って人間がレビューと承認 AI時代は会社ナレッジの総力戦より良きAI時代を！

66.

AI×品質管理 新しいQAモデルによる生産性倍増への挑戦

DeNA_Tech

関連スライド

Roslynアナライザー_ Unityでの開発環境を改善するための静的解析の仕組みの構築

ディメンショナルモデルの実導入と実装について

Difyによる全社LLMプラットフォーム運用とv1アップデート

【DeNA TechCon 2025】 DeNAがマスタデータ管理にOyakataを使う理由

【DeNA × AI Day】DeNAスポーツ事業戦略とベイスターズAI強化プロジェクト

GraphQLやるならDataloaderを使おう

各ページのテキスト

AI×品質管理　新しいQAモデルによる生産性倍増への挑戦