---
title: SAM 3 × アノテーション — ワンダリアアプリの画像認識AIを支える基盤作り
tags:  #dena ai talks  
author: [DeNA_Tech](https://www.docswell.com/user/DeNA_Tech)
site: [Docswell](https://www.docswell.com/)
thumbnail: https://bcdn.docswell.com/page/GJWGY2PW72.jpg?width=480
description: ワンダリアアプリの生き物をリアルタイムで認識するオンデバイスAIの開発において、独自のデータセット構築に必要な膨大なアノテーション作業が開発サイクルを遅らせる課題となっていました。本スライドでは、この課題を解決するために最新のビジョン基盤モデル「SAM 3」を活用し、アノテーション作業を劇的に効率化する内製基盤を構築した事例を紹介しています。  【主な見どころ】 - SAM 3の実用例: SAM 2からの進化点を含め、テキストや画像例で指示する「概念プロンプト」と、クリックや矩形で指定する「インスタンス指定プロンプト」を実務でどう活用しているかを解説しています。 - システムの工夫: OSSの「Label Studio」を拡張してSAM 3と統合し、人間がチェック・修正を行う「Human-in-the-Loop」を中心としたシステム設計について紹介しています。 - 運用と事業インパクト: プロンプトの特性に応じた開発者とアノテーターの使い分けや、作業時間を1400時間から75時間（95%削減）へと大幅に短縮した成果についてまとめられています。  【こんな方におすすめ】 - 画像認識AIの開発やアノテーション業務に携わっているエンジニア・プロジェクトマネージャー - SAM 3などの最新ビジョンモデルの実務への組み込み事例に関心がある方 - AI開発サイクルの高速化や業務効率化の手法を探している方
published: June 02, 26
canonical: https://www.docswell.com/s/DeNA_Tech/ZMQVDW-2026-06-02-204843
---
# Page. 1

![Page Image](https://bcdn.docswell.com/page/GJWGY2PW72.jpg)

SAM 3 × アノテーション — ワンダリア
アプリの画像認識AIを支える基盤作り
孫 卓凡
AI・データ戦略統括部 AI技術開発部 ビジョン&amp;スポーツG
株式会社ディー・エヌ・エー
© DeNA Co., Ltd.
1


# Page. 2

![Page Image](https://bcdn.docswell.com/page/4EZLXDK273.jpg)

自己紹介
孫 卓凡
IT本部AI・データ戦略統括部AI技術開発部
ビジョン・スポーツグループ
大学時代
東京大学 電子情報工学科 → 学際情報学府
● 研究内容：Text-to-3D生成、360度映像
2025年4月 株式会社ディー・エヌ・エーに新卒入社
2025年8月~ ワンダリアアプリのAI開発
趣味：筋トレ、映画、猫
© DeNA Co., Ltd.
2


# Page. 3

![Page Image](https://bcdn.docswell.com/page/Y76W41267V.jpg)

目次
1
ワンダリアアプリのAI開発について
2
SAM3について
3
SAM3を活用したアノテーション
4
ワンダリアアプリAI開発における運用・事業インパクト
5
まとめ
© DeNA Co., Ltd.
3


# Page. 4

![Page Image](https://bcdn.docswell.com/page/G75MQ42574.jpg)

01
ワンダリアアプリのAI開発につ
いて
© DeNA Co., Ltd.
4


# Page. 5

![Page Image](https://bcdn.docswell.com/page/9J29PV4GER.jpg)

ワンダリアアプリのオンデバイスAI
施設内の映像にスマホを向け、映像中の生き物をリアルタイムで認識 → 生き物カード取得
© DeNA Co., Ltd.
5


# Page. 6

![Page Image](https://bcdn.docswell.com/page/DEY453MGJM.jpg)

ワンダリアアプリのAI開発の背景
高速なAI開発サイクルが求められる
AI開発が体験成立するための最終工程
映像制作
映像制作
開
業
AI開発
AI開発
映像磨き上げ
AI開発
開
業
AI開発サイクルの高速化により、映像をさらに磨き上げる時間を創出
→ お客様へ最大のDelight提供💡
© DeNA Co., Ltd.
6


# Page. 7

![Page Image](https://bcdn.docswell.com/page/VJNYNVW878.jpg)

ワンダリアアプリのAI開発の課題
独自データセット構築におけるアノテーション作業
膨大なフレーム数・生き物数
→ AI開発サイクルが遅くなる
© DeNA Co., Ltd.
7


# Page. 8

![Page Image](https://bcdn.docswell.com/page/YE9PR6XXJ3.jpg)

ワンダリアアプリのアノテーション基盤の位置付け
AI開発サイクルを早めるために
最新ビジョン基盤モデルSAM3による物体トラッキングを活用した
内製アノテーション基盤を開発・運用
劇的なアノテーション効率化
最も映像数が多いzoneにおいて
アノテーション作業時間を 1400時間 → 75時間 に大幅短縮
© DeNA Co., Ltd.
8


# Page. 9

![Page Image](https://bcdn.docswell.com/page/GE8DWZ29ED.jpg)

02
SAM3 について
© DeNA Co., Ltd.
9


# Page. 10

![Page Image](https://bcdn.docswell.com/page/LELMND2M7R.jpg)

Segment Anything [1]
●
Segment Anything：画像用セグメンテーションモデル、物体をクリックや物体を囲む矩
形から物体のマスクを生成
出典: [2]（一部トリミング）
© DeNA Co., Ltd.
[1] Kirillov et al., &quot;Segment Anything.&quot; arXiv, 2023.
[2] Carion et al., &quot;SAM 3: Segment Anything with Concepts.&quot; arXiv, 2025.
10


# Page. 11

![Page Image](https://bcdn.docswell.com/page/4JMYXP86JW.jpg)

SAM2 [1]
●
SAM2 : Segment Anythingを動画に拡張し、一部のフレームのクリックや矩形から動画全
体にわたる対象物体の追跡マスクを生成 → 物体トラッキングとして活用
SAM
SAM2
出典: [2]（一部トリミング）
© DeNA Co., Ltd.
[1] Ravi et al., &quot;SAM 2: Segment Anything in Images and Videos.&quot; arXiv, 2024.
[2] Carion et al., &quot;SAM 3: Segment Anything with Concepts.&quot; arXiv, 2025.
11


# Page. 12

![Page Image](https://bcdn.docswell.com/page/PJR9N15N79.jpg)

SAM3 [1]
●
SAM3: SAM2のクリックや矩形による指示のトラッキング精度向上に加え、テキストや画
像例の提示によって対象物のトラッキングが可能
→ 最も今回のトラッキングタスクに適しているビジョン基盤モデル
SAM2
SAM3
出典: [1]
© DeNA Co., Ltd.
[1] Carion et al., &quot;SAM 3: Segment Anything with Concepts.&quot; arXiv, 2025.
12


# Page. 13

![Page Image](https://bcdn.docswell.com/page/PEXQNYK8JX.jpg)

03
SAM3を活用したアノテーション
© DeNA Co., Ltd.
13


# Page. 14

![Page Image](https://bcdn.docswell.com/page/3EK9N35LED.jpg)

SAM3を活用したアノテーションシステムの工夫点
アジャイル方式
「Human-in-the-Loop」中心の設計思想
●
アノテーション品質の担保
○
●
© DeNA Co., Ltd.
●
自動追跡のズレや誤認識が発生する前提
1で、人間の介在でチェック、修正でき
るシステム
シーンに応じたトラッキング制御
○
トラッキングする範囲を自由に設定
○
シーンや対象物の特性に応じて、プロン
プト方式を切り替え、アノテーション効
率を向上
短期間で初代バージョンを作り、アノテー
ションに投入
○
●
初代バージョンはスクラッチから
実際の作業で生じる課題やフィードバック
を吸収してバージョンアップ
14


# Page. 15

![Page Image](https://bcdn.docswell.com/page/L73WVGK675.jpg)

SAM3を活用したアノテーションツール概要
OSSのLabel Studio を機能拡張し、SAM3バックエンドと統合
拡張 Labelstudio UI
SAM3バックエンド
追跡範囲指定
プロンプト追加
API 呼び出し
プロンプト+追跡範囲
Labelstudio ML SDK仕様に準拠
したサーバーエンドポイント
プロンプト種別に応じて、 指
定フレーム範囲に対し、 SAM3
による推論
(結果をLabelstudio形式に変換)
UI上トラッキング結果表示
必要に応じて修正
© DeNA Co., Ltd.
レスポンス
トラッキング結果
(bbox)
15


# Page. 16

![Page Image](https://bcdn.docswell.com/page/87DK813MJG.jpg)

プロンプトの種類
以下のプロンプトをシーンとトラッキング対象に合わせて使い分け。
概念プロンプト
指示方法:
インスタンス指定プロンプト
指示方法:
●
テキストによる指示
●
クリックによる点指定
●
代表的な画像例の提示
●
矩形（Bounding Box）指定
提示された概念または例に該当するすべての物体をト
ラッキングする場合に使用
© DeNA Co., Ltd.
特定の個体を明示的に指定し、精密なトラッキングを行
う場合に使用します。
16


# Page. 17

![Page Image](https://bcdn.docswell.com/page/VJPK8Q4QE8.jpg)

概念プロンプト
トラッキング範囲指定 → テキストまたは個体例で指定 → 該当する全物体をトラッキング
© DeNA Co., Ltd.
17


# Page. 18

![Page Image](https://bcdn.docswell.com/page/2EVVN5XPEQ.jpg)

概念プロンプトの強み・課題
●
✅ 集団を一気にアノテーション可能
●
❌ 体系的なベストプラクティスが存在せず、シーンごとのプロンプトの与え方の経験則
（試行錯誤）が必要
●
❌ 特殊なドメインでは精度が低い場面が多い
●
❌ 推論失敗時における部分的なリカバリーが困難なケースが多く、作業の巻き戻りリス
クを伴う
●
❌ インスタンス指定プロンプトと比較して推論実行に時間がかかる
© DeNA Co., Ltd.
18


# Page. 19

![Page Image](https://bcdn.docswell.com/page/57GLK6VQEL.jpg)

インスタンス指定プロンプト
トラッキング範囲指定 → 複数フレームにプロンプト追加(Box) → 対象物体をトラッキング
© DeNA Co., Ltd.
19


# Page. 20

![Page Image](https://bcdn.docswell.com/page/4EQYN46WJP.jpg)

インスタンス指定プロンプト
トラッキング範囲指定 → 複数フレームにプロンプト追加(Point) → 対象物体をトラッキング
© DeNA Co., Ltd.
20


# Page. 21

![Page Image](https://bcdn.docswell.com/page/KJ4WGQ4171.jpg)

インスタンス指定プロンプトの強み・課題
●
✅ 幅広いドメインのシーンに対して高精度なトラッキング可能（手修正が少ない）
●
✅ アノテーション対象のコントロール性が高い
●
✅ 推論処理が高速
●
✅ 作業が標準化しやすい
●
❌ 一体ずつプロンプトを与える必要がある
© DeNA Co., Ltd.
21


# Page. 22

![Page Image](https://bcdn.docswell.com/page/LE1YDP457G.jpg)

04
ワンダリアアプリAI開発における
運用・事業インパクト
© DeNA Co., Ltd.
22


# Page. 23

![Page Image](https://bcdn.docswell.com/page/GEWGY2XWJ2.jpg)

プロンプトの特徴を踏まえた使用者ごとの運用
概念プロンプト
強み
インスタンス指定プロンプト
集団の一括処理
幅広いドメインに対する
高精度トラッキング
作業アプローチ
プロンプトの試行錯誤(職人技)
一体ずつプロンプトを与える(標準化)
推論スピード
遅
速
コントロール性
低
高
失敗時の対応
リカバリー困難
手修正で対応しやすい
主な使用者
開発者側(タスク依頼側)
概念プロンプトの活用による高密度
タスクの自動化・削減
アノテーター
確実性とタスク標準化を重視したイン
スタンス指定プロンプト運用
© DeNA Co., Ltd.
23


# Page. 24

![Page Image](https://bcdn.docswell.com/page/47ZLXD62J3.jpg)

事業インパクト
アノテーション作業時間を劇的に削減
お客様へのDelightを最大化
最も映像数が多いzoneにおいて、手作業で
1400時間必要なアノテーション作業を75時
間に短縮（95%削減）
高速かつ高品質なAI開発のサイクルを実現し、映
像体験を磨き上げる時間を創出
映像制作
AI開発
磨き上げ
AI開発
開業
SAM3 + Labelstudio アノテーションツールを横展開し、社内他のプロジェクトでも活用
© DeNA Co., Ltd.
24


# Page. 25

![Page Image](https://bcdn.docswell.com/page/YJ6W41L6JV.jpg)

05
まとめ
© DeNA Co., Ltd.
25


# Page. 26

![Page Image](https://bcdn.docswell.com/page/GJ5MQ415J4.jpg)

まとめ
●
アノテーション基盤構築
○
「Human-in-the-Loop」中心設計
■
○
アジャイル的な開発
■
●
Labelstudio と SAM3 の統合で実現
最新AI技術を最速で価値に
運用
○
開発者側（アノテーション依頼側）：概念プロンプトの活用による高密度タスクの
自動化・削減
○
●
© DeNA Co., Ltd.
アノテーター：確実性と標準化を重視したインスタンス指定プロンプト運用
事業インパクト
○
高速かつ高品質なAI開発のサイクルを実現し、お客様へのDelightを最大化
○
他のプロジェクトにも横展開
26


# Page. 27

![Page Image](https://bcdn.docswell.com/page/9E29PV1G7R.jpg)

Appendix.
© DeNA Co., Ltd.
27


# Page. 28

![Page Image](https://bcdn.docswell.com/page/D7Y453ZGEM.jpg)

インスタンス指定プロンプト: SAM3 vs SAM2
© DeNA Co., Ltd.
28


# Page. 29

![Page Image](https://bcdn.docswell.com/page/VENYNV38J8.jpg)

インフラ構成
GCS bucket
アノテーション対象動画
GCS bucket
データバックアップ
Cold startの場合
取得
Cold startの場合
バックアップ
着手動画名
（または修正対象ファイル）
Cloud Run
Main image(Labelstudio)
+
Sidecar(SAM3)
© DeNA Co., Ltd.
アノテーション作業
結果ファイル（json）を
Google Driveにアップロード
29


# Page. 30

![Page Image](https://bcdn.docswell.com/page/Y79PR69XE3.jpg)

© DeNA Co., Ltd.
30


