ae-5. 物体検出，セグメンテーション

1.7K Views

January 29, 23

#画像理解 #物体検出 #セグメンテーション #セグメンテーションの仕組み #セグメンテーションの種類 #ディープラーニング #人工知能 #金子邦彦研究室

スライド概要

ディープラーニング（スライドとプログラム例，Python を使用）（全１５回）
トピックス：画像理解, 物体検出, セグメンテーション, セグメンテーションの仕組み, セグメンテーションの種類, ディープラーニング, 人工知能

https://www.kkaneko.jp/ai/ae/index.html

金子邦彦研究室ホームページ
https://www.kkaneko.jp/index.html

kunihikokaneko

@6674398749

スライド一覧

金子邦彦（かねこくにひこ）福山大学・工学部・教授ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

dn-5. 顔検出，顔認識（Dlib, InsightFace を使用）

kunihikokaneko 15.8K

bt-7. Blender 3.0 の液体のアニメーション

blender 流体アニメーションドメインフローエフェクター液体ジオメトリ流入口ベイク

kunihikokaneko 5.9K

ae-9. 姿勢推定

姿勢推定人体の姿勢推定頭部の姿勢推定オブジェクトの姿勢推定ディープラーニング人工知能金子邦彦研究室

kunihikokaneko 5.7K

NVIDIA ドライバ, CUDA 11.6, cuDNN 8.4 のインストール (Windows 上) (2022年4月の最新版)

プログラミング nvidia cuda nvidia cudnn nvidia ドライバインストール windows

kunihikokaneko 5.1K

1. データベースとは，データベースシステムとは，情報とデータ

データベースデータベースシステム情報とデータデータの種類オープンデータ情報化社会

kunihikokaneko 3.9K

ae-2. 機械学習の基礎（教師なし学習，教師あり学習）

機械学習機械学習の仕組み学習検証 iris データセット教師有り学習教師無し学習予測クラスタリング分離ディープラーニング人工知能金子邦彦研究室

kunihikokaneko 3.6K

各ページのテキスト

5. 物体検出，セグメンテーション（ディープラーニング，Python を使用）（全１５回） https://www.kkaneko.jp/cc/ae/index.html 金子邦彦 1

https://www.kkaneko.jp/cc/ae/index.html

機械学習 • 学習による上達の能力 • 訓練データを使用して，学習を行う 2

コンピュータによる画像理解 • コンピュータが画像を理解する画像が何であるか，物体がどこに，どういう大きさ，形で，いくつあるか，をコンピュータが説明できる能力を持つ 3

コンピュータによる画像理解 • 一般的な画像（実験室で撮影などの制約が無い） • さまざまな応用：スマホ，デジカメ，自動車，ロボット • さまざまな種類：画像分類，物体検出，セグメンテーション，超解像，３次元化など 4

画像理解の主な種類 ① 画像分類「何があるか」を理解 person bicycle person ② 物体検出場所と大きさも理解 ③ セグメンテーション画素単位で領域を理解 bicycle 5

物体検出バウンディングボックス，ラベルと確率バウンディングボックス：物体を囲むボックス（四角形） 6

セグメンテーション物体の形を画素単位で抜き出しラベルを得ることもできる 7

畳み込みニューラルネットワーク（CNN）畳み込みニューラルネットワークは，畳み込み層と，プーリング層を交互に繰り返すディープニューラルネットワーク畳み込み層プーリング層畳み込み層プーリング層畳み込み層プーリング層畳み込み層プーリング層畳み込み層プーリング層さまざまなバリエーション • 畳み込み層 • プーリング層変になる・・・・・・畳み込みによるパターンの識別画像の小移動に対して，出力が不 8

アウトライン番号項目 5-1 5-2 ディープラーニングによる物体検出の仕組みディープラーニングによるセグメンテーションの仕組み 5-3 物体検出の演習 5-4 セグメンテーションの演習各自、資料を読み返したり、課題に取り組んだりも行う 9

10.

5-1. ディープラーニングによる物体検出の仕組み 10

11.

物体検出とバウンディングボックス car person bicycle バウンディングボックスは，物体を囲む最小の四角形 11

12.

物体検出の仕組み ① 元画像から切り出す最初の区切り画像分類結果 12

13.

物体検出の仕組み ② 画像分類結果区切りごとに画像分類を行う． 13

14.

「区切り」を用いた物体検出での課題と解決課題：物体の大きさがさまざま解決へのアプローチさまざまなスケールの画像を作る（マルチスケール）どこかのスケールでは，物体は「所定の大きさ」に近くなる ⇒ 区切りの大きさは同じにして，マルチスケールの画像を扱うこれで，さまざまな大きさの物体を扱う 14

15.

ディープラーニングによる物体検出の仕組み特徴マップ：画像の中の特定のパターンがどこにあるかなど示したマップマルチスケール化，各スケールの特徴マップを上位に特徴マップ画像を区切る処理，反映させるなど (backbone) 画像分類など (neck) 特徴マップ物体検出の結果特徴マップ特徴マップ元画像マルチスケールの特徴マップ改善された特徴マップ画像の区切り，分類結果全体で多層のニューラルネットワーク 15

16.

まとめ car マルチスケールの特徴マップ改善された特徴マップ person 画像の区切り，分類結果元画像 bicycle • 区切りごとに画像分類を行う • 現在は，さまざまな改良版が提案されている 16

17.

R-CNN の Selective Search（2014年発表の物体検出手法） 1. 入力画像 2. 領域の候補 3. 畳み込みニューラルネットワークでの処理 4. 領域について，画像分類の結果を得る単純に画像を区切る ⇒ 課題：あらゆる可能性を試すので，区切りの数が多すぎる ⇒ 解決策：領域の候補（さまざまな場所，大きさ）を自動で得る．領域の候補の数は，数千以下に絞る． Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik, Rich feature hierarchies for accurate object detection and semantic segmentation, arXiv:1311.2524, 2014. 17

18.

5-2. ディープラーニングによるセグメンテーション 18

19.

画像分類とセマンティック・セグメンテーション画素 person bicycle 画像を分類 person 画素単位で分類画像分類全画素を分類セマンティックセグメンテーション 19

20.

FCN （2015年発表） • 画素ごとに分類結果の正解を与えての学習を可能にする技術 • 最終層を畳み込み層にする＝ FCN と呼ぶ最終層は FCN 最終層は全結合層元画像結果元画像畳み込みニューラルネットワークによる画像分類結果畳み込みニューラルネットワークと FCN によるセマンティック・セグメンテーション Jonathan Long, Evan Shelhamer, Trevor Darrell, Fully Convolutional Networks for Semantic Segmentation, arXiv:1411.4038, 2015. 20

21.

FCN （2015年発表）まとめ • 画像分類を行う畳み込みニューラルワーク（出力は分類結果）で，最終層を FCN に置き換え • セマンティック・セグメンテーションに応用 Jonathan Long, Evan Shelhamer, Trevor Darrell, Fully Convolutional Networks for Semantic Segmentation, arXiv:1411.4038, 2015. 21

22.

U-Net（2015年発表）によるセマンティック・セグメンテーション細胞のモノクロ画像のセグメンテーション 22

23.

U-Net (2015年発表) の仕組みセマンティック・セグメンテーションの結果を鮮明にするための Skip connection の導入．画像縮小の際に輪郭情報が失われるという問題を解決．サイズを拡大しながらマルチスケール結果を得るの特徴マップ元画像特徴マップサイズ縮小途中結果 Skip connection 両方を入力として使用特徴マップサイズ縮小 Skip connection 両方を入力として使用特徴マップ途中結果途中結果最終結果サイズ拡大サイズ拡大全体で多層のニューラルネットワーク Olaf Ronneberger, Philipp Fischer, Thomas Brox, U-Net: Convolutional Networks for Biomedical Image Segmentation, arXiv:1505.04597, 2015. 23

24.

U-Net (2015年発表) の仕組み元論文では次のように図解．畳み込みニューラルネットワークであることが確認できる． Olaf Ronneberger, Philipp Fischer, Thomas Brox, U-Net: Convolutional Networks for Biomedical Image Segmentation, arXiv:1505.04597, 2015. 24

25.

まとめ • ニューラルネットワークの層の種類 • 畳み込み層 • プーリング層 • 全結合層 • 物体検出、セグメンテーションを可能にする追加の技術 • • • • マルチスケール特徴マップ、特徴マップを用いた画像の区切り FCN （最終層を畳み込み層にする） Skip connection 25

26.

セグメンテーションの種類元画像パノプティック・セグメンテーション • • • • インスタンス・セグメンテーションセマンティック・セグメンテーション OneFormer のデモサイトを使用 URL: https://huggingface.co/spaces/shi-labs/OneFormer 訓練データは COCO バックボーンは DiNAT-L を使用 26

https://huggingface.co/spaces/shi-labs/OneFormer

27.

セグメンテーションの種類セマンティック・セグメンテーション全画素を種類に分類インスタンス・セグメンテーション個別の物体を識別する「物体として識別できない部分は結果がない」ということもあるパノプティック・セグメンテーションセマンティック・セグメンテーションとインスタンス・セグメンテーションの同時実行 27

28.

5-3. 物体検出の演習 28

29.

① 物体検出を動かしてみる 1. 使用するページ: https://colab.research.google.com/github/tensorflow/ hub/blob/master/examples/colab/object_detection.ip ynb 2. 必要な事前知識 • 物体検出が行うこと：物体のバウンディングボックス、ラベル、確率を得る • 事前学習済みのモデルを使用 3. 各自で実行すること実際に実行し、物体検出を試す．スピード、精度も確認 29

https://colab.research.google.com/github/tensorflow/

30.

① 物体検出を動かしてみる 30

31.

5-4. セグメンテーションの演習 31

32.

Google Colaboratory の使い方概要 ① 実行コードセル Google Colaboratory ノートブックコードセルの再実行や変更には， Google アカウントでのログインが必要 32

33.

Google Colaboratory の使い方概要 ② 実行コードセルテキストセル実行コードセル • WEBブラウザでアクセス • コードセルは Python プログラム．各自の Google アカウントでログインすれば，変更，再実行可能一番上のコードセルから順々に実行 33

34.

② セマンティック・セグメンテーション 1. 使用するページ: https://colab.research.google.com/drive/1NKmQfbD G0XCR0bO6vcFP304gy4iqeD7L?usp=sharing 2. 必要な事前知識 • セマンティック・セグメンテーション用のモデルがさまざまあること • 事前学習済みのモデルを使用 3. 各自で実行することページを読み、確認する（実行したい人は実行できるようにしている） 34

https://colab.research.google.com/drive/1NKmQfbD

35.

36.

③ パノプティック・セグメンテーション 1. 使用するページ: https://colab.research.google.com/drive/1xWaQuJt50Lq Ywyw9ohsYERZ_Ix1gy1rN?usp=sharing#scrollTo=az0N ragleQUI 2. 必要な事前知識 • パノプティック・セグメンテーションは，セマンティック・セグメンテーションとインスタンス・セグメンテーションをあわせもつ • 事前学習済みのモデルを使用 3. 各自で実行することページを読み、確認する（実行したい人は実行できるようにしている） 36

https://colab.research.google.com/drive/1xWaQuJt50LqYwyw9ohsYERZ_Ix1gy1rN?usp=sharing

37.

注目：物体と物体の切れ目が判別できている（セマンティック・セグメンテーションでは、このようにはならない） 37