SIFT特徴量

3.2K Views

December 03, 25

#SIFT特徴量 #画像認識 #特徴点検出 #コンピュータビジョン #アルゴリズム

スライド概要

大学のゼミで作成したSIFT特徴量の講義スライドです。
Qiitaで紹介するために公開します。

まさきち

@masaki

スライド一覧

まさきちでござる。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.2M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

最新の6.0で学ぶ！初めてのひとのためのSpring Security

java spring security

tada 1M

各ページのテキスト

SIFT 特徴量

ここに３組、計６つの画像がある。

人間にはすぐに見分けがつく。

でもコンピュータには難しい回転してる明暗に差があるスケールが異なる微妙に視差がある

そこでSIFT特徴量！

目次 1. SIFTとは 2. SIFT特徴量の使い所 3. SIFT特徴量の優秀な点 4. SIFT特徴量の微妙な点 5. SIFT特徴量をPythonで求める 6. 仕組みの話 1. アルゴリズムの概観 2. 各ステップの詳細 3. SIFT特徴量の堅牢性がどのように生み出されているか

SIFTとは画像のスケールや回転、明るさの変化に影響されずに、画像中の特徴点を検出・記述したい時に用いるアルゴリズムである。 SIFT 特徴点：画像内で際立った特徴を持つ点のこと（e.g. 物体の角,エッジの交点…）特徴量行列

SIFT特徴量の使い所物体の認識と検出が主な用途 • 棚に並んだ特定の商品を認識 • 工場のラインで流れてくる製品の中から、特定の部品を検出 • 野生動物の個体識別 • MRIやCTスキャンなどの医用画像から病変部を識別 <その他> パノラマ写真、3次元モデル復元、自己位置推定（SLAM） https://g.co/gemini/share/c1d8088d8b8d

https://g.co/gemini/share/c1d8088d8b8d

SIFT特徴量の優秀な点（１/２）様々な堅牢性 & 高い精度 & 学習不要で手軽に使えるスケール不変性対象の大きさが変化しても特徴量は変化しない回転不変性対象が回転しても特徴量は変化しない照明変化への堅牢性明るさやコントラストが変化しても特徴量は変化しないノイズ・位置ずれへ多少のノイズや位置ずれがあっても特徴量は変化の堅牢性しない

10.

SIFT特徴量の優秀な点（２/２）様々な堅牢性 & 高い精度 & 学習不要で手軽に使える人為的手法と比較して… 機械的手法と比較して… • (発見した特徴点の数) × 128の2次元配列を出力。これは他の手法と比べて多くの情報を含む。 • 事前学習が不要。 • CPUで十分に動作する。ただし、深層学習モデルなどに精度は劣る。

11.

SIFT特徴量の微妙な点計算コストが高いエッジ/モバイルデバイスでの実行やリアルタイム性の要求されるアプリケーションでの活用は難照明変化への堅牢性極端な輝度変化や非線形な照明変化（例：強いハの限界イライトや影）に対しては精度が低下するアフィン変換への限剪断や射影変換への不変性は持たない定的な不変性特徴量ベクトルの次メモリ消費量が多い元が高いマッチング処理に時間がかかる画像出典: https://kaibutsusyain.com/how-to-perform-projectivetransformation-with-python-and-opencv/ https://gimp-howtouse.net/toolbox/%E5%89%AA%E6%96%AD%E5%A4%89%E5%BD%A2%E3%81%AE%E 4%BD%BF%E3%81%84%E6%96%B9/#google_vignette

12.

SIFT特徴量をPythonで求める OpenCVを使うだけで簡単に使える！

13.

ここからは仕組みの話 1. アルゴリズムの概観 2. 各ステップの詳細 3. SIFT特徴量の堅牢性がどのように生み出されているか

14.

SIFT アルゴリズムの概観（１/４）特徴点の検出特徴量の記述 SIFTは大まかに特徴点の検出と特徴量の記述の2ステップ SIFT 特徴点の検出各特徴点の特徴量を記述特徴点：画像内で際立った特徴を持つ点のこと（e.g. 物体の角,エッジの交点…）

15.

検出候補点の探索 SIFT アルゴリズムの概観（２/４）候補点の絞り込み記述特徴点検出は候補点の探索と候補点の絞り込みの２ステップ特徴点の検出候補点の探索候補点の絞り込み最も効率よく情報を取れる範囲（=スケール）を算出

16.

検出候補点の探索 SIFT アルゴリズムの概観（３/４）候補点の絞り込み記述方向の検出勾配情報の集計特徴量記述も方向の検出と勾配情報の集計の２ステップ特徴量の記述方向の検出方向を軸に勾配情報の集計

17.

アルゴリズムの概観（４/４） SIFTは大まかに2ステップ、細かく見ると4ステップ特徴点の検出候補点の探索 SIFT 候補点の絞り込み特徴量の記述方向の検出勾配情報の集計

18.

ステップ１ - 候補点の探索（１/４）いろんな具合にぼやかした画像同士の差（=DoG画像）を作る DoG画像にはエッジなどの特徴的な部分が強調して表示される元画像 https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

19.

ステップ１ - 候補点の探索（２/４） DoG画像から極値を検出し、候補点とする。特徴的な部分の中でも特に目立つ部分がわかる。 https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

20.

ステップ１ - 候補点の探索（３/４）その特徴を拾うために見るべき範囲（スケール）もわかる。 https://www.slideshare.net/slideshow/sift32258833/32258833#20 https://qiita.com/tatsuya11bbs/items/225634d352de09206a8f

21.

ステップ１ - 候補点の探索（４/４）スケール不変性を獲得！ https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

22.

前提知識 - 2次元画像における勾配とは画像内の各画素における輝度（明るさ）の変化の度合いを表すもの元画像（白黒4×4）横軸に関する勾配 (=X軸に関する微分） 0 0 0 0 0 127 128 0 0 255 0 0 0 0 0 0 0 0 127 255 0 255 0 0 0 0 255 255 0 0 127 255 0 0 128 0 0 0 0 0 0 0 0 0 0 0 255 255 縦軸に関する勾配（=Y軸に関する微分）

23.

24.

ステップ２ - 候補点の絞り込み候補点はエッジや低コントラストな点も含むので、ヘッセ行列を使って除外する。ヘッセ行列の固有値は曲率が最大になる方向と、曲率が最小になる方向における曲率の大きさを表す。 https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

25.

ステップ３ – 方向の検出特徴点の周囲のピクセルの勾配と重みを集計、最も大きい勾配をその特徴点の”方向”とする。 https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

26.

ステップ４ – 勾配情報の集計方向を基準として特徴点の周囲の勾配情報を集計 16エリア,8方向、合計128の勾配の大きさを正規化してまとめる。特徴点数×128 https://www.slideshare.net/slideshow/sift-32258833/32258833

https://www.slideshare.net/slideshow/sift-32258833/32258833

27.

堅牢性がどのように生み出されているか全てのステップが密に連携し、様々な堅牢性を実現！堅牢性スケール不変性ステップ要因番号 1 候補点の探索時に適切なスケールを探索回転不変性 3,4 方向を軸として特徴量を記述照明変化への堅牢性ノイズ・位置ずれへの堅牢性 4 勾配の集計結果を正規化する 2,4 ノイズの影響を受けやすい候補点を除去勾配の集計を小領域ごとに大らかに実行

28.

ありがとうございました

29.

余談 • SIFTは最近特許が切れて使いやすくなった。 • SIFTは「Scale-Invariant Feature Transform」の略。日本語に訳すと「スケール不変特徴量変換」。と言うことは「SIFT特徴量」=「スケール不変特徴量変換特徴量」。頭痛が痛い。 • 「DoG画像」は計算量の多い「LoGフィルタ」の結果を近似しているらしい。 LoGフィルタはノイズを低減しつつ輪郭を抽出できるらしい。