【DL輪読会】Semi-Parametric Neural Image Synthesis

>100 Views

December 16, 22

@deep learning jp

スライド概要

2022/12/16
Deep Learning JP
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 23.9K

【DL輪読会】Generative Agents: Interactive Simulacra of Human Behavior

Deep Learning JP 12.8K

【DL輪読会】4D Gaussian Splatting for Real-Time Dynamic Scene Rendering

Deep Learning JP 11.9K

【DL輪読会】LLMベースの自律型エージェントシステムのサーベイ

Deep Learning JP 11.5K

【DL輪読会】LightGlue: Local Feature Matching at Light Speed

Deep Learning JP 9.7K

【DL輪読会】Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback

Deep Learning JP 7.8K

各ページのテキスト

DEEP LEARNING JP [DL Papers] Semi-Parametric Neural Image Synthesis Takeru Oba, Ukita Lab http://deeplearning.jp/ 1

http://deeplearning.jp/

書誌情報タイトル：Semi-Parametric Neural Image Synthesis 著者：Andreas Blattmann, Robin Rombach, Kaan Oktay, Jonas Müller, Björn Ommer (LMU Munich, MCML & IWR, Heidelberg University, Germany ) 会議：NeurIPS. 2022 2

概要モチベ：生成モデルの学習パラメータ数を減らしたいアイデア： NLPの分野では， RETROなどretrievalを利用した手法がモデルのパラメータと計算コストを減らしつつ，SOTAと同等の精度を達成本手法では，retrievalを利用して，データセットを学習しないパラメータとしたSemi-Parametricな画像生成モデルを提案 Retrievalによって類似画像を獲得し，それをヒントとすることでモデルの学習パラメータを減らし，計算コストを削減 3

概要 Given: • 学習データセット • 検索用データセット • 距離関数(CLIP) 学習データとは異なると仮定推論時に変更することも可能学習せずに固定 – CLIPで得た特徴量間のCosine Similarity • 検索方法 – 距離が近い𝑘個のサンプルを検索用データセット𝐷から選ぶ学習データ𝑥に近い𝑘個のサンプルからxを生成 • Diffusion • Autoregressive Model Target: • 生成モデル尤度を最大化するようにパラメータ𝜃を最適化 4

提案モデル 5

提案モデル学習手順 1. 学習データの画像𝑥 をサンプリング 2. 検索用データセット𝐷 𝑡𝑟𝑎𝑖𝑛 から検索方法あに従って画像x に近いデータを得る 3. 検索したデータをエンコーダー𝜙から特徴量ベクトルを得る 4. 得られた特徴量ベクトルを入力として画像𝑥 を復元するようにモデル𝑝𝜃 を学習 6

提案モデル推論方法 Class Condition：クラスに対応するデータをランダムサンプリングした後，その近傍データを検索 Unconditional Sampling：データセットからランダムサンプリングした後，近傍データを検索（少し工夫しているので論文を参考にしてください） Text Condition： CLIPを利用しているため，言語をエンコードしたベクトルから直接検索できる 7

実験結果（画像生成） Unconditionalで検索した画像からの生成結果検索結果生成結果学習データの近傍画像学習データの近傍画像とは異なる画像が生成できている 8

実験結果（検索数と速度）検索にはScaNNを使用．20の近傍データの検索時間は約0.95 ms 検索するデータの数を増やすとrecallが上がってprecisionが下がるという結果が得られた． 9

10.

実験結果（検索数と速度）生成した画像がどれだけ実データの分布の中にあるか実データの画像がどれだけ生成画像の分布にあるか RecallとPrecisionのイメージ 𝑃𝑔 が生成された画像の分布で𝑃𝑟 がデータセットの分布 (参考：Improved Precision and Recall Metric for Assessing Generative Models https://arxiv.org/pdf/1904.06991.pdf) 10

https://arxiv.org/pdf/1904.06991.pdf)

11.

実験結果（定量評価） Image Net (IN)の実験結果． RDM-OIは学習検索データをOpen Imagesにした結果 RDM-INは学習検索データもImage Netにした結果 ADMは比較手法でDiffusion base IC-GANはGANベース 11

12.

実験結果（定量評価） ADMに比べてパラメータ数を減らしつつ様々な指標で高精度を達成ただし，GANよりはパラメータ数が多い 12

13.

実験結果（データセットの複雑さによる変化）データセットが複雑になると精度がどのように変化するかの検証 Dogs→Mammals→Animalsの順に複雑さを上げる丸●が提案のsemi-parametricで四角■が従来のfull-parametric 同じ色の丸と四角を比較すると多くの場合において差が広がっている →semi-parametricの効果が大きい 13

14.

まとめまとめデータセットを学習しないパラメータとして利用する Semi-parametricな生成モデルを提案した．これにより，従来の手法よりも学習パラメータを少なくすることで計算コストを削減また，推論時の検索方法を変更することでクラスでの条件付けなどの様々なサンプリングが可能であることを示した． 14