【DL輪読会】Invariant Risk Minimization

1.1K Views

October 15, 21

deep learning

スライド概要

2021/10/15
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 22.4K

【DL輪読会】Generative Agents: Interactive Simulacra of Human Behavior

Deep Learning JP 12.4K

【DL輪読会】4D Gaussian Splatting for Real-Time Dynamic Scene Rendering

Deep Learning JP 11.2K

【DL輪読会】LLMベースの自律型エージェントシステムのサーベイ

Deep Learning JP 10.9K

【DL輪読会】LightGlue: Local Feature Matching at Light Speed

Deep Learning JP 9.2K

【DL輪読会】Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback

Deep Learning JP 7.6K

各ページのテキスト

DEEP LEARNING JP 論文紹介： [DL Papers] Invariant Risk Minimization Ryosuke Ohashi, bestat inc. http://deeplearning.jp/

http://deeplearning.jp/

書誌情報 ◆ 2019/7にarXivに投稿された論文(https://arxiv.org/abs/1907.02893) ◆ 概要 ◆ ◆ 複数のデータ分布を跨いで存在する不変な相関関係を推定する新手法を提案選定理由 ◆ 因果関係に注目したDG手法の先駆けということで気になっていたため 2

背景：OODへの汎化問題 ◆ ←OODでは気まぐれに予測ミス ◆ ←訓練データセットでは正確に予測 Torralba, Efros. Unbiased Look at Dataset Bias. ◆ 学習ベースのAIがOOD(訓練データ分布外)で気まぐれに挙動してしまう ◆ これだと信頼性がクリティカルに求められる応用には使えない ◆ 医療，自動運転，自動決済，etc. 3

背景：データセットバイアス，偽りの特徴 ◆ 牛とラクダの分類問題 ◆ 偽りの因果関係 ◆ 『画像の下半分が緑っぽくて上半分が青っぽい⇒牛』 ◆ ◆ 牛？！モデルがデータセットのバイアスにフィットしてしまうと... ◆ 真の因果関係に基づかず「偽りの相関関係・特徴」を使いタスクを解こうとしまう ◆ Correlation-causation dilemma 4

背景：ドメイン汎化 ◆ 以下のようなことが出来ないか？ ◆ カラーの写真，油彩画像で分類器を訓練 ◆ ⇒モノクロのペン画でも上手く分類 DomainNet dataset from Peng et al. Moment Matching for Multi-Source Domain Adaptation ◆ 複数の環境でモデルを訓練し，未知環境にも上手く汎化させたい ◆ 未知環境にも通用する「共通ルール」をモデルに学習させられないか？ ◆ 特定環境固有のバイアスに起因する「偽りの相関関係」を棄却させられないか？ 5

提案手法：IRMのアイデア ◆ IRM(不変リスク最小化)という新手法を提案 ◆ ◆ アイデア：特定環境固有の「偽りの特徴」を抽出してしまう特徴抽出器があったとする．その特徴を使って環境毎に個別に構築した最適な分類器は互いに異なるものになる（※環境毎に，その環境固有の「偽りの特徴」が分類に最も強く寄与する形になるため）． IRMでは，「どの環境でもその特徴を使って構築した最適な分類器が一致する」という条件を満たす特徴抽出器を探す．ただし，抽出される特徴がタスクを解くのになるべく有用であるようにもする． 6

提案手法：IRM ◆ Joint ERM ◆ + ◆ 環境共通の分類器が ◆ 各環境で同時に最適 ◆ ここでwは線形回帰or 分類器（の係数） 7

提案手法：IRM v1 ◆ IRMの目的関数は最適化ループがネストしていてチャレンジングなので簡易版も提案（※以下の説明では目的変数は１次元） ◆ w=(1,0.,,,.0)にしてしまう ◆ ◆ ◆ wを可逆行列で変換してしまった分をΦに吸収してしまえるので w=(1,0.,,,.0)が最適に近いかどうかはリスクの勾配ノルムでソフトに評価するハイパラλで特徴抽出器の有用性と不変性を調節する 8

実験結果1-1 ◆ ◆ シンプルなSEM(構造方程式モデル)にいくつかコントロール条件を付けて実験入力変数X_1, X_2から上記SEMで定まる潜在変数Yを線形回帰推定するモデルをいくつかの環境サンプルから学習させる： ◆ 真の因果関係を捉えているほど ◆ 偽りの相関関係に引っ張られているほど ◆ コントロール条件 ◆ が0から遠のく観測できない変数HがZやYに影響しない/する均一分散(O)/不均一分散(E) ◆ ◆ に近づく完全観測(F)/部分観測(P) ◆ ◆ は OかEかで環境固有のバイアスの出方が変わる組み換え(S)/非組み換え(U) ◆ ZがXにある直交行列を掛けたものになっているか/いないか 9

10.

実験結果1-2 ◆ 多くのコントロール条件下でERMより真の因果関係をよく捉えられており，偽りの相関に引っ張られにくくなっている 10

11.

実験結果2 ◆ NNとして浅いMLPを使い，ColorMNISTというデータセットでも実験 ◆ ColorMNIST ◆ ◆ ◆ ◆ MNISTに数字から決まるバイナリラベルを各画像につけておく（真の生成過程）環境パラメーターに応じて各画像に赤or緑色を塗り，環境によって色とバイナリラベルの間に異なる割合で相関が生じるようにする複数の訓練環境のいずれも赤色とラベル0の相関を高くするが割合は様々にしておき，テスト環境では相関が逆転しているようにする ERMは偽りの相関にフィットしてしまうが，IRMはテスト環境でも好成績 11

12.

まとめ，感想 ◆ まとめ ◆ ◆ ◆ 複数環境から学習することで環境固有のバイアスに起因する偽りの相関による悪影響を軽減しつつ真の相関を推定する手法IRMを提案シンプルなSEMやColorMNISTでIRMの効果を実験的にも確認感想 ◆ 距離ベースのDG手法に比べて，IRMはデータセットバイアスに左右されない真の因果関係を捉えたい，という狙いをそのまま具体化するような試みになっていて面白いと思った 12