【DL輪読会】アーキタイプ分析の臨床分野における応用

1.1K Views

October 27, 23

スライド概要

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

アーキタイプ分析の 臨床分野における応用 松尾研 輪読会 2023.10.27 東京慈恵会医科大学 博士課程D3 佐野 圭

2.

アーキタイプ分析とは

3.

アーキタイプ分析(AA)の概念イメージ データ群をアーキタイプ(AT)の線形和で示す次元削減 架空の動物 30% 20% 50%

4.

AAの図形的な定義 凸包(convex)の発想で 多次元空間における データ群の頂点を知りたい まず頂点数を決めた後 損失 = convexと漏れた赤点との 最小距離(赤線)の二乗和 損失を最小化する 頂点(AT)を求める. 出典:https://www.researchgate.net/publication/344671912

5.

AAの数学的な定義 個体 axis=0の和が1 アーキタイプ Y (A) を初期化 Z を更新 Y (A) を更新 出典:https://www.researchgate.net/publication/344671912

6.

臨床研究への応用

7.

視野検査とは? 半径30°の視野に存在する 網膜神経節細胞は全体の80% 視野検査 76次元データ

8.

視野検査とは? 視野検査(右眼) 眼底写真(右眼)

9.

緑内障とは? 初期 中期 緑内障では数年かけて視野が増悪 後期 「視野の悪さ」をMD値で定量化 増悪するほどMD値が低下

10.

視野のアーキタイプ分析 ・高眼圧症から緑内障に至った176人 2231枚の視野 ・18種類の視野アーキタイプ (AT) P1-P18 を同定 ・ある視野パターン(P15)を有する視野では 視野進行リスク(<-1dB /year)が大きかった

11.

視野データをP1-P18のATに分解 論文では18のAT(P1-18)を特定 ATの数はhyper parameterで 任意の数字を指定可能 多いほど正確な表現ができるが 多すぎても過学習のリスク

12.

具体的な3症例 1) 2) 症例1-3の比較 症例1) MD 1.2 dB 進行せず 症例2) MD -6.8 dB 進行せず 症例3) MD -6.7 dB 急速に進行 症例3だけ進行?その特徴はなにか? 3) 症例3などの急速進行眼には P15が高頻度で出現 →これが関連因子なのか多変量解析

13.

視野進行とP15の関連 目的変数 視野進行(<-1 dB /year)の有無 説明変数 P15の有無 一般化推定方程式(GEE)で 年齢・性別・初期MDを調整 β SE Wald値 p-value 単変量 14.8 4.3 11.6 0.0006 多変量 15.3 5.9 6.8 0.009

14.

技術的な応用

15.

AAの弱点 3頂点だと表現力に難あり 5頂点なら正解ATも含むが過学習 出典:Keller SM+, NIPS 2019.

16.

潜在表現に対するAA 出典:Keller SM+, NIPS 2019.

17.

潜在表現に対するAA 出典:Dijk DV+, IEEE big data 2019.

18.

初期化の工夫 AA++法 qはconvex内のATを示し 各ATと最小距離のデータ点のみ見て MSEを計算し、その総和をロスとする. ↓ Xの一部X(i)をサンプリングして 確率PIに基づき X(i)からX(j)に更新. 更新した場合は A=XY も更新. ↓ 上記で最適なAの初期値を定めた後 通常のAAの学習でY,Zを最適化する. 出典:Mair S+, arxiv 2023.

19.

初期化の工夫 AA++法 Uniform sampling FurthestFirst FurthestSum AA++と亜型(提案手法) ↓ 提案手法の損失(MSE) が圧倒的に小さい!

20.

Wasserstein-AA データ間の関係性をWasserstein距離で定義 利点として、外れ値があってもロバストに動作した 出典:Craig K+, arxiv 2023.