[DL輪読会]Colorful Image Colorization

532 Views

June 23, 17

#deep learning #AI #Image Colorization #Deep CNN #Image Processing #Machine Learning

スライド概要

2017/6/23
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 89.5K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 64.5K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 60.7K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 45.4K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 45.4K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 43.6K

各ページのテキスト

Colorful Image Colorization Richard Zhang, Phillip Isola, Alexei A. Efros University of California, Berkeley https://arxiv.org/pdf/1603.08511.pdf 2017年6月23日論文輪講村上遥

https://arxiv.org/pdf/1603.08511.pdf

提案手法＊論文外の画像です Ground Truth http://アスカラ.com/?p=221 「それっぽい着色」にこだわる × 色の再現デモ→ http://demos.algorithmia.com/colorize-photos/

http://demos.algorithmia.com/colorize-photos/

問題人の干渉が大きい褪せた色になりがち −予測と実際のユークリッド誤差を縮める←回帰問題の考え方解決手法 Deep CNNと目的関数の調整で実現１）取り得る色の確率分布をピクセル単位で予測２）色の多様化を図るため、クラス分類問題と捉え訓練時に希少色に重みを置いてクラス再調整を行う

失われた色情報を現実世界のシーンが意味するものや、表面のテクスチャーを手掛かりにして類推する空は青、草は緑、てんとう虫は赤など決まった色があるりんごは赤か緑か黄色だが、青はないクリケットボールは何色でもあり得るとにかくデータを突っ込む、データセットは画像をグレースケールにすれば作れるので楽

１）画像への着色性能の向上複数の色を持つ可能性があるという点を扱い、幅広い色彩を取り得る目的関数を設計着色の「本物っぽさ度」を測定する手法の提案従来よりかなり多い100万の画像の訓練で高い水準を記録２）着色タスクを半教師あり表現学習に通用する方法として導入し、複数の指標でstate-of-the-artを記録したこと

先行・競合研究と比べ、後からの調整なしにそれっぽい着色ができていることそれっぽい着色を評価する手法を提案したこと（着色・チューリングテスト）

プーリング層なし解像度の調整はダウン/アップサンプリング入力（明度）最終的な予測 *H, Wは画像の次元

ユークリッド損失ロバスト性がなく、やや一意的→平均取って灰色に

10.

多項クラス分類を行う ab の出力空間をグリッドサイズ：10、 Q = 313の箱に分ける *Q：abチャネルの量子化数取り得る色の確率分布実際の色のZベクターへの変換多項クロスエントロピー誤差最後に、確率分布→出力へ *v:重み付け

11.

abチャネルの分布は低いレベルに偏る多く写っている雲、泥、道路、壁などのせい色を鮮やかにするために、色の希少性を元に重み付けをし直す最も近いabの箱空間に割り当てられる因子wで各ピクセルに重み付けを得るために経験色確率pをImageNetによる訓練とガウシアンカーネルによる分布で求めるさらに重みλで均一分布と融合する

12.

方法１）予測分布の最頻値を当てはめる鮮やかになるが、バグが出る（染みなど）方法２）予測分布の平均値を当てはめる不自然さは減るが、色彩が褪せる →２つの方法を混ぜる、混ぜ具合の指標を温度Tとして

13.

0.38がベストだった

14.

1300万枚のImageNetの画像を訓練データに（うち始めの1万枚はImageNetの調整に用いた）別の1万枚をテストデータに CNNへの学習には複数の損失を使い、比較

15.

質的な検証：再調整が有効よくある失敗例：・赤と青が変に混ざる・複雑な室内の情景だとセピアになりがち

16.

Ours(full)：classification loss + rebalancing Ours(class)：classification loss Ours(L2)：L2 regression loss Ours(L2, ft)：L2 regression loss + rebalancing

17.

被験者に1)実画像、2)各アルゴリズムで着色した画像(256×256)のペアを1 秒見せ、どちらが偽物か時間制限なしで判断はじめに10回練習して正解をフィードバック、その後40回施行する。この間試すアルゴリズムは1種類で、被験者はこのセットを１回しかやらない。被験者は４０人で、どの画像も１０人以上に評価されているまともな判断力があるかを判定するため、ランダムでランダム着色した画像を混ぜ、認識できているか調査どちらも実画像にした場合の期待値が50%なので、最高値は50%

18.

19.

結果人 Hypercolumns on VGG Un-rebalanced ・32%強と圧倒的に人を騙せている・既製のVGGネットワークに当てはめても、クラス分類に役に立っている

20.

今までのデータセットはどれも近年の画質のいい画像の色情報を無くしただけのもの本当の白黒写真じゃ出来ないんじゃないの？出来ました

21.

結論：セピアになる傾向、アニメに弱い、茶色が多い画像にも弱い、青が出づらい