[DL輪読会]Beyond Shared Hierarchies: Deep Multitask Learning through Soft Layer Ordering

>100 Views

March 09, 18

deep learning

スライド概要

2018/3/2
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト

DEEP LEARNING JP [DL Papers] “BEYOND SHARED HIERARCHIES: DEEP MULTITASK LEARNING THROUGH SOFT LAYER ORDERING (ICLR2018)” Naoki Nonaka, Matsuo Lab http://deeplearning.jp/ 2018/3/1 1

http://deeplearning.jp/

書誌情報著者：Elliot Meyerson & Risto Miikkulainen (The University of Texas at Austin and Sentient Technologies, Inc.) 学会：ICLR 2018 Accepted paper (Poster) (7, 7, 6) 2018/3/2 2

背景マルチタスク学習関連する複数のタスクを同時に学習させることで，これらのタスクに共通の要因を獲得させ，タスクの予測精度を向上させる（朱鷺の杜Wikiより）深層学習によるマルチタスク学習（Deep MTL） Single task Multi task Improving Machined Surface Variation Prediction by Integrating Multi-Task Gaussian Process Learning with Cutting Force Induced Surface Variation Modelingより 2018/3/2 3

背景（これまでの）Deep MTL ⇒ 少数のタスク and/or 類似するタスクでしか解かれていない（これまでの）Deep MTLの前提 • 学習された変換はタスク間で共有可能【+ 暗黙的な前提】 • タスク間での共有は，モデル構造により決まる特徴量の階層において，平⾏する層間でのみ⾏われる層の順序が変わることを許可すれば，より柔軟なモデルが可能 2018/3/2 Task1 Task2 L4 L3 L4 L2 L3 L1 L2 層の順序が不変 4

本研究で検証すること Deep MTLにおいて， üタスク間で層の順番が同⼀である必要性を検証 üタスクごとに共有される層の順番を変更することにより，精度が向上するかを検証 2018/3/1 5

先⾏研究これまでのDeep MTL a. 関連するタスクを解く出⼒層を追加する⼿法 b. タスクごとに層を重ね，並⾏する層の間を結合する⼿法 c. ネットワークの中間層に出⼒層を追加する⼿法 d. 全てのタスクで核となるパラメータを共有し，少数のタスク特異的なパラメータを置く⼿法 2018/3/2 6

検証 üタスク間で層の順番が同⼀である必要性を検証 ”Parallel ordering” Task1 Task2 L4 Task1 Task2 L4 L3 L4 L3 L2 L2 L3 L2 L4 L1 L2 L1 L3 層の順序が不変 2018/3/2 ”Permutated ordering” 層の順序を変更 7

検証タスク間で層の順番を固定しない”Permutated ordering”でも同程度の精度 2018/3/2 8

提案⼿法 üタスクごとに共有される層の順番を変更することにより，精度が向上するかを検証ここまでのモデル “Parallel ordering” ⇒ タスク間で層の順番を固定 “Permutated ordering” ⇒ 学習時に層の順番をあらかじめ固定層の順番をタスクごとに学習する⼿法（”Soft ordering”） 2018/3/1 9

10.

提案⼿法 2018/3/2 10

11.

実験 1.提案⼿法によるDeep MTLの分類精度 1.関連あるタスク 2.（表⾯的に）関係のないタスク 3.CNNへの拡張 4.⼤規模データへの適⽤ 2.“Soft ordering”を⾏なった層の可視化 2018/3/1 11

12.

実験 Single task Task1 Task2 Task1 “Soft ordering” Task2 L4 L4 L3 L4 L3 L4 L2 L3 L2 L3 L1 L2 L1 L2 独⽴で学習 2018/3/2 ”Parallel ordering” 層の順序が不変 12

13.

実験 2018/3/2 13

14.

実験表⾯的には関係のなさそうなUCIのデータセットを同時に学習 Iterationが増えると提案⼿法のErrorが減少 2018/3/2 14

15.

実験 CNNへの拡張 Omniglot（50種類の⽂字群のそれぞれを個別のタスクとしてマルチタスク学習）提案⼿法により精度が向上 2018/3/2 15

16.

実験⼤規模データへの適⽤ CelebA（40種類の属性値がそれぞれ付与されるかを個別タスクとしてMTL）提案⼿法により精度が向上 2018/3/2 16

17.

実験 2018/3/2 17

18.

今後の課題と結論今後の課題 • Recurrent構造との関連の分析 • 共有している層の⼀般化 • ⼀般化できる層の学習結論 • これまでのDeep MTLでは，層の順番が固定されていたが，その制約を軽減する”Soft ordering”を提案 • 複数のタスクにおいて，提案⼿法が既存⼿法を上回った 2018/3/2 18

[DL輪読会]Beyond Shared Hierarchies: Deep Multitask Learning through Soft Layer Ordering

Deep Learning JP

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

【DL輪読会】Generative Agents: Interactive Simulacra of Human Behavior

【DL輪読会】4D Gaussian Splatting for Real-Time Dynamic Scene Rendering

【DL輪読会】LLMベースの自律型エージェントシステムのサーベイ

【DL輪読会】LightGlue: Local Feature Matching at Light Speed

各ページのテキスト