【DL輪読会】Self-Adapting Language Models(SEAL)

461 Views

February 05, 26

#自己適応型言語モデル #強化学習 #継続学習 #メタ学習 #自然言語処理

スライド概要

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 92.4K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 71.6K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 61.6K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 55.2K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 52.1K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 50.2K

各ページのテキスト

Self-Adapting Language Models(SEAL) Ryohei Yasuda, IBM Systems Engineering 1

書誌情報 • Self-Adapting Language Model (2025) • 著者 – ZhengyanShi1,Adam X. Yang, Bin Wu, Laurence Aitchison, Emine Yilmaz, Aldo Lipani – Adam Zweiger, Jyothish Pari, Han Guo, Ekin Akyürek, Yoon Kim, Pulkit Agrawal • https://arxiv.org/pdf/2506.10943 2

https://arxiv.org/pdf/2405.14394

この論文を選んだ理由 • モデルの自動学習・自己適応というテーマに関心があり、継続的に性能を改善する枠組みに興味を持っていた。 • 過去に InstructLab を業務で扱った経験から、「人手に依らないモデル改善」の方向性に問題意識があった。 • 本論文では、モデル自身が「どのように学習し直すと性能が向上するか」を強化学習により最適化しながら自己適応する枠組みを提案しており、研究的にも実用的にも示唆が大きいと考えた。 3

論文概要 4

人間の学習とのアナロジー 5

研究背景と問題設定 6

関連研究1: Synthetic Data Generation Self-Instruct: Aligning Language Models with Self-Generated Instructions Yizhong Wang et al. ACL 2023（Self-Instruct） Better Synthetic Data by Retrieving and Transforming Existing Datasets Saumya Gandhi et al. Findings of ACL 2024（Better Synthetic Data） 7

関連研究2:Meta Learning Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks (MAML) Finn et al. ICML 2017（MAML） Learning Task-Specific Weight Modulation via Reinforcement Learning Sun et al. ICLR 2024（Sun et al., Hu et al.） 8