【DL輪読会】HyperTree Proof Search for Neural Theorem Proving

574 Views

February 24, 23

#deep learning #Deep Learning #Neural Theorem Proving #HyperTree Proof Search #Monte Carlo Tree Search #Online Learning

スライド概要

2023/2/24
Deep Learning JP
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 92.7K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 71.9K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 61.6K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 55.4K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 52.3K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 50.5K

各ページのテキスト

DEEP LEARNING JP [DL Papers] HyperTree Proof Search for Neural Theorem Proving 塚本慧 http://deeplearning.jp/ 1

http://deeplearning.jp/

書誌情報タイト HyperTree Proof Search for Neural Theorem Proving ル： https://arxiv.org/pdf/2205.11491.pdf 著者： Guillaume Lample, Marie-Anne Lachaux, Thibaur Lavril, Xavier Martinet, Amaury Hayat, Gabriel Ebner, Aurelien Rodrigue 概要： • トランスフォーマーに基づいた自動定理証明のためのオンライン学習のモデルの提案。 • モンテカルロ木探索を導入。 • miniF2Fの問題の正答率を大幅に改善 Copyright (C) Present Square Co., Ltd. All Rights Reserved. 2

https://arxiv.org/pdf/2205.11491.pdf

１. イントロダクションイントロダクション • これまで数学の証明の検証は人間の手で行われてきたが、数学の証明の複雑さが増している現在においては不十分になってきている。数学を形式化することによってコンピュータに検証させようとする動きがある。数学の形式化 • 形式的な数学はプログラミング言語で書かれたソースコードに近く、伝統的な数学とはかけ離れているため、使うのが難しい。 • 既に証明されている定理を形式化するのにも膨大な労力がいる。素数が無限個あることの証明 Copyright (C) Present Square Co., Ltd. All Rights Reserved. 4

１. イントロダクションイントロダクション • 本研究では与えられた定理を人間の支援抜きでタクティックの列を生成して証明する。 • この研究により既に証明されている数学の形式化にかかる労力を大幅に削減できる。 • 証明をハイパーツリーとみなすことでモンテカルロ木探索を導入する。（後述） Copyright (C) Present Square Co., Ltd. All Rights Reserved. 5

２. 前提知識・関連研究証明プログラミング言語 • まだ検証されていない命題をゴールとし、タクティックによってゴールと仮定を変形したり分割する。 • ゴールに何も表示されない時に証明されたということになる編集仮定とゴールの表示解きたい命題タクティック（使っていい補題） lean and_commutative Copyright (C) Present Square Co., Ltd. All Rights Reserved. 6

https://leanprover-community.github.io/lean-web-editor/

２. 前提知識・関連研究自動定理証明は人工知能における長年の難問として知られている。近年の大規模言語モデルや、モデルによる探索手法の成功に伴い自動定理証明への関心が再び高まっている。ニューラル定理証明 • 深層学習の手法を定理証明に適用されている言語モデルの推論能力 • 大規模トランスフォーマーの推論能力に注目が集まっているモンテカルロ木探索と二人用ゲーム • AlphaZeroのような二人用ゲームでの探索と同様に、定理証明は既に証明されている定理や補題、テクニックを用いて探索しているとみなせる Copyright (C) Present Square Co., Ltd. All Rights Reserved. 8

10.

11.

４. HyperTree Proof Search HyperTree Proof Search 選択 • 次に取るべきタクティックを探索と知識利用のバランスを取りながら選択する展開 • 葉ノードを訪れた回数が閾値以上となった場合に、そのノードから先を展開する更新 • 得られた報酬を記録し、期待報酬を更新する Copyright (C) Present Square Co., Ltd. All Rights Reserved. 11

12.

４. HyperTree Proof Search 選択選択 • タクティックごとに計算を行う • 報酬の総和をWとする（ここでの報酬は証明可能性を表している（解ける = 1, 解けない = 0）） • 訪問回数をNとする • 評価値をQ=W/Nとする探索のアルゴリズムはPUCTとRegularized Policyの両方を試す Copyright (C) Present Square Co., Ltd. All Rights Reserved. 12

13.

14.

15.

16.

５. 証明探索でのオンライン学習オンライン学習非同期で分散学習を行う • タクティックのサンプルゴールとタクティックのペアを抽出して訓練データとして使う • クリティックのサンプル探索が終わった後のすべてのノードの評価値を訓練データとして使う探索の途中で正しいことが証明されたノードの評価値は１探索の途中で間違いであることが証明されたノードの評価値は０ Copyright (C) Present Square Co., Ltd. All Rights Reserved. 16

17.

５. 証明探索でのオンライン学習訓練の全容 • 事前学習 (数学に関する文章を大量に学習) • ファインチューニング（学習の環境に合わせた証明プログラミング言語（Metamath, Lean, Equations）の学習） • オンライン学習（HyperTree Proof Search） Copyright (C) Present Square Co., Ltd. All Rights Reserved. 17

18.

６. 実験モデルのファインチューニングとラベル付きのデータセット • MetaMath set.mmライブラリから37091個の証明を抽出 • Lean Mathlibライブラリから24kの証明と、144kのゴールとタクティックのペアを抽出 • Equations • 本研究のために自作で作った環境なのでライブラリがないためランダムにタクティックを実行し定理を生成したモデルの事前学習 • 数学に関するarxivの論文のLatexのソースコード（60億トークン）をマスク付きのSeq2Seqのモデルで学習 Copyright (C) Present Square Co., Ltd. All Rights Reserved. 18

19.

６. 実験モデルのアーキテクチャと訓練 • 12層のエンコーダと6層のデコーダを持つトランスフォーマーのアーキテクチャを使用 • エンコーダの埋め込み次元は1600, デコーダは1024(Equationsのときのみデコーダは512) • Equationsのときのパラメータ数は440M, MetaMathとLeanは600M ファインチューニング • 最適化アルゴリズムはAdam • 逆平方根学習率スケジューリングを用いる • ドロップアウト率は0.2 • レイヤードロップアウト率は0.1 オンライン学習 • Warmupのあとは学習率を3×10-5 • 48 V100 GPUで16つの訓練機と32つの証明機を用いた • Pytorchを用い学習を高速化するためにfloat16を使用 Copyright (C) Present Square Co., Ltd. All Rights Reserved. 19

20.

21.

７. 結果 Lean 1日の訓練でminiF2F-curriculumの327の問題を110問解く(GPT-fは100問) 7日の訓練で137問解くオンライン学習中の正答率は58.6% テスト用のデータセットでは41%(GPT-fは36.6%) MetaMath オンライン学習により正答率を61%から82.6%に向上 Equations Copyright (C) Present Square Co., Ltd. All Rights Reserved. 21

22.

7. 結論まとめ • AlphaZeroから生まれた自動定理証明のための証明探索アルゴリズムを紹介した • 複数の証明の環境で最高の結果を出した • 数学の形式化のデータが限られているため、探索で新しいデータを増やす方法が必要になる • 新しい定理を生成できるかも将来の課題になりそう Copyright (C) Present Square Co., Ltd. All Rights Reserved. 22

23.

Appendix 参考文献 Leanのチュートリアル https://leanprover.github.io/theorem_proving_in_lean/ Leanの素数に関するライブラリ https://github.com/leanprover-community/mathlib/blob/master/src/data/nat/prime.lean#L418 Copyright (C) Present Square Co., Ltd. All Rights Reserved. 23