20221223_技術グループ発表_最適化・探索

2.6K Views

February 03, 23

#探索 #最適化

スライド概要

HEROZ勉強会、技術調査グループ最適化・探索チームの発表

HEROZ株式会社

@heroz

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

Azure AI Hub meetup #1 Azure AI ことはじめ

azure llm

HEROZ株式会社 15.6K

20221028勉強会_中井_ODMを利用したドローン動画の加工

ドローン画像チーム

HEROZ株式会社 2.4K

20221223_技術グループ発表_GPU

gpu

HEROZ株式会社 2.2K

20221125勉強会_川島_Video PreTraining (VPT) Learning to Act by Watching Unlabeled Online Videos

強化学習

HEROZ株式会社 2.2K

20221028勉強会_桧森_画像生成AIまでの道のり

画像生成画像チーム

HEROZ株式会社 1.3K

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

各ページのテキスト

技術調査報告最適化・探索 2022年12月ＨＥＲＯＺ株式会社

目次 ◼ はじめに • グループ活動の目的 • 厳密解法とメタヒューリスティクス ◼ 厳密解法 • 組合せ最適化に対する厳密解法の流れ • 厳密解法の標準的アプローチ • 強い定式化の勧め ◼ メタヒューリスティクス • 概要 • メタヒューリスティクスが適した問題の大別 • 順序性を考慮するアルゴリズム • 順序性を考慮しないアルゴリズム 2

グループ活動の目的 ◼ 目的 • 最適化手法に関する実践的な知識を習得することで、実案件へ対応力の平準化に資する ◼ 背景 • 当社は機械学習をバックグラウンドとするエンジニアが多く、実案件にて最適化手法を扱う場合には一部経験者を中心にアサインされてきた • 必ずしも数理最適化を専門としていないメンバーでも案件に対応できるよう、実践的な知識を効率的に付与する必要性 • とくに、最適化手法には厳密解を求める方針と近似解を求める方針の2つに大別され、各方針に関する理解や使い分けの判断ができることが重要（今発表のメインコンテンツ） 3

厳密解法とメタヒューリスティクス ➢ 最適化アルゴリズムは、解の最適性が理論的に保証された「厳密解法」と、最適性よりも短時間でベターな解を得ることに特化した「メタヒューリスティクス」に大別される。 ➢ メリデメを理解し適用する問題のタイプに応じた吟味が必要（ハイブリットもあり得る）探索分類厳密解法メタヒューリスティクス特徴採用のポイント 👍 Good ・真の最適解（大域最適解）が得られる・モデリングインターフェースが豊富で実装が容易 👎 Bad ・ある程度の規模の問題には有償ソルバーが必須（自前実装は無謀）・問題の規模やタイプによっては現実的な時間で解が得られない可能性（解けないものは解けない）・小規模〜中規模の問題・目的関数が線形・大域最適性や再現性が重要 👍 Good ・決定変数が膨大となる大規模問題でも、現実的な時間でベターな解が得られる・焼きなまし法、遺伝的アルゴリズムなど、多数の手法があり、選択の幅が大きい 👎 Bad ・C++等での自前実装が基本となるため実務者には敷居が高い・最適性の保証がなく、局所的最適解が出力されやすい・解の再現性を担保するのが手間・チューニングするパラメータが多い傾向にあり、その方法も体系だったものは少なく試行錯誤となりがち・大規模問題である・目的関数が本質的に非線形・大域最適性や再現性はあまり重視しない・計算速度が重要 4

組合せ最適化に対する厳密解法の流れ ➢ 決定変数が離散的（整数値、バイナリ）である最適化問題を「組合せ最適化」と呼ぶ ➢ 組合せ最適化に厳密解法を適用する流れは概ね下記のとおり ①定式化 • 目的関数と制約条件を整理して数理計画問題としての表現に変換する • 定式化の方法によってソルバーのパフォーマンスが大きく変わるため、チューニングの定石を知っておくことが重要ナップザック問題 ②モデリングインターフェース上の実装 • PuLPやORtools等の、手元の開発言語でソルバーを動作させるモジュールを利用して実装を行う ③求解と評価 • 出力された最適解を評価する。実行可能解でない、制約を満たしていないなどの不具合がある場合は実装が適切か確認する数理計画問題としての定式化 5

厳密解法の標準的アプローチ ➢ ソルバーが厳密解法で問題を解く際の詳細ロジックは企業秘密であるものの、大まかには以下の2手法を組み合わせている • 分枝限定法（branch and bound） • 切除平面法（cutting plane method） ➢ 定式化を適切に行うためには、上記手法に対する理解が必要 6

分枝限定法(1/2) ➢ 問題の「緩和」と「分割」を組み合わせることで効率的に厳密解を求める手法 • • （緩和）各子問題を連続最適化問題に緩和した問題を内点法、単体法などで解く（分割）一部の変数の範囲を制限した「部分問題」を作るもとの最適化問題部分問題への分割連続最適化問題への緩和 7

分枝限定法(2/2) ➢ 「分割」と「緩和」でなぜ解けるのか？（最大化問題の場合） • • • • • 部分問題の最適値 ≦ 元問題の最適値元問題の最適値 ≦ 緩和問題の最適値緩和問題を解いて、整数解であれば下界の更新、非整数解であれば上界の更新を行うある部分問題の上界より良い暫定解が見つかれば、その部分問題をさらに分割、探索する必要はない（限定操作）下界と上界を挟みうちで更新していくことで、現実的な時間で最適解に辿り着くはず 8

切除平面法（1/2） ➢ 分枝限定法の特性上、上界と下界の更新精度がパフォーマンスを左右する ➢ 「元問題の探索空間」と「線形緩和問題の探索空間」の差分が少ない方が有利 ➢ 線形緩和問題の探索空間を「うまくカット」して元問題の探索空間に近づけようとするのが切除平面法 ➢ 整数解を切り落とさないよう余分な探索空間をカットする（平面カット） 👍 うまいカット 👎 うまくないカットカットしすぎ。整数解を切り落としてしまっている線形緩和問題の探索空間（凸多面体） ※内部の赤丸が整数解探索空間を全然カットできていない 9

10.

切除平面法（2/2） ➢ 「うまいカット」についてもう少し数学的に考えてみる ➢ 実行可能な整数解全体の凸包のことを整数多面体（integer polyhedron）とよぶ ➢ 「うまいカット」とは整数多面体に近づくカットのこと ➢ 一般に整数多面体の陽な表現を知ることは困難なので、如何に「うまいカット」を見つけるかが厳密解法の主要な研究テーマであり、有償ソルバーのコア技術でもある主要なソルバー各ソルバーに実装された平面カットアルゴリズム線形緩和問題の探索空間と整数多面体 10

11.

厳密解法の設計は難しい ➢ 分枝限定法 + 切除平面法で組合せ最適化問題を解くアルゴリズムを自装しようとすると、下記のようなチューニングを分析者自身で行う必要がある ◼ 定式化 • 同じ最適化問題でも複数の定式化が考えられ、平面カットがうまく行きやすい「強い定式化」を意識する（後述） ◼ 分枝限定法 • 問題の分割方法（どの変数をどの値で分割するか？） • 探索方法（分割した部分問題をどの順番で解いていくか？深さ優先探索？最良探索？） • 部分問題の求解アルゴリズムをどうするか（内点法？単体法？） ◼ 切除平面法 • 平面カットのアルゴリズムをどう設計するか？ ◼ 上記すべてを自前設計するのは厳しい。定式化以外はソルバーに任せましょう 11

12.

「強い定式化」の勧め ➢ 探索空間がなるべく広がらないようにすること、平面カットがしやすい形状にすることが大事 ➢ 上記が考慮された定式化を「強い定式化」と呼ぶ ➢ ちょっとした工夫でソルバーのパフォーマンスが顕著に変わるので、以下に示す程度の内容は押さえておきましょう（後日、GROWIにまとめる予定） 1. 整数変数はバイナリ変数（0 or 1）に変換する 2. 大きすぎる定数（いわゆるBiG-M法）の使用は可能な限り避ける 3. 最大値の最小化（最小値の最大化）のような問題に注意 4. 解の対称性を除く工夫をする 12

13.

強い定式化の例（グラフ彩色問題） ➢ 学校のクラス分け。仲の悪いメンバー同士は同じクラスに入らないようにしつつ、なるべく少ないクラス数にしたい A組 B組 C組実線で結ばれたペアは仲が悪い不仲なメンバーが同じクラスに入らないよう3組に分割 13

14.

強い定式化の例（グラフ彩色問題） ➢ 各クラスの「番号」がどれかは本質的でない ➢ 解が無駄な対称性を持っている → ソルバーの求界性能に悪影響 A組とC組のメンバーが入れ替わっても解としては同じ A組 A組 B組 B組 C組 C組 14

15.

強い定式化の例（グラフ彩色問題） ➢ 各クラスにメンバーがいるか否かを表す変数約」を加える ➢ 一般性を失うことなく解空間を狭くできるに対して「対称性を除去する制 → 強い定式化クラス数の最小化問題弱い定式化はk番目の組にメンバーがいるか否かを表す0-1変数強い定式化解の対称性を除去する制約を追加メンバーがいるクラスの番号が必ず先になるよう制御 15

16.

メタヒューリスティクス概要メタヒューリスティクスの主な流れは、・解の評価・解の遷移（探索）の繰り返しである。解2に遷移解1を評価解3に遷移解2を評価解Nに遷移解3を評価集中化、多様化といった相反する戦略のバランスをとることで、より高性能なアルゴリズムを実現する。集中化多様化良い解同士が似た構造を持つ前提（※近接最適性）で、似た解を探索する局所最適解に陥ることを防ぐため、似ていない解を探索する 16

17.

メタヒューリスティクスが適した問題の大別メタヒューリスティクスが適した問題には、大きく分けて2通りの問題がある。順序性のある問題例：ぷよぷよどの順でぷよを置いたかで連鎖に大きな違いが出る順序性のない問題例：カードゲームのデッキ構築デッキ全体で評価すればよいため、順序という概念がない ※順序性のある問題のことを「近似最適性がなくメタヒューリスティクスが適さない」と評するサイトも見かけた。おそらくアプローチを片方しか知らない記述 17

18.

順序性を考慮するアルゴリズム：ビームサーチ 1/4 順序性のある問題では、ある状態から「可能な操作をする→操作に応じて状態を遷移→途中状態を仮評価」を繰り返し、最終状態の評価を最大化することを目的として探索を行う。ビームサーチでは各操作に応じた状態をまず全て評価する。ぷよぷよで言うと、「一つ目のぷよを左端に置く」「一つ目のぷよを中央に置く」「一つ目のぷよを右端に置く」などが対応数字は操作後の暫定評価値。ぷよぷよでは「盤面上のぷよが消えた場合の期待連鎖数」など 5 1 3 18

19.

順序性を考慮するアルゴリズム：ビームサーチ 2/4 次に、評価順に指定した数（幅）のノードを選択し、可能な操作を全て行う下記は幅2の例ぷよぷよで言うと、「一つ目のぷよを左端に置く」「一つ目のぷよを中央に置く」「一つ目のぷよを右端に置く」などが対応評価5,1,3の中の上位2つは 5,3 5 6 11 1 7 ぷよぷよで言うと、「二つ目のぷよを左端に置く」「二つ目のぷよを中央に置く」「二つ目のぷよを右端に置く」などが対応 3 5 10 3 19

20.

順序性を考慮するアルゴリズム：ビームサーチ 3/4 その後も、同様の処理を繰り返すぷよぷよで言うと、「一つ目のぷよを左端に置く」「一つ目のぷよを中央に置く」「一つ目のぷよを右端に置く」などが対応 5 1 ぷよぷよで言うと、「二つ目のぷよを左端に置く」「二つ目のぷよを中央に置く」「二つ目のぷよを右端に置く」などが対応 3 6 11 7 5 10 3 15 12 20 13 11 14 ぷよぷよで言うと、「三つ目のぷよを左端に置く」「三つ目のぷよを中央に置く」「三つ目のぷよを右端に置く」などが対応 20

21.

順序性を考慮するアルゴリズム：ビームサーチ 4/4 評価が最大の最終状態を選択し、その状態に到達できる操作を選択して終了 5 1 3 6 11 7 5 10 3 15 12 20 13 11 14 21

22.

順序性を考慮しないアルゴリズム：山登り法 1/5 順序性のない問題では、ある状態から「状態を評価→状態を遷移」を繰り返し、状態の評価を最大化することを目的として探索を行う。山登り法（局所探索法）ではまず初期状態評価する。下記例はカードゲームのデッキの評価方法が定まっていることを前提にデッキを構築する例。評価値 0.3 デッキの内容を入力して評価値を計算 22

23.

順序性を考慮しないアルゴリズム：山登り法 2/5 次に、現在の解を少しだけ変更し、再評価する。この少しだけ解を変えた状態を近傍と呼ぶ。今回はデッキからランダムに1枚のカードをランダムな別のカードに変更することを近傍とする。評価値 0.3 0.25 評価値を再計算評価値が下がってしまったドラゴンのカードを鬼のカードに変更 23

24.

順序性を考慮しないアルゴリズム：山登り法 3/5 近傍に遷移して評価が上がらなかった場合は、別の近傍への遷移を行う。評価値 0.3 0.35 評価値を再計算評価値が上がったジェレヌクのカードをライオンのカードに変更 24

25.

順序性を考慮しないアルゴリズム：山登り法 4/5 近傍に遷移して評価が上がった場合は、遷移した状態からまた次の遷移を行う評価値 0.35 0.4 ドラゴンのカードをバーサーカーのカードに変更前回の遷移を保ったまま 25

26.

順序性を考慮しないアルゴリズム：山登り法 5/5 評価値が上がらなくなるまで処理を繰り返し、評価最大の解を得る。評価値の遷移は下記のように、必ず上がる。評価値 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 評価値 4 5 6 26

27.

順序性を考慮しないアルゴリズム：焼きなまし法 1/3 例えば、カードゲームでスライムのカードが3枚以上デッキに含まれるとかなり強いデッキとなるが、スライムのカードが2枚以下だとあまり意味がない、というようなことがある。この場合、カード1枚変更の近傍で山登り法を適用すると、スライム3枚のデッキに到達できない。評価値 0.4 評価が下がるので遷移不可 0.3 スライム2枚の状態に遷移されないせいで、この状態には遷移できない 0.99 27

28.

順序性を考慮しないアルゴリズム：焼きなまし法 2/3 そこで、スコアが下がった場合も変化量に応じて遷移を許すことにする。あるデッキnowのスコアをScore(now)、nowをnextに変化させる時、 𝑆𝑐𝑜𝑟𝑒 𝑛𝑒𝑥𝑡 ≥ 𝑆𝑐𝑜𝑟𝑒(𝑛𝑜𝑤)の時は山登り同様に遷移、 𝑆𝑐𝑜𝑟𝑒(𝑛𝑥𝑒𝑡) < 𝑆𝑐𝑜𝑟𝑒(𝑛𝑜𝑤)の時は変化量Δ = Score next − Score(now)に対し、 Δ Δ 確率 𝑒 𝑡 で遷移することにする。(最小化問題なら 𝑒− 𝑡 ) tは時間と共に徐々に低くすることで、ランダムに近い遷移から徐々に山登りに近づけていく 𝑃(𝑛𝑜𝑤 → 𝑛𝑒𝑥𝑡) 1 𝑃(𝑛𝑜𝑤 → 𝑛𝑒𝑥𝑡) 1 Δ 𝑒𝑡 Δ 𝑒𝑡 0 0 -1 0 tが高い時の遷移確率 1 -1 0 tが高い時の遷移確率 1Δ 28

29.

順序性を考慮しないアルゴリズム：焼きなまし法 3/3 評価値は下がることもあるが、局所解を脱出できる可能性があり、充分に時間があれば山登り法以上の結果が期待できる評価値 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 評価値 4 5 6 29