ae7ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

2.5K Views

January 29, 23

時系列データリカレントニューラルネットワーク lstm ディープラーニング人工知能金子邦彦研究室

スライド概要

トピックス：時系列データ, リカレントニューラルネットワーク, LSTM, ディープラーニング, 人工知能

ディープラーニング（スライドとプログラム例，Python を使用）（全１５回）
https://www.kkaneko.jp/ai/ae/index.html

金子邦彦研究室ホームページ
https://www.kkaneko.jp/index.html

kunihikokaneko

@6674398749

スライド一覧

金子邦彦（かねこくにひこ）福山大学・工学部・教授ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pptx - 3.16MB)

ダウンロード(pdf - 2.1MB)

関連スライド

各ページのテキスト

7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）（ディープラーニング，Python を使用）（全１５回） https://www.kkaneko.jp/cc/ae/index.html 金子邦彦 1

https://www.kkaneko.jp/cc/ae/index.html

太陽の黒点数の変化予測 1848年～1999年のデータを用いて，2000年以降を予測（ディープニューラルネットワークによる予測） 2

データサイエンス • データの正しい取り扱いと活用 • 統計，数学を基礎とする 3

機械学習 • 学習による上達の能力 • 訓練データを使用して，学習を行う 4

ニューラルネットワークの原理ニューラルネットワークのユニットは，数理により動く ① 入力は複数 ② 入力を重みづけし合計をとる ③ その合計から出力値を得る 0.3 × 0.1 -0.5 × 0.8 ⇒ 0.03 ⇒ -0.4 0.2 × -0.5 ⇒ -0.1 合計 -0.47 合計に応じた出力値 0.3846 5

ニューラルネットワーク機械学習の能力を持つ．コンピュータで動作．次を特徴とする． ① 入力は複数 ② 入力を重みづけし合計をとる ③ その合計から出力値を得る・合計に，バイアスという値を 1 2 3 4 5 6 7 8 9 入力 1 2 3 4 5 6 7 8 9 1 1 1 0 1 1 0 0 1 白黒の画像（画素は 0 または 1）足し引きしたあと，活性化関数が適用され出力値が得られる．・活性化関数はさまざまな種類重み w1 ～ w9 w1 w2 w3 w4 w5 w6 w7 w8 w9 合計シグモイドユニット 0.9 0.8 0.7 合計は， 0.6 1 × w1 + 1 × w2 + 1 × w3 + 0 × w4 + 1 × w5 + 1 × w6 + 0 × w7 + 0 × w8 + 1 × w9 0.3 ReLU （2011年発表） 0.5 0.4 0.2 0.1 0 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 6

ニューラルネットワークの仕組み • 前の層から結果を受けとって，次の層へ結果を渡す〇〇〇〇〇〇〇〇〇〇〇〇入力層〇はユニット，線は結合〇〇〇〇〇（他の結合は書〇〇いていない）〇（他の結合は書〇〇〇いていない）〇〇〇全結合のときは，〇〇〇次層の全ユニッ全結合のときは，〇〇トと結合する次層の全ユニッ〇〇トと結合する〇〇〇〇〇出力層中間層 7

アウトライン番号項目 7-1 7-2 7-3 7-4 時系列データリカレントニューラルネットワーク LSTM 演習各自，資料を読み返したり，課題に取り組んだりも行う 8

全体まとめ • 時系列データは，時間とともに，値が変化するデータ • 時系列データから，周期性やトレンドなどを読み取ることができる • リカレントニューラルネットワーク • 回帰により，過去の情報を保持 • 時系列データなどデータの並びを扱う能力を持つ予測，手書き文字認識，音声認識，言葉の理解，翻訳，テキスト生成，プログラム生成など • 長期に及ぶ過去の情報の保持のため，LSTM が考案された 9

10.

7-1. 時系列データ 10

11.

過去の量から，周期性を分析し活用 11

12.

過去の量から，トレンドを分析し活用 12

13.

時系列データ時系列データは，昨日の気温は15度今日の気温が13度のように，時間とともに，値が変化するデータ 13

14.

時系列データの例太陽の黒点数の変化 14

15.

時系列データの特性 • 周期性： • イベント：週単位，月単位，年単位正月，クリスマス，４月頭 • 長期的な傾向：増加傾向，一定，減少傾向 • 誤差や，突発的な変化・変動 15

16.

Facebook イベント数の分析例曜日で色を変えてプロット ⇒ 曜日単の周期性を読み取る Taylor SJ, Letham B. 2017. Forecasting at scale. PeerJ Preprints 5:e3190v2 https://doi.org/10.7287/peerj.preprints.3190v2 16

https://doi.org/10.7287/peerj.preprints.3190v2

17.

Facebook イベント数の分析例周期性の分析元データをProphet で処理した結果土日は少ない年末年始は少ないトレンドの分析元データをProphet で処理した結果 2015年からは増加 Taylor SJ, Letham B. 2017. Forecasting at scale. PeerJ Preprints 5:e3190v2 https://doi.org/10.7287/peerj.preprints.3190v2 17

https://doi.org/10.7287/peerj.preprints.3190v2

18.

まとめ • 時系列データは，時間とともに，値が変化するデータ • 時系列データから，周期性やトレンドなどを読み取ることができる 18

19.

7-2. リカレントニューラルネットワーク 19

20.

リカレントニューラルネットワークリカレントニューラルネットワークは回帰により過去の情報を保持するニューラルネットワーク前回の実行時での結果を，回帰次の実行に反映 20

21.

リカレントニューラルネットワーク • 回帰により，過去の情報を保持．前回の実行時での結果の一部が，次の実行に反映される • 時系列データなど，データの並びを扱う能力を持つ 21

22.

フィードフォワードとリカレントニューラルネットワーク回帰フィードフォワードネットワークリカレントニューラルネットワークある層の出力を，次の層が受け取る回帰により，前回の実行時での結果の一部が，次の実行に反映される． 22

23.

リカレントニューラルネットワークの動作イメージ① 保持使用データの並び 23

24.

リカレントニューラルネットワークの動作イメージ② 保持前回の実行時での結果も使用データの並び使用 24

25.

リカレントニューラルネットワークの動作イメージ③ 保持前回の実行時での結果も使用データの並び使用 25

26.

リカレントニューラルネットワークの応用 • 時系列データを用いた予測データの並びを扱う • 手書き文字認識筆記の動きを扱う • 音声認識音の並びを扱う • 「言葉」の理解，翻訳，テキスト生成，プログラム生成単語の並びを扱う 26

27.

リカレントニューラルネットワークのニュース数学に関する教科書を人工知能が学習．数学論文の偽物等を生成する能力を獲得人工知能が生成した数学レポート人工知能が生成した C言語プログラム Andrej Karpathy のブログ記事 The Unreasonable Effectiveness of Recurrent Neural Networks. 2015. http://karpathy.github.io/2015/05/21/rnn-effectiveness/ 27

http://karpathy.github.io/2015/05/21/rnn-effectiveness/

28.

リカレントニューラルネットワークの特質 • 単純なフィードフォワードのニューラルネットワークより，高い能力を持つ • その分，多くの訓練データを必要とする • 長期に及ぶ過去の情報の保持が困難（1991年, 1994年に理論的根拠が示された） ⇒ LSTM など，改良が生まれた 28

29.

7-3. LSTM 29

30.

LSTM の応用 • 単純なリカレントニューラルネットワークでは困難な，長期に及ぶ過去の情報を扱うディープラーニング 30

31.

LSTM 誕生の背景 • リカレントニューラルネットワークでは，長期に及ぶ過去の情報の保持が困難（1991年, 1994年に理論的根拠が示された） • 長期に及ぶ過去の情報を保持しようとすると，問題が発生（勾配消失や勾配爆発により，学習がうまくいかなくなる） Y Bengio 1, P Simard, P Frasconi, Learning long-term dependencies with gradient descent is difficult, IEEE Trans Neural Netw, 1994;5(2):157-66, doi: 10.1109/72.279181, 1994. 31

32.

LSTM の仕組み LSTM は，リカレントニューラルネットワークの一種回帰出力入力状態を受け取るユニットの動作のたびに状態が変化する状態状態は「メモリセル」に記憶されている２つの機能・記憶の持続 (constant error carousel) 1997年発表・記憶の忘却 (forget gate) 32 1999 年発表

33.

LSTM の特徴 • LSTMは，リカレントニューラルネットワークの一種 • メモリセルは，状態として，同じ値の長期の記憶の保持を可能とする • リカレントニューラルネットワークの弱点ともいわれる「長期に及ぶ過去の情報の保持が困難」であることを解決 • 1997, 1999年発表の技術．その後，手書き文字認識，音声認識，自動翻訳など数多くの応用 33

34.

35.

7-4. 演習 35

36.

Google Colaboratory の使い方概要 ① 実行コードセル Google Colaboratory ノートブックコードセルの再実行や変更には， Google アカウントでのログインが必要 36

37.

Google Colaboratory の使い方概要 ② 実行コードセルテキストセル実行コードセル • WEBブラウザでアクセス • コードセルは Python プログラム．各自の Google アカウントでログインすれば，変更，再実行可能一番上のコードセルから順々に実行 37

38.

① LSTM による予測 1. 使用するページ: https://colab.research.google.com/drive/1qxh5l0iEPU m-QRTuEBSqBLd3V9KvqItK?usp=sharing 2. 必要な事前知識 LSTM もニューラルネットワークの一種であり，学習のさせ方などは，ふつうのニューラルネットワークと同じであること 3. 各自で実行すること実際に実行し、予測を試す． 38

https://cerezo.fukuyama-u.ac.jp/ct/link_iframe_balloon?url=https://colab.research.google.com/drive/1qxh5l0iEPUm-QRTuEBSqBLd3V9KvqItK?usp=sharing

39.

太陽の黒点数の変化予測 1848年～1999年のデータを用いて，2000年以降を予測（ディープニューラルネットワークによる予測）予測では，過去の観測値から「次の日（つまり一日分）の予測」を行うことを繰り返している． 39

40.

① 10日分のデータから 11日後を予測 ② 100日分のデータから 101日後を予測 ③ 1000日分のデータから 1001日後を予測 40

41.

① 10日分のデータから 11日後を予測 ② 100日分のデータから 101日後を予測 ③ 1000日分のデータから 1001日後を予測訓練データの量が 1/10 になる訓練データの量が 1/100 になる「①より②，③が良い」と思い込まないこと（①がベスト，ということもあり得る） 41

42.

みどころ 10日分のデータから 11日後を予測これを上手く使って太陽の黒点数の変化予測 1848年～1999年のデータを用いて，2000年以降を予測 42

43.

プログラムデータ（入力）１０日分のデータ予測結果コンピュータ訓練データ１０日分のデータと，予測結果の正解（１１日後のデータ） LSTM も教師あり学習である 43

44.

① LSTM 訓練データ１０日分のデータと，予測結果の正解（１１日後のデータ）最初の１１日分を切り出して使用 1848年～1999年のデータ LSTM での学習の繰り返し 2000年以降のデータ 44

45.

② 過去の情報が LSTM 保持される訓練データ１０日分のデータと，予測結果の正解（１１日後のデータ）少しずらして，１１日分を切り出して使用 1848年～1999年のデータ LSTM での学習の繰り返し 2000年以降のデータ 45

46.

③ 過去の情報が LSTM 保持される訓練データ１０日分のデータと，予測結果の正解（１１日後のデータ）最後まで使い切って学習を終了 1848年～1999年のデータ LSTM での学習の繰り返し 2000年以降のデータ 46

47.

④ 過去の情報が予測結果が LSTM 保持される得られる予測したい部分に進んでいく（１０日分切り出し） 1848年～1999年のデータ LSTMによる予測 2000年以降のデータ 47

48.

⑤ 過去の情報が予測結果が LSTM 保持される得られる予測したい部分の最後まで続ける（１０日分切り出しを続ける） 1848年～1999年のデータ LSTMによる予測 2000年以降のデータ 48

ae7ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

kunihikokaneko

関連スライド

dn-5. 顔検出， 顔認識（Dlib, InsightFace を使用）

bt-7. Blender 3.0 の液体のアニメーション

NVIDIA ドライバ, CUDA 11.6, cuDNN 8.4 のインストール (Windows 上) (2022年4月の最新版)

ae-9. 姿勢推定

1. データベースとは，データベースシステムとは，情報とデータ

ae-2. 機械学習の基礎（教師なし学習，教師あり学習）

各ページのテキスト

dn-5. 顔検出，顔認識（Dlib, InsightFace を使用）