takumi-ni mthesis

398 Views

March 27, 23

スライド概要

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

バス到着時刻予測のための ⾛⾏時間・停⾞時間の⽇周期性を考慮した ⽋損値補完⼿法の提案 Proposal of Missing Data Imputation Focusing on Daily Periodicity of Bus Running Time and Stopping Time for Bus Arrival Time Prediction 丹⽻ 拓実 情報基盤システム学研究室

2.

バス到着時刻予測の背景 2 • 路線バスのサービス品質向上において バス到着時刻予測が重要 • 利⽤者: 待ち時間の少ないルートを選択可 • バス運⾏会社: スケジュール管理・運⾏効率の評価 • 近年は深層学習モデルのRNNやLSTMを使う 研究が注⽬[1] • バス運⾏データ(⾛⾏時間や停⾞時間)を元に予測 [1] N. Singh, and K. Kumar, “A review of bus arrival time prediction using ar- tificial intelligence,” WIREs Data Mining and Knowledge Discovery, vol. 12, no. 4, p. e1457. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

3.

既存のバス到着時刻予測⼿法[2] 走行時間用モデル 走行時間 降水量 晴れフラグ 曇りフラグ 雨フラグ デコーダ 結合 エンコーダ 気温 気象データ 予測走行時間 結合 時刻表差分 バス運行データ デコーダ 結合 エンコーダ スケーリング BiConvLSTM 欠損値補完 停車時間 3 BiConvLSTM 停車時間用モデル 予測到着時刻 予測停車時間 • バス運⾏データ+ 気象データを使⽤ • 直近8運⾏分を⼊⼒ 次以降3運⾏分を予測 • ⾛⾏時間と停⾞時間を 別のモデルで予測 [2] ⽯⻑ 篤⼈,新井 イスマイル,垣内 正年,藤川 和利,“運⾏情報と気象情報 の畳み込みによるバス到着時刻予測⼿法”,研究報告⾼度交通システムとス マートコミュニティ(ITS),vol. 2021-ITS-84,no. 6,pp. 1–8,2021. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

4.

バス到着時刻予測における⽋損 4 • バス運⾏データは時系列データ 仮にバス運⾏データが10%の 確率で⽋損する場合 → 予測できる確率が約43% • 学習や予測のためには⽋損せず 連続したデータが必要 • 特に予測モデルの⼊⼒が⽋損すると 予測できない • ⽯⻑らの⼿法[2]では予測時の⼊⼒に 直近8運⾏分のバス運⾏データが必要 • ⽋損値補完をすれば⼊⼒可能 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

5.

5 9863運⾏(390⽇分) ⽩: 正常なバス運⾏データ ⿊: ⽋損 • 743 / 9863運⾏(7.53%)が⽋損 → 予測できる割合は67.2% • 実データからシミュレート • データ⽣成の都合上⽋損をなくすことは難しい • 原因: ⾞載器トラブル / 通信エラー / GPSの精度不⾜ etc… • 今までの研究[2,3]では単純な⼿法を使⽤して⽋損値補完を実施 • Last observation carried forward (LOCF): ⽋損部分の直前の値をコピーする⽋損値補完⼿法 [3] N. C. Petersen, F. Rodrigues, and F. C. Pereira, “Multi-output bus travel time prediction with convolutional LSTM neural network,” Expert Systems with Applications, vol. 120, pp. 426–435, 2019. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 2022-09-25 2021-09-01 実際のバス運⾏データセットの⽋損

6.

⽋損値補完の関連研究 6 • バス到着時刻予測と近い交通状況予測の分野では, データの特徴を考慮した⽋損値補完⼿法で予測誤差が減少した[4] 空間的補完 時間的補完 パターン補完 近隣の道路の状態から補完 ⽋損前n個分の平均値で補完 曜⽇ごとのパターンデータを 予め⽣成しておき,⽋損値の 部分に当てはめる形で補完 上記3つを組み合わせて適⽤ 空間的補完→時間的補完→パターン補完の順に適⽤ [4] D.-H. Shin, K. Chung, and R. C. Park, “Prediction of traffic congestion based on LSTM through correction of missing temporal and spatial data,” IEEE Access, vol. 8, pp. 150 784–150 796, 2020. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

7.

研究の⽬的 7 バス運⾏データの特徴に着⽬した⽋損値補完をして バス到着時刻予測の誤差削減を⽬指す 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

8.

本研究で使⽤するバス運⾏データセット ⾛⾏時間 8 停⾞時間 時刻表差分 index ⽇付 便番号𝑡 1 2022-06-01 1 93.5 ⋯ 1355.5 28.0 ⋯ 2 2022-06-01 2 125.0 ⋯ 456.0 60.0 ⋮ ⋮ ⋮ ⋮ 26 2022-06-01 26 105.5 ⋯ 479.5 118.0 ⋯ 404.5 -119.7 ⋯ -284.7 27 2022-06-02 1 129.0 ⋯ NA 121.0 ⋯ NA -120.5 ⋯ NA ⋮ ⋮ ⋮ ⋯ ⋮ ⋯ ⋮ ⋯ ⋮ 𝑟! ⋯ ⋮ ⋮ • 1つでも値が⽋けると⽋損 • ⽋損値補完は列ごとに実施 ⋯ 𝑟" 𝑠! ⋮ ⋯ ⋮ 𝑠# 𝑑! ⋯ 𝑑# 36.0 -18.5 ⋯ 692.9 ⋯ 16.0 -58.9 ⋯ 109.6 ⋯ ⋮ ⋮ ⋮ ⋯ • 1⾏が1運⾏に対応 • 便番号𝑡は1⽇のうち何運⾏⽬かを⽰す数値 • ⾛⾏時間・停⾞時間・時刻表差分は ⾛⾏区間/バス停ごとに記録 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 ⋮

9.

提案⼿法 9 • 交通渋滞予測の⼿法[4]を参考に,3つの⽋損値補完⽅法を提案 • 空間的補完はバス運⾏データの性質上適⽤できないため⾏わない • バス到着時刻予測⼿法は⽯⻑らの⼿法[2]を想定 時間的補完 ⽋損部分の直前𝑁mean 運⾏分の 平均値を使⽤ パターン補完 組み合わせ⼿法 あらかじめ便番号ごとに パターンデータを作成 ⽋損が連続する部分では パターン補完 ⽋損部分と同じ便番号の パターンデータを当てはめる ⽋損が連続しない部分では 時間的補完 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

10.

提案⼿法: 時間的補完 10 𝑁mean = 3の場合 便番号 1 走行時間!! 222.5 2 250.0 3 125.0 4 5 便番号 平均: 199.2 1 走行時間!! • ⽋損直前の𝑁mean 運⾏分の平均値を 使⽤ 222.5 2 250.0 3 125.0 NA 4 199.2 209.5 5 209.5 直近の運⾏の乱れを反映すること を期待 ⽇周期性を考慮していない 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

11.

提案⼿法: パターン補完 11 日付 便番号 2022-06-02 2 114.0 ︙ ︙ ︙ 2022-06-03 1 93.5 2022-06-03 2 125.0 1 NA ︙ ︙ ︙ 2 103.5 2022-06-04 1 82.5 2022-06-04 2 85.0 ︙ ︙ ︙ ︙ ︙ 2022-06-02 1 走行時間!! 102.5 便番号 便番号 1 走行時間!! 92.8 2 108.0 ︙ ︙ • ⽋損部分の便番号に対応する パターンデータを当てはめる 補完 便番号 パターンデータ 走行時間𝒓𝟐 • あらかじめ便番号ごとの平均値を 使⽤してパターンデータを作成 走行時間𝒓𝟐 1 92.8 2 103.5 ︙ ︙ ⽇周期性に従った補完を期待 直近の運⾏の乱れは反映できない 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

12.

提案⼿法: 組み合わせ⼿法 𝑁mean = 3の場合 便番号 1 走行時間!! 222.5 2 250.0 3 125.0 4 NA 5 209.5 6 NA ︙ ︙ 平均: 199.2 時間的補完を使用 パターン補完を使用 (直近3運行に欠損が含まれるため) パターンデータ 便番号 ︙ 走行時間!! ︙ 5 185.6 6 212.4 7 200.8 ︙ ︙ 便番号 1 走行時間!! 222.5 2 250.0 3 125.0 4 119.2 5 209.5 6 212.4 ︙ ︙ 12 • ⽋損が連続する部分では パターン補完 • ⽋損が連続しない部分では 時間的補完 データが揃っている場所では 直近の運⾏の乱れを反映 データがまとめて⽋損している部 分には⽇周期性を反映 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

13.

バス運⾏データセットの分析結果 13 • 1⽇ごとの周期性 (⽇周期性) がある • 対象路線は1⽇26運⾏ • 他の⾛⾏時間,停⾞時間 も同様の周期性あり ある区間の⾛⾏時間の⾃⼰相関 ⽇周期性に着⽬した ⽋損値補完が効果的? ※ ラグ=元のデータを何運⾏分シフトしたか 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

14.

評価⽅法 14 ⽋損値補完⼿法をバス運⾏データに適⽤した場合に バス到着時刻予測の誤差がどう変化するか → 各⽋損値補完⼿法がバス到着時刻予測に適しているか評価 • ⽋損率を変化させたバス運⾏データセットに各⽋損値補完⼿法を適⽤し, ⽯⻑らの⼿法[2]を⽤いてバス到着時刻を予測する実験を実施 • 実験1: 訓練データの⽋損率を変更する実験 • 実験2: テストデータの⽋損率を変更する実験 • 各実験結果の評価では,1運⾏先,2運⾏先,3運⾏先の到着時刻を予測した際の 平均絶対誤差(Mean absolute error: MAE)を⽋損値補完⼿法ごとに⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

15.

本研究で対象とする路線 15 • 運⾏予定時間:35分 6: 新神⼾駅 • 運⾏数: 26運⾏/⽇ • 6:00〜22:00 • 1時間に1,2本 4: 神⼾ベイシェラトンホテル 3: 六甲アイランド病院前 2: ウエストコート7番街前 5: 神⼾三宮 1: 神⼾国際⼤学前 みなと観光バス 21系統上り路線 • 運⾏数: 9863運⾏ • 収集期間: 2021-09-01〜2022-09-25 • ⽚道のみ対象 • ⼤学 → 駅 © OpenStreetMap, https://openstreetmap.org/copyright 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

16.

データセットの分割 16 種類 開始⽇ 終了⽇ 運⾏数 ⽋損運⾏数 訓練データ 2021-09-01 2022-09-03 9291 720 7.75 検証データ 2022-09-04 2022-09-10 182 11 6.04 テストデータ 2022-09-11 2022-09-25 390 12 3.08 • データリーケージを防ぐため,期間を元に分割 • データリーケージ: 本来得られない未来のデータを学習時に使⽤してしまうこと 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 ⽋損率(%)

17.

⽐較対象の⼿法 17 ベースライン+単純な⽋損値補完2種 提案⼿法3種 u ベースライン: Historical Average (HA) u 時間的補完 • 過去の運⾏の平均値をそのまま予測値とする • ⽯⻑の⼿法を使⽤しない u Last observation carried forward (LOCF) • ⽋損部分の直前の値をコピー u 線形補間 • ⽋損の前後2つの値を⽤いた単回帰分析で得られる値で置換 • データの末尾が⽋損すると使えない = 予測の⼊⼒に使えない • 実験2(テストデータの⽋損率変更)の対象外 • ⾃⼰相関の分析結果より 𝑁mean = 5に設定 u パターン補完 • パターンデータは 訓練データから作成 u 組み合わせ⼿法 • ⾃⼰相関の分析結果より 𝑁mean = 5に設定 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

18.

実験1: 訓練データの⽋損率を変更する実験 1. ⽋損率を変化させながら訓練データを91種類⽤意 2. それぞれの訓練データに各⽋損率補完⼿法を適⽤ → 予測モデルを学習 3. 各モデルにテストデータを⼊⼒しMAEを⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 18

19.

実験1: 訓練データの⽋損率を変更する実験 19 1. ⽋損率を変化させながら訓練データを91種類⽤意 + ⽋損率 7.75% x10 x10 ⽋損率 10% ⽋損率 20% ⋯ x10 ⽋損率 90% (⽋損率未変更) • 乱数で選んだ運⾏のデータを⼈為的に⽋損させることで⽋損率を変更 • ⽋損率は10〜90%まで10%刻みで変更 • 乱数シード値の影響を避けるため各⽋損率ごとに10種類ずつ⽤意 2. それぞれの訓練データに各⽋損率補完⼿法を適⽤ → 予測モデルを学習 3. 各モデルにテストデータを⼊⼒しMAEを⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

20.

実験1: 訓練データの⽋損率を変更する実験 20 1. ⽋損率を変化させながら訓練データを91種類⽤意 2. それぞれの訓練データに各⽋損率補完⼿法を適⽤ → 予測モデルを学習 ⽋損値補完 x91 LOCF適⽤済 x91 訓練データ ⋮ モデル 予測モデル 学習 x91 組み合わせ⼿法適⽤済 x91 u LOCF u 線形補間 u 時間的補完 u パターン補完 u 組み合わせ⼿法 ⋮ モデル ⽋損値補完⼿法ごとに 91種類のモデル x91 = 455種類の予測モデル 3. 各モデルにテストデータを⼊⼒しMAEを⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

21.

実験1: 訓練データの⽋損率を変更する実験 21 1. ⽋損率を変化させながら訓練データを91種類⽤意 2. それぞれの訓練データに各⽋損率補完⼿法を適⽤ → 予測モデルを学習 3. 各モデルにテストデータを⼊⼒しMAEを⽐較 ⽋損値補完 モデル LOCF適⽤済 テストデータ ⋮ ⼊⼒ x91 x91 予測 ⋮ MAEを ⽐較 ⋮ (⽋損率未変更) モデル 組み合わせ⼿法適⽤済 x91 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 x91

22.

実験1: 訓練データの⽋損率を変更する実験 1. ⽋損率を変化させながら訓練データを91種類⽤意 2. それぞれの訓練データに各⽋損率補完⼿法を適⽤ → 予測モデルを学習 3. 各モデルにテストデータを⼊⼒しMAEを⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 22

23.

実験1(訓練データの⽋損率変更)の結果の⾒⽅ ⽋損率を変化させていない 訓練データの結果(⽋損率7.75%) 23 ⽋損率ごとに10パターンずつ予測したため MAEにばらつきがある • プロット: MAEの平均値 • 上下のバー: MAEの標準偏差 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

24.

実験1(訓練データの⽋損率変更) – 1運⾏先の結果 24 • 時間的補完適⽤時は MAEが⼤きい • ⽋損率が50%以下の場合, 時間的補完以外はMAEの 差がほとんどない 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

25.

実験1(訓練データの⽋損率変更) – 2運⾏先の結果 25 • 1運⾏先と⽐較して全体的 にMAEが増加 • 時間的補完適⽤時は MAEが⼤きい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

26.

実験1(訓練データの⽋損率変更) – 3運⾏先の結果 26 • おおむね2運⾏先と同じ 結果 • 2運⾏先と⽐較してさらに 全体的にMAEが増加 • 時間的補完適⽤時は MAEが⼤きい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

27.

実験1(訓練データの⽋損率変更) – ⽋損率30%以下に着⽬ 1運⾏先予測 1運⾏先予測ではMAEの差がほとんど ない (時間的補完を除く) 2運⾏先予測 3運⾏先予測 2運⾏先,3運⾏先の予測では 組み合わせ⼿法・パターン補完適⽤時のMAEが⼩さい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 27

28.

実験2: テストデータの⽋損率を変更する実験 28 1. ⽋損率を変化させていない訓練データで予測モデルを学習 2. ⽋損率を変化させながらテストデータを91種類⽤意 3. それぞれのテストデータに各⽋損値補完⼿法を適⽤しモデルに⼊⼒ → MAE⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

29.

実験2: テストデータの⽋損率を変更する実験 29 1. ⽋損率を変化させていない訓練データで予測モデルを学習 ⽋損値補完 モデル LOCF適⽤済 ⋮ 予測モデル 学習 ⋮ 訓練データ (⽋損率未変更) モデル ⽋損値補完⼿法ごとに 1つの予測モデル u LOCF u 線形補間(対象外) u 時間的補完 u パターン補完 u 組み合わせ⼿法 = 4種類の予測モデル 組み合わせ⼿法適⽤済 2. ⽋損率を変化させながらテストデータを91種類⽤意 3. それぞれのテストデータに各⽋損値補完⼿法を適⽤しモデルに⼊⼒ → MAE⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

30.

実験2: テストデータの⽋損率を変更する実験 30 1. ⽋損率を変化させていない訓練データで予測モデルを学習 2. ⽋損率を変化させながらテストデータを91種類⽤意 + ⽋損率 3.08% x10 x10 ⽋損率 10% ⽋損率 20% ⋯ x10 ⽋損率 90% (⽋損率未変更) • 乱数で選んだ運⾏のデータを⼈為的に⽋損させることで⽋損率を変更 • ⽋損率は10〜90%まで10%刻みで変更 • 乱数シード値の影響を避けるため各⽋損率ごとに10種類ずつ⽤意 3. それぞれのテストデータに各⽋損値補完⼿法を適⽤しモデルに⼊⼒ → MAE⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

31.

実験2: テストデータの⽋損率を変更する実験 31 1. ⽋損率を変化させていない訓練データで予測モデルを学習 2. ⽋損率を変化させながらテストデータを91種類⽤意 3. それぞれのテストデータに各⽋損値補完⼿法を適⽤しモデルに⼊⼒ → MAE⽐較 ⽋損値補完 x91 LOCF適⽤済 x91 テストデータ モデル ⼊⼒ 予測 ⋮ ⋮ x91 x91 モデル 組み合わせ⼿法適⽤済 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 MAEを ⽐較 ⋮ x91

32.

実験2: テストデータの⽋損率を変更する実験 32 1. ⽋損率を変化させていない訓練データで予測モデルを学習 2. ⽋損率を変化させながらテストデータを91種類⽤意 3. それぞれのテストデータに各⽋損値補完⼿法を適⽤しモデルに⼊⼒ → MAE⽐較 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

33.

実験2(テストデータの⽋損率変更)の結果の⾒⽅ ⽋損率を変化させていない 訓練データの結果(⽋損率3.08%) 33 ⽋損率ごとに10パターンずつ予測したため MAEにばらつきがある • プロット: MAEの平均値 • 上下のバー: MAEの標準偏差 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

34.

実験2(テストデータの⽋損率変更) – 1運⾏先の結果 34 • 時間的補完適⽤時は MAEが⼤きい • ⽋損率が30%以下の場合, LOCF適⽤時のMAEが ⼩さい • ⽋損率が上昇すると, LOCF適⽤時のMAEが増加する 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

35.

実験2(テストデータの⽋損率変更) – 2運⾏先の結果 35 • 1運⾏先と⽐較して全体的 にMAEが増加 • LOCF適⽤時のMAEは特に 増加 • パターン補完適⽤時に MAEが⼩さい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

36.

実験2(テストデータの⽋損率変更) – 3運⾏先の結果 36 • 2運⾏先と⽐較してさらに MAEが増加 • LOCF適⽤時のMAEは特に 増加 • パターン補完適⽤時に MAEが⼩さい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

37.

実験2(テストデータの⽋損率変更)– ⽋損率30%以下に着⽬ 1運⾏先予測 1運⾏先予測ではLOCF適⽤時のMAE が⼩さい 2運⾏先予測 37 3運⾏先予測 2運⾏先,3運⾏先の予測ではパターン補完適⽤時のMAEが ⼩さい 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

38.

提案⼿法がバス到着時刻予測に適しているか評価 u LOCF: 1運⾏先予測で有効(実験2) u 線形補間: 予測モデルの⼊⼒の⽋損値補完に使⽤できない u 時間的補完: 常にMAEが⼤きくバス到着時刻予測に適していない u パターン補完: 特に複数運⾏先予測で有効(実験1,2) u 組み合わせ⼿法: 特に複数運⾏先予測で有効(実験1) ⽇周期性に着⽬したパターン補完が 特に複数運⾏先を予測する場合に有効 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 38

39.

おわりに 39 まとめ • バス到着時刻予測ではバス運⾏データの⽋損値補完が必要 • データセットの⽋損率が数%でも,予測モデルへの⼊⼒が困難になる • バス運⾏データの特徴に着⽬した⽋損値補完⼿法として3つの⼿法を提案 • 時間的補完 / パターン補完 / 組み合わせ⼿法 • ⽇周期性に着⽬したパターン補完が特に複数運⾏先のバス到着時刻予測で有効 今後の展望 • 直近の運⾏の影響を取り込む⼿法が必要 • パターンデータを元に普段の運⾏からどの程度遅れているかを計算し反映 • 気象データや道路状況データと組み合わせる 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

40.

Appendix 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

41.

正確なバス到着時刻予測が必要な背景 • Goozeら[5]の調査によると, 4〜5分以上の予測誤差があると 利⽤者は不満 • ⽯⻑ら[2]の研究では,MAEは 2分前後であるが,局所的に 10分以上誤差がある [5] A. Gooze, K. E. Watkins, and A. Borning, “Benefits of real-time transit in- formation and impacts of data accuracy on rider experience,” Transportation Research Record, vol. 2351, no. 1, pp. 95–103, 2013. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 41

42.

⽋損値補完の関連研究 (2/2) 42 • バス到着時刻予測と近い交通状況予測の分野では, データの特徴を考慮した⽋損値補完⼿法で予測誤差が減少した[4] • ⽋損率を変化させながら学習し評価 • 従来の単純な補間⽅法とも⽐較 • 平均値による補間 (HIM) • 最近傍による補間 (NIM) • 絶対平均パーセント誤差(MAPE)が 低いことを確認 [4] D.-H. Shin, K. Chung, and R. C. Park, “Prediction of traffic congestion based on LSTM through correction of missing temporal and spatial data,” IEEE Access, vol. 8, pp. 150 784–150 796, 2020. 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

43.

⽯⻑らの⼿法[2]で想定するバス路線 ⾛⾏時間 𝑟! B個のバス停がある路線の場合 バス停 1 バス停 2 走行区間 1 ## ・・・ "# #$ $# $" ・・・ 走行区間 B-1 • ⾛⾏区間𝑏を⾛⾏した時間 停⾞時間 𝑠! • バス停𝑏に停⾞した時間 "!%" #! $! $$ !# 時刻表差分 𝑑! • バス停𝑏に時刻表と ⽐較して遅れた時間 • 早着の場合は負の数 !$ ・・・ ・・・ !! 7:15 6:45 6:42 6:40 時刻表 バス停 B バス停 3 走行区間 2 "" #" 43 所要時間 𝑙! • バス停1を出発しバス停𝑏に 到着するまでの時間 • バス停1は定刻通りに 出発すると仮定 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

44.

⽯⻑らの⼿法[2]の予測モデル 44 … 入力: !!" 運行分 Conv LSTM … BN Dropout … Conv LSTM デコーダ Conv LSTM Time Distributed (Dense) Conv LSTM エンコーダ BN Conv LSTM Conv LSTM Conv LSTM Dropout … Conv LSTM … Conv LSTM BN Dropout Conv LSTM BN 出力: !#$% 運行分 … 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

45.

バス運⾏データセットの連続データ 45 • 連続で取れる最⻑のデータが 200運⾏分 • 8⽇以上連続したデータが1サンプルもない 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

46.

バス運⾏データセットの⽇周期性 46 • 始バス,終バス付近は 所要時間が少ない • 乗客が少ない • 交通量も少ない • 6〜10便⽬は 所要時間が多い • 乗客が多い ⾛⾏区間4の⾛⾏時間の便ごと平均+標準偏差 • 交通量も多い 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

47.

21系統上り路線の⾛⾏区間と予定所要時間 • ⾛⾏区間1–3は 所要時間が短い → ⽇周期性がない 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 47

48.

⾃⼰相関 – ⾛⾏区間1 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 48

49.

⾃⼰相関 – ⾛⾏区間2 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 49

50.

⾃⼰相関 – ⾛⾏区間3 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 50

51.

⾃⼰相関 – ⾛⾏時間4 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 51

52.

⾃⼰相関 – ⾛⾏時間5 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 52

53.

⾃⼰相関 – 停⾞時間1 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 53

54.

⾃⼰相関 – 停⾞時間2 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 54

55.

⾃⼰相関 – 停⾞時間3 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 55

56.

⾃⼰相関 – 停⾞時間4 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 56

57.

⾃⼰相関 – 停⾞時間5 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 57

58.

⾃⼰相関 – 停⾞時間6 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 58

59.

評価指標 59 • 評価指標としてMean absolute error (MAE) を使⽤ • テストデータの390運⾏で予測をした際の絶対誤差の平均 • 代表値として終点バス停への到着時刻予測の誤差を使⽤ • 単位は秒 • 誤差の平均が秒数で分かるため,同⼀路線の評価に使⽤される • MAE = % ∑&'(% 𝑙)),' − 𝑙),' & • 𝑛: テストデータのデータ数 • 𝑙,",$ − 𝑙",$ : 終点バス停での到着時刻予測の誤差(絶対値) • 𝑙%!,# : 終点バス停までの所要時間の予測値 • 𝑙!,# : 終点バス停までの所要時間の正解値 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

60.

時間的補完・組み合わせ⼿法の𝑵mean の決定 • 終点までのバス到着時刻予測では ⾛⾏区間4,5の影響が⼤きい • ⾛⾏時間4,5の⾃⼰相関では, ピーク前後5運⾏分の相関が ⾒られた → 𝑁mean = 5と設定 ⾛⾏区間5の⾃⼰相関 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 60

61.

時間的補完・組み合わせ⼿法の𝑵mean を変化させた実験 時間的補完 組み合わせ⼿法 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 61

62.

時間的補完の補完結果分析 62 2021年9⽉17⽇,𝑁mean = 5 • 11,14,24便⽬は 予想通りの補完 • 12,13便⽬は 実際よりも⾼い値で 補完された • 17,18便⽬は 実際よりも低い値で 補完された ※ ⾚点線は予定⾛⾏時間(1200秒) 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

63.

運⾏が安定した⽇(2022-09-23)の予測結果 – 1運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 63

64.

運⾏が安定した⽇(2022-09-23)の予測結果 – 2運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 64

65.

運⾏が安定した⽇(2022-09-23)の予測結果 – 3運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 65

66.

運⾏が乱れた⽇(2022-09-17)の予測結果 – 1運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 66

67.

運⾏が乱れた⽇(2022-09-17)の予測結果 – 2運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 67

68.

運⾏が乱れた⽇(2022-09-17)の予測結果 – 3運⾏先 便 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案 68

69.

組み合わせ⼿法の補完結果 – 訓練データ 69 • パターン補完が適⽤さ れた場所が50%以上 • 訓練データの⽋損率を変 化させる実験でパターン 補完と結果があまり変わ らなかったのはこの影響 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

70.

組み合わせ⼿法の補完結果 – テストデータ 70 • テストデータは時間的 補完適⽤の割合が⾼い • 実験2で誤差が多かったの はこのため? 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

71.

組み合わせ⼿法の補完結果 – 訓練データ 71 • パターン補完が適⽤さ れた場所が50%以上 • 訓練データの⽋損率を変 化させる実験でパターン 補完と結果があまり変わ らなかったのはこの影響 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案

72.

組み合わせ⼿法の補完結果 – テストデータ 72 • テストデータは時間的 補完適⽤の割合が⾼い • 実験2で誤差が多かったの はこのため? 2023-02-07 ― バス到着時刻予測のための⾛⾏時間・停⾞時間の⽇周期性を考慮した⽋損値補完⼿法の提案