Autowareにおけるリソース競合の定量化

4K Views

March 22, 23

tieriv autoware computing

スライド概要

2023/3/13「TIER IV Computing System Workshop 2023」
発表者：石川貴大

TIER IV

@TIER_IV

スライド一覧

TIER IV（ティアフォー）は、「自動運転の民主化」をビジョンとし、Autowareを活用したソフトウェアプラットフォームと統合開発環境を提供しています。 #Autoware #opensource #AutonomousDriving #deeptech

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pdf - 1.29MB)

各ページのテキスト

TIER IV Autowareにおけるリソース競合の定量化 2023 / 03 / 13 TIER Ⅳ | Takahiro Ishikawa @sykwer 1

TIER IV プロフィール石川貴大 (Takahiro Ishikawa) Twitter, Github @sykwer 2020.06〜 TIER IV 在籍 2022.03 東京大学情報理工コンピュータ科学修了 (加藤研) 2023.04 同専攻社会人博士入学予定専門オペレーティングシステム, リアルタイムシステム TIER IV での担当アプリケーションのパフォーマンス, リアルタイム性ミドルウェア, Linux Kernel, Hypervisor, OS開発 2

TIER IV 01 / 背景と概要 Autowareにおけるリソース競合の定量化 TIER Ⅳ | Takahiro Ishikawa 02 / 参考研究の手法 03 / Autowareへの適用 04 / まとめ @sykwer 3

TIER IV Autowareはリアルタイムタスク Autoware (我らが自動運転アプリケーション) には入力〜出力の時間制約がある 4

TIER IV リアルタイムってなに? ● リアルタイムの意味は濫用されがち ○ RTOS: タスクの立ち上がり時間, Context Switchのオーバーヘッドが非常に小さい ● ○ スケジューリング理論 ○ 機能安全保証うんうんそれもリアルタイムだね。。。リアルタイムシステム = 出力の正しさに論理的な正しさだけではなく, 時間的な制約が加わるシステム = リアルタイム制約のあるシステム ● 予測可能性 = システムが時間制約を守る能力を向上させる要素 5

TIER IV リアルタイムスケジューリングの前提前提1: Taskの立ち上がりやContext Switchの遅延はゼロ前提2: 最悪実行時間を見積もることができる Deadline Relative Deadline Slack Current Period 6

TIER IV AutowareでWCET保証は不可能 ● プラットフォーム要因: マイクロアーキテクチャにおけるオペレーションに最悪実行時間を定義できない ● アプリケーション要因: 外部環境由来によって処理の増減が激しい, キャッシュやメモリ帯域といったリソースの競合が激しい (Memory Intensive) 7

TIER IV スループット指向システムの予測可能性 ● Autoware は ROS (Robot Operating System) のノードが200以上立ち上がる (スレッド数にして1000以上) ● ノード同士は相互依存関係を持って, Publish/Subscribe 通信を行う ● OS には当面 Linux を採用 → 研究の方向性 (の内の一つ): スループット指向のシステムにて予測可能性をマシにしていく 8

TIER IV メモリ資源競合の定量化 ● 本発表の取組: リソース競合の中でも, キャッシュやメモリ帯域といったメモリ資源の競合について定量化してみる ● 仮説: タスク固有の「リソース競合への感応性」と「システムのリソースに与える負荷」を定量化 → リアルタイムにリソース競合由来の遅延を算出可能 ● 先行研究: クラウド環境上でのアプリケーション同士のメモリ競合を同様の考え方で定量化した論文 (MICRO ‘11) ● 先行研究の手法をAutowareに応用してみる 9

10.

TIER IV 01 / 背景と概要 Autowareにおけるリソース競合の定量化 TIER Ⅳ | Takahiro Ishikawa 02 / 参考研究の手法 03 / Autowareへの適用 04 / まとめ @sykwer 10

11.

TIER IV 参考研究の概要 Bubble-Up: increasing utilization in modern warehouse scale computers via sensible co-locations (MICRO ‘11) ● 目的: クラウド上の同じホストになるべく多くのアプリケーションを同居させ, クラウドリソースの利用効率を上げたい ● 手段: Applicationそれぞれに対して「固有のsensitivity (システム負荷からの影響の受けやすさ)」と「contentiousness (システムへの負荷)」を算出 ● リソース競合によるパフォーマンスの低下を予測 → 根拠をもってアプリケーションを同一ホストに同居させることが可能に 11

12.

TIER IV 参考研究の手法概要それぞれのアプリケーション固有の「sensitivity (システム負荷からの影響の受けやすさ)」と「contentiousness (システムへの負荷)」を算出 12

13.

TIER IV 参考研究の手法 (手順1) 定められたアドレス範囲に, ランダムアクセス/逐次アクセスをすることで負荷とする 13

14.

TIER IV 参考研究の手法 (手順2) 1段階目 “Reporter” と呼ばれるアプリケーションの “sensitivity curve” を作成 2段階目対象アプリケーションと同居したときの “Reporter” のパフォーマンス低下を計測逆引き (Performance低下度 → Appの相当するメモリ負荷度 ) ReporterのSensitivity Curve 14

15.

TIER IV 参考研究における手法まとめ App1 Reporter Reporter Bubble Bubble App2 Sensitivity Curve の算出 App2 App1 App2 Contentiousness の算出 App2 15

16.

TIER IV 参考研究における評価 ● bigtable, search, youtube などのアプリケーションに対して Sensitivity Curveを作成 / Contentiousness算出 → それぞれのアプリケーションの特色が判明 ● それぞれのアプリケーションに様々な負荷 (行列計算, 二分木探索, 様々なパターンのメモリアクセス) を与えて, パフォーマンス低下を予測 → 誤差約2%以下で予測に成功 ● 許容されるパフォーマンス低下の度合いを制約として, クラウド上リソースの Utilization を上げることに成功 16

17.

TIER IV 01 / 背景と概要 Autowareにおけるリソース競合の定量化 TIER Ⅳ | Takahiro Ishikawa 02 / 参考研究の手法 03 / Autowareへの適用 04 / まとめ @sykwer 17

18.

TIER IV Autowareへの適用概要 ● 参考研究と本発表内容のギャップ: Application単位ではなく, Autoware のプロセス同士の競合を扱う点 ● 今回は SensingモジュールのLiDAR点群前処理に注目 18

19.

TIER IV AutowareのSensingモジュール (点群処理) ロボットタクシーのLiDAR点群前処理 19

20.

TIER IV AutowareのSensingモジュール (点群処理) velodyne_convert_node: LiDARパケットをxyz空間の3次元点群に変換 20

21.

TIER IV AutowareのSensingモジュール (点群処理) crop_box_ﬁlter_self: 自車のボディから反射した点群を除去 21

22.

TIER IV AutowareのSensingモジュール (点群処理) crop_box_ﬁlter_self: 自車のミラーから反射した点群を除去 22

23.

TIER IV AutowareのSensingモジュール (点群処理) distortion_corrector: 自車が移動しつつLiDARが回転する由来の歪みを補正 23

24.

TIER IV AutowareのSensingモジュール (点群処理) ring_outlier_ﬁlter: 回転式LiDARの性質を生かした効率的な外れ値除去 24

25.

TIER IV 参考研究における手法 (再掲) ring_outlier_filter Reporter Reporter Bubble Bubble … Sensitivity Curve の算出 ring_outlier_filter … Contentiousness の算出 25

26.

TIER IV 計測の注意 : Isolatedに計測すべし ● Core Isolated = Timer割り込みが入らないようにし, RCU Callbackをオフロード ● Fix Hz = CPUの周波数を常に一定にする. Turbo BoostをOﬀにすることを忘れずに ● Core Affinity = IsolateしたCoreでは計測対象のプロセスを動作させる ● Reporter, 計測対象ノードは Isolate Isolated環境で動作計測対象を動作させるノード 26

27.

TIER IV 手順1: Sensitivity Curve (Reporter, ring_outlier_ﬁlter) 時間がなくて ring_outlier_filter しか計測できなかった ... 27

28.

TIER IV 手順2: Contentiousness 負荷ベンチマークとしては「二分木の探索 (4MiB)」, ランダムアクセス (4, 8, 12MiB) を用意した 28

29.

TIER IV 予測精度の評価 29

30.

TIER IV 01 / 背景と概要 Autowareにおけるリソース競合の定量化 TIER Ⅳ | Takahiro Ishikawa 02 / 参考研究の手法 03 / Autowareへの適用 04 / まとめ @sykwer 30

31.

TIER IV まとめ ● Autowareの時間性能面での予測可能性を高めるという目的で, メモリリソース競合の定量化を目指した ● 仮説: タスク固有の「リソース競合への感応性」と「システムのリソースに与える負荷」を定量化 → リアルタイムにリソース競合由来の遅延を算出可能 ● クラウド環境上で同様の考え方の手法を実現した先行研究を応用 ● Autowareのノードに対して手法を適用し, 十分な予測精度を出すことに成功 ● 今後の課題 1) 3つ以上のノードが同時にメモリ負荷をかけた場合 2) ノード自体の Contentiousness の算出 3) リソース競合由来の遅延予想をOSに実装 31

32.

TIER IV CONTACT US https://tier4.jp/ Thanks Again ! 32

https://tier4.jp/

Autowareにおけるリソース競合の定量化

TIER IV

関連スライド

Edge AIのためのDNN推論処理の最適化

Openな資産とFPGAを活用して、領域特化型のProcessorを作ろう！

Hailo-8上の低消費電力Edge AI

小さく始める Blue/Green Deployment

Autoware紹介と自動運転ハードウェアアーキテクチャ

Webエンジニアが自動運転企業でやっていること

各ページのテキスト