アプリケーション運用者が知るといい User Workload Monitoring

19.4K Views

July 29, 23

#openshift #kubernetes #prometheus #OpenShift #User Workload Monitoring #Application Operation #Metrics #Alerts

スライド概要

23/7/28 OpenShift Lounge+ "TALKs" 〜 Ops/Monitoring編〜

OpenShiftユーザの多くが悩めるアプリケーション監視、、、 OpenShiftにはアプリケーション監視を簡単に実現できる機能「user-workload monitoring」があります。user-workload monitoringをうまく活用するためのポイントを「メトリクスの仕組み」「収集の仕組み」「アラートの仕組み」という３つの視点で解説します。

もーすけ

@mosuke5

スライド一覧

もーすけ

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.2M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

各ページのテキスト

アプリケーション運用者が知るといい User Workload Monitoring の話 2023/07/28 OpenShift Lounge+ "TALKs" @mosuke5

自己紹介名前: @mosuke5 (もーすけ・森真也) 仕事: 2019.4~: ・OpenShiftやDevOps, Agile開発の支援以前: ・某クラウドの日本リージョンの立ち上げクラウド化の支援・モバイルNW関連のシステム開発・運用・ソーシャルメディア解析サービスの開発・運用趣味：テニス、ポケモン、投資最近：昨日、娘が1歳になりました！ 2

アジェンダ 1. 2. 3. 4. 5. 6. はじめに・背景など User Workload monitoringの全体像メトリクスの出力収集とアラートアラートの通知利用する上での疑問解消（実際によくある質問など）

きっかけ・・・ OpenShiftの新機能、ユーザ定義プロジェクトの監視ってどこまでできる？データ期間：過去 1年間 PV数がトップ 100のなかで、一部の異常に長い滞在時間記事除く。

https://blog.mosuke.tech/entry/2021/04/24/openshift-monitoring-your-own-service/

Cluster monitoringって OpenShiftクラスタ自身を監視することを主目的としたコンポーネント。デフォルトで起動。以下のようなソフトウェアの集合体。 1. 2. 3. 4. 5. 6. 7. Prometheus Operator Prometheus Alertmanager kube-state-metrics openshift-state-metrics node_exporter prometheus-adapter Podのメトリクスを取得しているが、クラスタ全体で見る形式。監視設定もプリセットがあり追加もできない。

User workload monitoringって？もともとはOpenShiftクラスタを監視するコンポーネントだったが、OpenShift 4.6から拡張機能として「OpenShift上のユーザアプリケーション」も監視できるようになったもの。特徴として 1. 2. ユーザ自身がPrometheusなどの監視ツールを構築・運用しなくて良いマルチテナントで利用することができ、権限あるアプリの情報だけが確認・通知できる

アーキテクチャ

Prometheus ● Prometheusはオープンソースのメトリクスベースモニタリングシステム ○ ○ ● Prometheusの特徴 ○ ○ ○ ○ ● https://github.com/prometheus/prometheus CNCF(Cloud Native Computing Foundation)の 2番目のメンバーでGraduated Projectのひとつ。プル型のデータ取得アーキテクチャでスケールが容易サービスディスカバリ機能が充実。クラウドやコンテナ環境に最適化された仕組み監視設定のコード化が容易柔軟なクエリー（ PromQL）不向きなこと ○ メトリクスベースのため、イベントログや個別のイベント情報の格納には不向き。 Grafanaと連携した可視化が容易

https://github.com/prometheus/prometheus

ざっくりのイメージユーザアプリケーションの Namespace メトリクス収集アラート通知先 AlertmanagerConf 監視設定 ServiceMonitor アラートルール PrometheusRule 設定反映 Prometheus クエリー実行ユーザが意識するエリアユーザが意識しないエリア

10.

ユーザが管理する範囲 ServiceMonitor PrometheusRule AlertmanagerConf 作成ユーザ namespace: openshift-monitoring 監視 ServiceMonitorの内容を反映 PrometheusRuleの内容を反映 namespace: openshift-user-workload-monitoring Alertmanagerはクラスタ監視用を使うので、通知先設定はクラスタ管理者しかできなかった（過去形）。 OpenShift 4.11以降で改善

11.

拡大図デフォで取得している→ メトリクス・PodのCPU使用率・Podのメモリー使用率・Jobの成否 … ←ユーザが定義したメトリクス複数のPrometheusのメトリクスのデータを束ねて提供

12.

利用までの流れ 1. User-workload monitoringの有効化 ←本日のスコープ外 a. b. 2. 3. 4. ConfigMapで有効化設定 Prometheus/Alertmanagerのストレージ等のリソース設定メトリクスの出力を設定メトリクスの収集を設定アラート・通知を設定

13.

メトリクスの出力

14.

利用できるメトリクス ● OpenShiftが用意しているもの ○ ○ ○ ○ ○ ○ ● Kubelet kube-state-metrics openshift-state-metrics Recording rules （node_exporter）（その他各種Operator）ユーザが用意するもの ○ 独自アプリケーションのメトリクス ■ ■ ■ ○ Micrometer xx_exporter -> pg_exporter, mysql_exporter, jvm_exporter Client library ビジネスメトリクス ■ sql_exporter

15.

メトリクス（kubelet） Kubeletは、Kubernetesを構成するコンポーネントのひとつ。クラスタ内の各ノードで動作するエージェントで、主に Podのライフサイクルを管理（起動停止、リソース管理、ヘルスチェック…）。 Kubeletには、cAdvisorというソフトウェアを組み込んでおり、コンテナのリソース使用状況を収集・公開している。確認した感じ、いくつかの種類のメトリクスのみを cAdvisorからとって公開しているよう。（Github）

https://github.com/kubernetes/kubernetes/blob/v1.26.7/pkg/kubelet/cadvisor/cadvisor_linux.go#L86-L95

16.

17.

メトリクス（kube-state-metrics） kube-state-metrics は、Kubernetes APIを通じて、Kubernetesのオブジェクトの状態をPrometheus形式のメトリクスで出力するものです。具体的には、DeploymentやPodといったKubernetesオブジェクトの情報。 $ oc get deploy nginx -o yaml … status: availableReplicas: 3 conditions: … observedGeneration: 1 readyReplicas: 3 replicas: 3 updatedReplicas: 3

https://github.com/kubernetes/kube-state-metrics

18.

メトリクス（openshift-state-metrics） openshift-state-metrics は、OpenShiftの固有のオブジェクトの状態をPrometheus 形式のメトリクスで出力するもの。具体的には、DeploymentConfigやRoute、BuildConfigといった、OpenShift固有のオブジェクト情報。

https://github.com/openshift/openshift-state-metrics

19.

kube-state -metrics openshift-st ate-metrics

20.

Recording rules (Prometheusの機能) PrometheusのRecording rulesは、頻繁に使用するまたは計算に時間のかかるクエリの結果を新しいメトリックとして保存し、その結果を効率的に再利用する機能。 Cluster MonitoringのPrometheusでは、Recording rulesを予め用意してくれている。 # 各namespaceとclusterにおけるPendingまたはRunning状態のPodでリクエストされているCPUの合計量を計算 - expr: | sum by (namespace, cluster) ( sum by (namespace, pod, cluster) ( max by (namespace, pod, container, cluster) ( kube_pod_container_resource_requests{resource="cpu",job="kube-state-metrics"} ) * on(namespace, pod, cluster) group_left() max by (namespace, pod, cluster) ( kube_pod_status_phase{phase=~"Pending|Running"} == 1 ) ) ) record: namespace_cpu:kube_pod_container_resource_requests:sum

21.

メトリクスの収集とアラート

22.

監視対象設定 /metrics で公開 Prometheusの監視設定を Kubernetesマニフェストで表現できる apiVersion: monitoring.coreos.com/v1 kind: ServiceMonitor metadata: name: nginx-monitor spec: # メトリクスのエンドポイントの設定 # "exporter"という名前のService portを選択 endpoints: - interval: 30s port: exporter scheme: http # 検出するServiceの条件設定 # "app: test-nginx"のラベルを持つServiceを検出 selector: matchLabels: app: test-nginx スクレイピング Prometheus Operatorが、 ServiceMonitorからPrometheusの設定ファイルを生成し、Prometheusによみこませる。 # prometheus.yaml global: scrape_interval: 15s evaluation_interval: 15s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['localhost:9090']

23.

アラート設定 Prometheusのアラート設定をKubernetesマニフェストで表現できる alert manager アラートを評価して発報 apiVersion: monitoring.coreos.com/v1 kind: PrometheusRule metadata: name: nginx-alert spec: groups: - name: nginx-down rules: - alert: NginxPartiallyDown expr: sum(nginx_up) < 3 for: 5m labels: severity: warning Prometheus Operatorが、 PrometheusRuleからPrometheusが読み取れるルールファイルに変換 # rulefile groups: - name: nginx-down rules: - alert: NginxPartiallyDown expr: sum(nginx_up) < 3 for: 5m labels: severity: warning

24.

ユーザが管理する範囲 ServiceMonitor PrometheusRule AlertmanagerConf namespace: openshift-monitoring 作成ユーザ監視 ServiceMonitorの内容を反映 PrometheusRuleの内容を反映 namespace: openshift-user-workload-monitoring

25.

アラートの通知

26.

OpenShift 4.11以前の世界ユーザアプリケーションの Namespace 監視設定 ServiceMonitor クラスタ管理の Namespace アラートルール PrometheusRule アラート通知先設定・開発者A: Slack xxチャネル・開発者B: Slack yyチャネル・開発者C: email ② 開発者Aさん用にアラート通知先を追加開発者A ① 開発者Aのアラートは Slackのxxチャネルに通知してくださいクラスター管理者

27.

OpenShift 4.11以後の世界ユーザアプリケーションの Namespace クラスタ管理の Namespace アラート通知先 AlertmanagerConfig 監視設定 ServiceMonitor アラートルール PrometheusRule アラート通知先設定 ② Operatorが自動でアラート通知先を追加 ① 自分でアラート通知先を管理開発者A ・開発者A: Slack xxチャネル・開発者B: Slack yyチャネル・開発者C: email やることなし！クラスター管理者

28.

アラート通知設定 Prometheusのアラート設定をKubernetesマニフェストで表現できる apiVersion: monitoring.coreos.com/v1beta1 kind: AlertmanagerConfig metadata: name: example-routing namespace: mosuke5-monitoring spec: route: receiver: default groupBy: [job] receivers: - name: default slackConfigs: - apiURL: ## KubernetesのSecretを指定 name: my-slack-secret key: url channel: mosuke5-alert sendResolved: true alert manager Prometheus Operatorが、 alertmanagerが読める形式の Configに変換して反映 # alertmanager.yaml receivers: - name: mosuke5-monitoring/example-routing/default slack_configs: - send_resolved: true api_url: https://hooks.slack.com/services/xxxxxxx channel: mosuke5-alert

29.

利用する上での疑問解消

30.

Prometheusがマルチテナント！？いい感じにやってくれるのはわかったけど、、、 1. 2. Prometheusってマルチテナント機能なかったはずだけど、なぜuser-workload monitoringではユーザごとに見れるメトリクスが違うの？ prometheusRuleを設定したけど、なぜかアラートされないんだけど？ a. prometheusRuleを設定したNamespace外のメトリクスを利用していた

31.

クエリーが実行されるまでの流れ Developer UI /api/prometheus-tenancy/api/v1/query ?namespace=myapp &query=process_cpu_seconds_total Thanos ruler prometheusRuleを Thanos rulerに反映する時に自動で namespaceラベルが付与される Service (thanos-querier) Console server 9091 oauthproxy 9092 kube-rbacproxy 9093 kube-rbac proxy-rule kube-rbac 9094 proxy-metric SubjectAccessReviewsを使って、認可処理 promQLへラベルを付けて変換 process_cpu_seconds_total{ namespace=myapp} Prometheus for cluster prom-labelproxy 9095 Thanos querier 9090 thanos-querier pod Prometheus for user メトリクス収集時に namespaceラベルを付与

32.

PromQL難しいんだが...！？簡単ではないですよね、、、しかし、以下をまず押さえると見え方が変わってくることが多い気がします - 利用できるメトリクスを把握する（時間あればデモ） - - Kube-state-metrics documents Openshift-state-metrics documents Recording ruleの内容の確認方法 Prometheusのデータタイプを理解する統計の基本用語を覚える ChatGPTが得意なので積極的に使う豆知識（メトリクス名の見分け方例） - kube_* : kube-state-metrics - openshift_* : openshift-state-metrics - container_* : kubelet - pod:xxx : Recording rules - namespace:xxx : Recording rules - cluster:xxx : Recording rules

33.

Recording rulesの内容を知る % oc get cm prometheus-k8s-rulefiles-0 -o yaml | grep -B10 "record: namespace_cpu:kube_pod_container_resource_requests:sum" - expr: | sum by (namespace, cluster) ( sum by (namespace, pod, cluster) ( max by (namespace, pod, container, cluster) ( kube_pod_container_resource_requests{resource="cpu",job="kube-state-metrics"} ) * on(namespace, pod, cluster) group_left() max by (namespace, pod, cluster) ( kube_pod_status_phase{phase=~"Pending|Running"} == 1 ) ) ) record: namespace_cpu:kube_pod_container_resource_requests:sum

34.

35.

例）PromQL data type Prometheusで利用するメトリクスのデータタイプには以下の4つがある。 1. Counter（カウンタ） a. b. c. 2. Guarge（ゲージ） a. b. 3. カウンタと異なり、ときに増減する数値を表す。温度やメモリ使用率、同時稼働数など増減する値に利用される。 Histogram（ヒストグラム） a. b. 4. 名前の通り「単純増加」を表す。（グラフで表すと右肩上がり）カウンタはシステム上に発生するイベントを追跡するのに使われることが多い。例としては、Webサーバへのリクエストされた回数の計測などで利用。指定した範囲に値がどれくらい存在するかを表す。リクエスト応答時間やリクエストサイズなど変動しうる値で、その分布を計測する場合などに利用される。 Summary（サマリ） a. ヒストグラムと類似し、指定した範囲に存在する値がどれくらい存在するかを表すが、パーセンタイル形式で表示する

36.

例）特徴的な計算方法 container_cpu_usage_seconds_total（カウンタ） irate(container_cpu_usage_seconds_total[5m])：5分間あたりの増加率を計算知りたいのはこっち

37.

例）統計用語：パーセンタイルパーセンタイルは、モニタリングシステムでよく用いられる統計用語。計測した値を、小さい順に並べた場合に、小さい方から数えてどのくらい（ N%）に位置する値かを示すもの。50パーセンタイル、 90パーセンタイル、 95パーセンタイルといったように利用する。パーセンタイルを利用する理由は、極端に大きい値（異常値）の影響を受けづらくすることがおおい。単純平均値では、異常値の影響を受け、正確な状況把握が難しいことがある。例として、以下のような数字があった場合の 90パーセンタイルは？元データ： 76、88、85、87、78、80、95、92、83、89 昇順データ： 76、78、80、83、85、87、88、89、92、95 90パーセンタイル

38.

おわりに

39.

おわりに ● ● ● ● User Workload Monitoringは、Cluster Monitoringの拡張機能 Cluster Monitoringのデータと連携しながら、いい感じにマネージド監視サービスを提供 ○ 仕組みをわかっておくと、トラブルシューティングなど楽に監視システムの運用は不要だが、一定のPrometheus/PromQLの知識は必要 ○ 学び方をさぐってみよう話せなかったけど、ダッシュボードがイケてないなどイマイチな点もあるので、自前構築と天秤で

40.

おまけ

41.

kubeletのメトリクスの実体を見る場合 On node # curl -k -H "Authorization: Bearer xxxxx" https://localhost:10250/metrics/cadvisor … container_cpu_system_seconds_total{container="POD",id="xxx",image="",name="k8s_POD_sonarq ube-postgresql-0_myapp_2621cd4e-292f-4e10-a36f-9fc7614dacea_0",namespace="myapp",pod="s onarqube-postgresql-0"} 0 1690507028110 …

https://localhost:10250/metrics/cadvisor

42.

で、どのくらいリソースが必要なの？ 1. コンピューティングリソース a. b. 2. いまのところはスケールアップで対応するしかないレプリカ数の指定をできるが Prometheusの場合、冗長化としての対応（Github: explaining a HA + scalable setup?）ディスク a. b. 推定しやすいので、計算しましょう。次ページで計算例を。

https://github.com/prometheus/prometheus/issues/1500

43.

user-workload-monitoringの必要ディスク容量は？ Prometheusは、一定時間間隔で監視対象に対してメトリクスを取得する。監視対象と取得間隔は ServiceMonitorで定義されるため、以下の式で必要なディスク容量の推定ができる。また、Prometheusが収集するのはメトリクスデータのため、１サンプルが大きくならない（かつ、種類によって大きさに差が出づらい）ため計算が可能。公式ドキュメント [1] 必要なディスク容量 = 保持期間 * 取得するサンプル数 * １サンプルあたりのデータサイズ取得するサンプル数 -> (rate(prometheus_tsdb_head_samples_appended_total[1d])) １サンプルあたりのデータサイズ -> (rate(prometheus_tsdb_compaction_chunk_size_bytes_sum[1d])) / rate(prometheus_tsdb_compaction_chunk_samples_sum[1d]) 43 [1] https://prometheus.io/docs/prometheus/latest/storage/#compaction

https://prometheus.io/docs/prometheus/latest/storage/#compaction

44.

user-workload-monitoringの必要ディスク容量は？ある特定時点で以下の状況と仮定 ● ● ● 取得するサンプル数: 1000 1サンプルあたりのデータサイズ: 1.5byte 保持期間: 2週間と仮定（1,209,600秒）必要なディスクサイズの見積もり = 1000*1.5*1209600 = 1.8GB

アプリケーション運用者が知るといい User Workload Monitoring

もーすけ

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

Unreal Engine5 Lumenの仕組みと肝心なところ

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

Meta XR SDK(V66-74)でQuestアプリを開発

最新の6.0で学ぶ！初めてのひとのためのSpring Security

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

各ページのテキスト