【TechMar Meetup】データ整備人の終わりなき奮闘記

164 Views

April 30, 20

スライド概要

profile-image

子育てのことで頭いっぱい

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Tech x Marketing meetup データ整備人の終わりなき奮闘記 2020年4月30日(木) 櫻井文矢 #TechMar © 2020 cyber communications inc. All Rights Reserved.

2.

Profile 2 櫻井 文矢(Sakurai Fumiya) @saku_238 Company ➢ (株)サイバー・コミュニケーションズ (略して CCI) Role ➢ データエンジニア兼クラウドアーキテクト Interests ➢ SRE ➢ DMBOK ➢ 弱々エンジニア会 #TechMar © 2020 cyber communications inc. All Rights Reserved.

3.

今日話すこと 3 Intro SRE DMBOK 会社とサービスの紹介 モニタリングと自動化 データ整備人 #TechMar © 2020 cyber communications inc. All Rights Reserved.

4.

今日話すこと1 4 Intro SRE DMBOK 会社とサービスの紹介 モニタリングと自動化 データ整備人 #TechMar © 2020 cyber communications inc. All Rights Reserved.

5.

Company Introduction 東証一部 (4324) 5 社名 株式会社サイバー・コミュニケーションズ(邦文表記) cyber communications inc.(英文表記) 設立 1996年6月5日 代表者 代表取締役社長 新澤 明男 代表取締役副社長 目黒 拓 本社所在地 〒104-0045 東京都中央区築地1-13-1 築地松竹ビル (代表電話番号)03-6837-6011 資本金 4億9,000万円 株主 株式会社CARTA HOLDINGS (電通連結子会社)100% https://cartaholdings.co.jp/ 連結子会社 株式会社DataCurrent https://www.datacurrent.co.jp/ 社員数 1,026名 事業内容 インターネットや商用オンライン・サービスなどのネットワーク上の広告及び 関連する下記の事業 ・広告の提案、企画、制作、運営 ・広告スペースの購入、販売 主要加盟団体 一般社団法人 日本インタラクティブ広告協会 公益社団法人 日本アドバタイザーズ協会 web広告研究会 The IAB Technology Laboratory(IAB Tech Lab) アドベリフィケーション推進協議会 WOMマーケティング協議会 公益社団法人 日本マーケティング協会 公益社団法人 日本広告審査機構 公益社団法人 ACジャパン © 2020 cyber communications inc. All Rights Reserved. ※2018年12月末日現在 #TechMar

6.

Corporate Slogan 6 経営理念 革新的で信頼ある インタラクティブコミュニケーションサービスの提供を通じて、 より豊かな情報社会の創造の一翼を担う。 経営ビジョン メディアの成長を支え続ける― インターネット広告の黎明期からメディアと共に歩み、 成長してきた我々だからこそ、 メディアの成長、健全な発展を支えていくことができる。 そして、そこに我々の価値の源泉があると考える。 メディアの本質価値を見出し、革新的な発想を以て、 企業のコミュニケーション活動に貢献していく。 健全なメディアの発展と、 多様なコミュニケーションの発達の先に、 より豊かな情報社会が存在する。 © 2020 cyber communications inc. All Rights Reserved. #TechMar

7.

Service Introduction 7 “生活者と企業が安心して データを活用できる世界に貢献する” 1 2 Data Consulting Engineering データを軸に広告・マーケティン グ・プロモーションを支援する データ活用のコンサルティング 3 顧客ごとにカスタマイズされた データ基盤の開発、及び運用保 守 4 IT Solution 企業間のデータ流通を推進する テクノロジーの導入支援 © 2020 cyber communications inc. All Rights Reserved. Data Exchange 個人主体のデータ流通市場 を牽引するデータ取引所の 運営 #TechMar

8.

Role Introduction 8 データの流れ データソース DMP※ DSP DWH データマート Media データレイク データエンジニア データエンジニア/データアナリスト データマネジメント 集計分析 意思決定者 データアナリスト 経営 セールス / データコンサルタント #TechMar 分析要求の流れ © 2020 cyber communications inc. All Rights Reserved.

9.

(補足説明)DMPとは 9 DMP(Data Management Platform)とは、インターネット上に蓄積されたビッグデータやWebサイトの閲覧や行動データなどを一 元管理、分析し、最終的に広告配信などのアクションプランの最適化を実現するためのプラットフォームのこと。 収集 蓄積 活用 DSP(広告配信) リターゲティング Webサイトタグ経由 データ 類似拡張 データベンダーから のオフラインデータ DMP DWH・データマート ユーザー分析 DMP データ販売 © 2020 cyber communications inc. All Rights Reserved. #TechMar

10.

櫻井の担当領域 10 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 分析要求の流れ #TechMar © 2020 cyber communications inc. All Rights Reserved.

11.

データ整備人の終わりなき奮闘記

12.

前置き この課題は個人の見解であり、 所属組織とは一切関係ありません。

13.

表 「豊富なセグメント」と「データ精度が高い」ことが売り

14.

裏 「多すぎるデータ」と「データ精度追及しすぎ」で大変

15.

課題が山積み 15 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 分析要求の流れ #TechMar © 2020 cyber communications inc. All Rights Reserved.

16.

今日話すこと2 16 Intro SRE DMBOK 会社とサービスの紹介 モニタリングと自動化 データ整備人 #TechMar © 2020 cyber communications inc. All Rights Reserved.

17.

SREの取り組みの話 17 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 分析要求の流れ #TechMar © 2020 cyber communications inc. All Rights Reserved.

18.

平和な毎日(理想です) 18 DWH DMP データエンジニア データアナリスト #TechMar ※本スライドはイメージです。実際とは異なる場合があります。 © 2020 cyber communications inc. All Rights Reserved.

19.

ある日の出来事 19 DWH DMP データエンジニア データアナリスト #TechMar ※本スライドはイメージです。実際とは異なる場合があります。 © 2020 cyber communications inc. All Rights Reserved.

20.

翌日( → ほぼ現実な毎日) 20 DWH DMP データエンジニア データアナリスト #TechMar ※本スライドはイメージです。実際とは異なる場合があります。 © 2020 cyber communications inc. All Rights Reserved.

21.

データエンジニアの課題 21 データの流れ DMP データソース データレイク DWH データ多すぎ問題 データ連携失敗問題 #TechMar © 2020 cyber communications inc. All Rights Reserved.

22.

データ多すぎ問題事例

24.

データベンダー多すぎ しかも データ受け渡し方式もベンダの制約があ り、多種多様

25.

データ連携失敗問題事例

26.

突然のクラウドサービス障害

27.

ベンダーから告知のない仕様変更

28.

集計結果が一致しない

29.

問題点をあげたらキリがない …orz そもそも僕、弱々エンジニアです。

30.

トラブル多すぎて対応に追われる毎日 人員も限られているし、モチベーション維持もさすがに厳しい。。。 とにかくこの現状を打破する方法はないか。。。

31.

Googleが提唱している取り組みの1つにSREというものがあるらしい。 同じことに共有しあっているSRE Loungeという コミュニティがあるらしい。何かヒントになるかも。 SRE Lounge 本日の会場 #TechMar

32.

SREとは 32 サイト・リライアビリティ・エンジニアリングは、Google社が提唱、実践しているシステム管理とサービス運用の方法論である SRE本 GoogleがSREを取り組んだときの希望、恐れ、成功、失敗の物語が記されたもの。 #TechMar © 2020 cyber communications inc. All Rights Reserved.

33.

SRE Loungeとは 33 とある企業のSRE チームが中心となり、発足した勉強会 。 もともとは、クローズドで少人数な勉強会運営をしておりましたが、より幅広く参加者を集い、同じ業務同士で交流する会。 #TechMar © 2020 cyber communications inc. All Rights Reserved.

34.

データ多すぎ問題の施策 34 受領するデータは統一してCCIのS3もしくはGCSに蓄積し、シンプルに。 データソース 日次 週次 21日毎 月次 データレイク DWH DMP 四半期 年2回 #TechMar © 2020 cyber communications inc. All Rights Reserved.

35.

データ連携失敗問題の課題 35 トラブルに気づいていないこともあり、データアナリストからの申告で気づくこともあっ た。 日次 週次 DWH 21日毎 月次 四半期 DMP 年2回 データアナリストからの『状況をはやく教えてくれれば調整できた。』 #TechMar トラブルに気づくモニタリングの導入に取り組んだ。 © 2020 cyber communications inc. All Rights Reserved.

36.

取り組みの施策 36 チームで協議しモニタリング強化としてにBIツールや異常通知の仕組みを構築してとにか く気づく環境整備の徹底 日次 週次 21日毎 DWH 月次 DMP 四半期 BIツール 年2回 #TechMar © 2020 cyber communications inc. All Rights Reserved.

37.

モニタリング強化の取り組みの効果 37 異常が発生後に担当者へ連絡しても『X日までに復旧してくれればOK(いわ ゆるエラーバジェット)』のやりとりもあり、落ちついてリカバリに取組めるよ うになった。 リカバリ対応だけでなく、原因究明・根本対策としての時間も確保でき、 自動化にも取り組めるようになった。 Toil(労苦)も減少しより効率的で強固なデータ連携基盤に整備 #TechMar © 2020 cyber communications inc. All Rights Reserved.

38.

結果 38 データアナリスト達からの信頼の回復(獲得) DataCurrentサービスは安定稼働 #TechMar © 2020 cyber communications inc. All Rights Reserved.

39.

今日話すこと③ 39 Intro SRE DMBOK 会社とサービスの紹介 モニタリングと自動化 データ整備人 #TechMar © 2020 cyber communications inc. All Rights Reserved.

40.

データ整備人の取り組みの範囲 40 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 分析要求の流れ #TechMar © 2020 cyber communications inc. All Rights Reserved.

41.

前置き この課題は個人の見解であり、 所属組織とは一切関係ありません。

42.

新しいデータを取り扱うときの課題

43.

(補足)Role Introduction 43 データの流れ データソース DMP※ DSP DWH データマート Media データレイク データエンジニア データエンジニア/データアナリスト データマネジメント 集計分析 意思決定者 データアナリスト 経営 セールス / データコンサルタント #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

44.

Role:データマネジメント 44 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 データマネジメント #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

45.

Role:データエンジニア 45 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 データエンジニア #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

46.

Role:データアナリスト 46 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 データアナリスト #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

47.

Role:セールス/データコンサルタント 47 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 セールス / データコンサルタント #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

48.

(課題)Role:データ??? 48 データの流れ データソース DMP※ DSP DWH データマート Media データレイク データエンジニア ??? 集計分析 意思決定者 データアナリスト #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

49.

課題 どっちがやる? エンジニア?アナリスト?

50.

私がやってみた。 50 データの流れ データソース DMP※ DSP DWH データマート Media データレイク 集計分析 意思決定者 Sakutaro データアナリスト データマネジメント #TechMar 分析要求の流れ CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

51.

データエンジニアの意見 データの活用方法がわからない。 #TechMar

52.

上司 そのデータ どうしたいの? ※本画像はイメージです。実際とは異なる場合があります。

53.

データアナリストの意見 データの収集・蓄積方法がわからない。 #TechMar

54.

上司 そのデータ 問題はないんですか? ※本画像はイメージです。実際とは異なる場合があります。

55.

データ利活用する時のインテリジェンスが無さすぎることに気づいた。 同じことに共有しあっている データ分析とインテリジェンス (データアーキテクト(データ整備人)を”前向きに”考える会) というコミュニティがあるらしい。何かヒントになるかも。 データ整備人 本日の会場 #TechMar

56.

データエンジニアとデータアナリストを兼務して取り組んだ施策 データエンジニア 56 データアナリスト 分析に必要なデータ構造を データソース担当者へ伝える 分析設計 施策の狙いを理解して 分析設計する データ構造が理解できデータ連携から データマート(BI)まで作成する データ連携 今後のデータ利活用を考えて データに拡張性ができる 追加の分析が必要であれば、 都度データマート(BI)を修正する 集計分析 データを分析しコンサルや セールスが理解しやすい形に可視化 結果(データ)の妥当性を再確認する 結果FB 意思決定者への メッセージをフィードバック #TechMar CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

57.

結果:やって絶対に損はない!! 57 一連のプロセスが短期間で達成できる エンジニアとアナリストの役割を考えるスキル データソースとデータの意味を理解できるから 機械学習担当者の応対も円滑にできる #TechMar CONFIDENTIAL © 2020 cyber communications inc. All Rights Reserved.

58.

上司 そうだよ。 ※本画像はイメージです。実際とは異なる場合があります。

59.

まとめ(苦労) 59 1. データ連携基盤(特にクラウドサービス)の安定稼働は難しい。 2. 様々なデータを取り扱っており、それぞれのデータ理解 や処理方法には時間がかかる。 3. またデータには時代というトレンドに影響することもあ るためデータ(セグメント)のボリューム把握も重要。 #TechMar © 2020 cyber communications inc. All Rights Reserved.

60.

まとめ(今後) 60 • デジタル広告の規制変更が急速であるため、今あるデータ が急に使えなくなるという脅威がある。 • データ提供やトラブルを素早く収束する技術を身に着けて、 スキル習得の時間を確保していく。 • 『私は、データ整備人です。』と言うと細かい事をやってくれるという イメージを持たれてしまう。せっかく、この業務にJoinしているなら 『データアーキテクト』を目指す。 #TechMar © 2020 cyber communications inc. All Rights Reserved.

61.

データは増え続けていくため、この仕事に終わりはない。

62.

データ整備人の終わりなき奮闘記

63.

Special Thanks 63 • SRE Loungeの皆様 https://sre-lounge.connpass.com/ • データ分析とインテリジェンス(前向きデータ整備人)の皆様 https://analytics-and-intelligence.net/ • 弱々エンジニア会の皆様 https://qiita.com/organizations/yowayowa-engineer?page=1 #TechMar © 2020 cyber communications inc. All Rights Reserved.

64.

EOF #TechMar © 2020 cyber communications inc. All Rights Reserved.