広告における機械学習の適用例とシステムについて

>100 Views

September 15, 17

スライド概要

profile-image

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

広告における機械学習の適用例と システムについて 2017年9月15日 濱田健宏 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

2.

もくじ • • • • • 2 自己紹介 プロダクト概要 機械学習の適用例 システム概要 まとめ Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

3.

自己紹介 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

4.

自己紹介 濱田 健宏(はまだ たけひろ)  経歴 • 2008-2014(ソニー株式会社) 画像処理・認識アルゴリズムの研究開発 • 2014-(ヤフー株式会社) モデリングシステムの開発・運用・ロジックチューニングなど  所属 • マーケティングソリューションズカンパニー データ事業推進本部  担当プロダクト • セグメンテーションツール、プラニングツール 4 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

5.

プロダクト概要 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

6.

セグメンテーションツール • • 社内外のデータからユーザーセグメントを抽出 広告配信やプランニングに活用 Ex) 新築マンションの訴求 => 「新築 マンション 東京」と検索したユーザーセグメント ヤフーサービスログ YDD/YAD PF クライアントサービスログ 6 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ユーザーセグメント

7.

機械学習の適用例 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

8.

ユーザーセグメント抽出の課題 • 最適な抽出条件を人が考えるのは限界がある Ex) 新築マンションの訴求 => 「新築 マンション 東京」 and 年収 and 地域 and … • 8 定量的な指標から抽出条件を最適化 => 機械学習 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

9.

問題設定を考える  目的をデータで表現できるように近似 • 新築マンションの訴求 => 新築マンションの資料請求をするユーザーを 増やす  問題設定 • 新築マンションの資料請求をするか否かの2値分類  学習データ • • 正例:新築マンションの資料請求をしたユーザー 負例:正例以外のヤフーユーザー => 精度が悪いケースが多い 9 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

10.

問題を分解する  正例:(n日前に)新築マンションの資料請求をしたユーザー • nが小さいユーザー => ダイレクトレスポンス 効きそうな特徴量:「新築 マンション 東京」と検索 and 年収 and 地域 and … • nが大きいユーザー => ブランディング 効きそうな特徴量:年収 and 地域 and … => 性質が異なるユーザーが混ざっている  目的をダイレクトレスポンスに絞って考える 10 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

11.

問題設定再考  目的をデータで表現できるように近似 • 2日後に新築マンションの資料請求をするユーザーを増やす  問題設定 • 2日後に新築マンションの資料請求をするか否かの2値分類  学習データ • 正例:2日前に新築マンションの資料請求をしたユーザー • 負例:正例以外のヤフーユーザー => 精度が悪いケースが少ない 11 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

12.

システム概要 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

13.

要件 • • • • 13 前述の問題設定の範囲で正例条件を任意に設定 システムの利用者は、一般ユーザー(≠モデラー) • 正例条件は利用者が設定 10-30 モデル / 日 程度を作成 当日に登録したモデルを翌日朝までに作成 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

14.

システム     14 正例負例抽出 • 正例の条件は利用者が設定 • 負例はYJユーザーから一様サンプリング • Hive処理 特徴量抽出 • 特徴量は検索、流出、PV、属性データなど利用 • Hive処理 モデル学習 • 学習器は木構造、boosting • Mapreduce処理 オフライン評価 • クロスバリデーション • ランダムと比較した場合のLift値を精度として利用者に提示 • Mapreduce処理 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

15.

利用者からの問い合わせ 配信結果が良くない  目的と問題設定があっていないケース • Ex) クレジットカードの申込でモデル作成したが、 審査に落ちる人に多い => 正しい問題設定は、クレジットカードの審査通過したユーザー  正例数が少ないケース • 正例条件を見直して数を増やす • ロジックの改良。半教師あり学習やランク学習を検討 • とはいえ、数が少ないと難しいので、 配信初期は機械学習に頼らないで人が考えることも重要 15 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

16.

まとめ Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.

17.

まとめ  広告における機械学習の適用例 • 問題設定が重要  汎用的なモデリングシステムの難しさ • ある程度は個別に調査が必要 • 正例数が少ないと難しいので、 配信初期は機械学習に頼らないで人が考えることも重要 17 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.