ヤフートップページでの機械学習#yjdsw1

>100 Views

December 21, 15

スライド概要

http://yahoo-ds-event.connpass.com/event/21903/

profile-image

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

公開 ヤフートップページでの 機械学習 ヤフー株式会社 D&S統括本部サイエンス本部サイエンス1部コマースサイエンス2 深澤 良介

2.

自己紹介 公開 深澤良介 • 2009年新卒入社 • 自然言語処理と機械学習のバックグラウンド • 情報検索とレコメンデーションのプロジェクト を渡り歩いてきました Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 2

3.

公開 スマホのトップページは 今年生まれ変わりました! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 3

4.

公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 4

5.

サービスの規模 公開 • デイリーユニークブラウザ数: 5000万 UB※1 (下記含めスマホブラウザ+アプリ合算の値) • ピーク時リクエスト数: 数千 req/s • 推薦対象の記事数: 数万 documents ※1:決算説明会 - 決算説明会資料 - IRアーカイブス - IR情報 - ヤフー株式会社 http://ir.yahoo.co.jp/jp/archives/present/2015q2/index.html Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 5

6.

公開 機械学習はどこに活かされている? Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 6

7.

公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 7

8.

公開 “あなたへのおすすめ” として 影響力の大きい記事 パーソナライズされた記事 を推薦 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 8

9.

機械学習の応用先 • • • • • 公開 推薦する記事のパーソナライズ 影響力の大きい記事の推定 記事のPV予測 重複記事判定 画像クロッピング Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 9

10.

推薦する記事のパーソナライズ 公開 • ユーザの行動ログを利用 • • • ヤフーニュース閲覧履歴 検索キーワード etc. • ユーザの興味に合致する記事を選び、 CTR を最適化するよう学習 ゲーム情報で一杯に! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 10

11.

影響力の大きい記事の推定 公開 • 過去ヤフートピックスで選ばれた記事データを 元に、今入稿された記事が選ばれるかどうかを 推定 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 11

12.

記事のPV予測 公開 • 記事情報を元にPVの推定を行い、 PVの入稿後実績を利用して修正が入るように RNN を構築 • 推定が難しい外部要因などにも上手く追従 ※ 縦軸: pvの自然対数値 横軸: 入稿後経過時間(hour) Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 12

13.

重複記事判定 公開 • 当初は記事タイトルのコサイン類似度での判定 • 言い換え表現なども多く、表層表現では限界 • AutoEncoder を使った NN を構築、 予め付与されている記事カテゴリを判別できる よう学習し、文書ベクトルを獲得 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 13

14.

画像クロッピング 公開 • トップページのUIに合わせた サムネイル切り出し • 顔検出、顕著性の検出を行っている (C) Aflo Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 14

15.

まとめ 公開 • 大きなUI変更に伴い、トップページは サイエンス部の技術力を活用したサービスに! • 国際学会で取り上げられているような先端技術 も追いつつ、実サービスへの応用も進んでます (進行中、国際学会発表を目指すものも) Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 15

16.

公開 詳細はこのあとの懇親会で! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 16