YJTC18 D-4 AnnexML: 近似最近傍検索を⽤いたextreme multi-label分類の⾼速化

159 Views

January 29, 18

#Extreme Multi-label Classification #AnnexML #Approximate Nearest Neighbor Search #Recommendation System #Machine Learning

スライド概要

Yahoo! JAPAN Tech Conference 2018 D-4 セッションのスライドです。

Yahoo!デベロッパーネットワーク

@ydnjp

スライド一覧

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで

Yahoo!デベロッパーネットワーク 195.4K

ゼロから始める転移学習

Yahoo!デベロッパーネットワーク 92.5K

ヤフーにおける WebAuthn と Passkey の UX の紹介と考察 #idcon #fidcon

idcon fidcon

Yahoo!デベロッパーネットワーク 83.5K

OpenID Connectとネイティブアプリを取り巻く仕様と動向 Yahoo! JAPANの取り組み #openid #openid_tokyo

openid openid_tokyo

Yahoo!デベロッパーネットワーク 65.8K

運用業務とスクラムは本当に組み合わせにくいのか︖運用業務が大半を占めるプロダクト開発での試行錯誤

devsumi

Yahoo!デベロッパーネットワーク 44K

ZAP - ZCPをベースとしたマルチK8sのアプリケーション実行基盤 #YJTC / YJTC21 B-3

yjtc

Yahoo!デベロッパーネットワーク 34.3K

各ページのテキスト

AnnexML: 近似最近傍検索を用いた Extreme Multi-label分類の高速化田頭幸浩

自己紹介 • 田頭幸浩（たがみゆきひろ） • 機械学習技術の実サービス適用およびそのための技術開発

取り組む問題とその背景

背景 • ヤフーのサービスの様々な場所で、機械学習技術を用いたレコメンデーションやランキングが行われている例：スマホ版トップページレコメンドされたニュース記事インフィード広告

背景 • ユーザー体験を損なわないように、限られた時間の中で、大量の候補の中からユーザーにマッチしたアイテムを選択することが求められる各リクエストに対し 10〜100ミリ秒程度で応答幅広い層のユーザー集合アイテムの候補数は 1000万から数億にも

よく用いられるシステム構成 • 学習済みモデルと検索インデックスを組み合わせることで、膨大な候補の中から予測スコアが高い少数のアイテムを高速に取得可能レコメンドモデルの学習検索インデックスの構築高速な応答が可能なレコメンドエンジン

よく用いられるシステム構成の課題 • 2段階の最適化で、精度と速度を担保しているので、どちらの点でもベストとは言えない最適化1（精度）最適化2（速度）レコメンドモデルの学習検索インデックスの構築高速な応答が可能なレコメンドエンジン

より良いシステム構成 • 予測モデルの学習と検索インデックスの構築を同時に行うことで、精度と速度のさらなる最適化が行えるようにしたい統合された最適化学習と構築を同時に行うさらに高精度かつ高速なレコメンドエンジン

Extreme Multi-label分類と AnnexML

10.

Extreme Multi-label分類 • Extreme multi-label分類は、膨大な候補の中から当てはまるものを選択する問題 • レコメンデーションやランキングもこの問題と見なすことができるので、以降はレコメンデーションの例で説明例：Wikipediaのページにカテゴリを付与 • • • Machine learning Cybernetics Learning 数十万の候補

11.

AnnexML • AnnexMLはk近傍法によるextreme multi-label分類器 • Approximate Nearest Neighbor Search for Extreme Multi-label Classification レコメンド対象のユーザー探索推定興味が既知のユーザーの中で行動履歴が似ているユーザー（k=3の例）

12.

AnnexML • 既存手法のSLEECをベースに、学習および予測時にグラフ構造を用いることで予測精度と速度の両方を改善レコメンド対象のユーザー探索推定興味が既知のユーザーの中で行動履歴が似ているユーザー（k=3の例）

13.

予測速度と精度の比較予測精度の向上予測速度の向上 +30%の精度向上 58倍の高速化

14.

AnnexMLの構造 Coarse Partitioner Tree Graph Tree Graph Tree Graph • Coarse Partitionerを用いてクエリが含まれるpartitionを判定 • Treeインデックスを用いて近似的に近傍点を獲得 • Graphインデックスを用いて近似精度を高める（局所探索）

15.

学習方針 • 行動履歴をもとに計算される類似度関数の値が、似た興味を持つユーザー間で高くなるようにしたい学習予測推定類似度高類似度高

16.

学習方法の概要 • Coarse Partitionerの学習 • 興味が似たユーザーが同じpartitionに入るようにしたい • 特徴量空間上でのグラフカット問題として定式化 • FTRL-Proximalアルゴリズムでマルチクラス分類器を学習 • 各partition内での学習 • 似た興味を持つユーザーの類似度が高くなるようにしたい • グラフ構造上でのランキング問題として定式化 • AdaGrad+SGDで類似度関数内の射影行列を学習

17.

実験結果：予測精度の比較

18.

実験結果：予測速度の比較

19.

手法と実験結果の詳細は論文にて https://dl.acm.org/citation.cfm?id=3097987

https://dl.acm.org/citation.cfm?id=3097987

20.

OSSとしてコードを公開 https://github.com/yahoojapan/AnnexML

https://github.com/yahoojapan/AnnexML

21.

まとめ • ユーザー体験向上のために、高速かつ高精度なレコメンデーションやランキング技術が不可欠 • 機械学習モデルの学習と検索インデックスの構築を統合した AnnexMLを開発した • 既存手法のSLEECと比較して、速度で58倍、精度で+30%程度の性能向上を達成した

22.