[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach(KDD 2021)

>100 Views

March 25, 22

スライド概要

2022/03/25
Deep Learning JP:
http://deeplearning.jp/seminar-2/

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach (KDD, 2021) Kazuki Fujikawa 1

2.

サマリ • 書誌情報 – Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach (KDD, 2021) • 著者 – Zhao Li, Haishuai Wang, Peng Zhang, Pengrui Hui, Jiaming Huang, Jian Liao, Ji Zhang, Jiajun Bu • 概要 – ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介 • ユーザ・配信者・商品の関係性をグラフ化し、モデリング – 不正検知の実験において、本手法の有効性を確認 • • ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認 ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施 2

3.

アウトライン • • • • 背景 関連研究 提案手法 実験・結果 3

4.

アウトライン • • • • 背景 関連研究 提案手法 実験・結果 4

5.

背景 • ライブ配信で商品販売するプラットフォーム(e.g. Taobao)が流行 – トラフィックやLikeを機械的に増やすことで、不正な ランキング操作などが行われている • 従来のグラフ異常検知モデルはユーザ・商品の 二者を扱うアプローチが多い – ライブ配信商品販売には、ユーザ・商品に加えて 配信者という役割が存在 ユーザ・商品・配信者の3者を扱うグラフ異常検知モデルを開発したい 5

6.

アウトライン • • • • 背景 関連研究 提案手法 実験・結果 6

7.

関連研究 • Graph Attention Networks(GAT)[Velickovic+, ICLR2018] – 周囲のノードと対象ノードとの関連性で重みづけてMessage Passing • – Attentionの計算はノード・結合の種類に寄らず、一様に計算する 7

8.

関連研究 • Heterogeneous Graph Transformer(HGT)[Hu+, WWW2020] – ノード埋め込みベクトルの写像関数をノード種毎に変更(K-Linear, Q-Linear, ALinear) – Attention計算を結合種毎に変更( ) – Transformerと同様、Key, Value, Queryに分割、MultiHeadでAttention計算 8

9.

アウトライン • • • • 背景 関連研究 提案手法 実験・結果 9

10.

提案手法 • ユーザ・配信者・商品の情報をグラフ化 – ユーザ⇔配信者 • • 配信者に対するアクションの有無で結合を決定(e.g. like, buy) like数・buy数を結合特徴量として利用 – 配信者⇔商品 • • 配信者が紹介した商品に対して結合を生成 紹介数を結合特徴量として利用 – ユーザ⇔ユーザ • 同一の配信者から購入している場合、隣接ノードとして考える – 商品⇔商品 • 同一の配信者が紹介している商品を隣接ノードとして考える – 配信者⇔配信者 • 同一のユーザ・商品と結合関係にある配信者を隣接ノード として考える 10

11.

提案手法 • ユーザノード埋め込み – 隣接ユーザの埋め込みベクトルを取得 • 結合埋め込み(like数・buy数等)をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 u u1‘ u‘2 s 11

12.

提案手法 • 配信者ノード埋め込み – 隣接配信者の埋め込みベクトルを取得 • 結合埋め込み(ユーザ: like数・buy数、商品: 紹介数等)をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 u s s s i 12

13.

提案手法 • 商品ノード埋め込み – 隣接商品の埋め込みベクトルを取得 • 結合埋め込み(紹介数等)をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 s i i i 13

14.

提案手法 • 以下を入力にWide-and-Deep構造の二値分類モデルで不正を検出する – 各トランザクションに関連するノード・結合のembedding – トランザクションに直接関連する特徴量 14

15.

アウトライン • • • • 背景 関連研究 提案手法 実験・結果 15

16.

実験 • データセット: Taobao Live – ユーザ・配信者・商品の3種で構成されたグラフデータ • • • 各ノードには属性が存在 – ユーザ(登録情報)、配信者(配信時間帯)、商品(価格・過去の販売数)等 各結合は以下で定義し、回数などの属性を持つ – ユーザ⇔配信者(Like・フォロー・購入)、ユーザ⇔商品(購入)、配信者⇔商品(宣伝)等 購入トランザクション – 注文時間・IP・価格・支払い方法 • データ分割 – 以下の要領で、不正検知対象のトランザクション発生前の時点でグラフを固定 • • Train: 1週間のユーザ行動(472万ユーザ・12万配信者・117万商品) Test: 1週間のユーザ行動(486万ユーザ・12万配信者・126万商品) 16

17.

実験 • 実験結果 – 提案法: LIFEがAUC, F1, Precision, R90Pでベースラインを上回る結果を確認 • • • vs HGT: 性能向上は結合特徴の導入有無の影響 vs GCN, GAT: 均質なグラフを想定した手法であり、異種グラフへの拡張が困難 vs HAN, HetGNN: GNNの重み行列がノード種・結合種で区別していない点の影響が大きい – 今回のタスクではノード種・結合種で次数などの特性が大きく異なるため、その影響の可能性 17

18.

実験 • ケーススタディ – 検出された不正ユーザを基に、不正コミュニティを探索を実施 • 不正ユーザの地理的な分布を分析した所、一部の地域にクラスターを作っていることを確認 (下図左右) – 実際に検出された不正コミュニティが下図右 • • • 17人のユーザ、56人の配信者に対し、828本のエッジが貼られている 13人のユーザが同じIPアドレスを共有 多数のデバイスで偽のトラフィックを発生させ、ランキング操作されている 18

19.

まとめ • ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介 – ユーザ・配信者・商品の関係性をグラフ化し、モデリング • 不正検知の実験において、本手法の有効性を確認 – – ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認 ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施 19

20.

References • Li, Zhao, et al. "Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach." In KDD 2021. • Velickovic, Petar, et al. "Graph attention networks." In ICLR 2018. • Hu, Ziniu, et al. "Heterogeneous graph transformer." In WWW 2020. 20