[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach（KDD 2021）

>100 Views

March 25, 22

#deep learning #グラフニューラルネットワーク #詐欺検出 #ライブストリーミングプラットフォーム #異種グラフ #不正行為

スライド概要

2022/03/25
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 92.7K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 71.9K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 61.6K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 55.4K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 52.3K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 50.5K

各ページのテキスト

Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach (KDD, 2021) Kazuki Fujikawa 1

サマリ • 書誌情報 – Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach (KDD, 2021) • 著者 – Zhao Li, Haishuai Wang, Peng Zhang, Pengrui Hui, Jiaming Huang, Jian Liao, Ji Zhang, Jiajun Bu • 概要 – ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介 • ユーザ・配信者・商品の関係性をグラフ化し、モデリング – 不正検知の実験において、本手法の有効性を確認 • • ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施 2

アウトライン • • • • 背景関連研究提案手法実験・結果 3

アウトライン • • • • 背景関連研究提案手法実験・結果 4

背景 • ライブ配信で商品販売するプラットフォーム（e.g. Taobao）が流行 – トラフィックやLikeを機械的に増やすことで、不正なランキング操作などが行われている • 従来のグラフ異常検知モデルはユーザ・商品の二者を扱うアプローチが多い – ライブ配信商品販売には、ユーザ・商品に加えて配信者という役割が存在ユーザ・商品・配信者の3者を扱うグラフ異常検知モデルを開発したい 5

アウトライン • • • • 背景関連研究提案手法実験・結果 6

関連研究 • Graph Attention Networks（GAT）[Velickovic+, ICLR2018] – 周囲のノードと対象ノードとの関連性で重みづけてMessage Passing • – Attentionの計算はノード・結合の種類に寄らず、一様に計算する 7

関連研究 • Heterogeneous Graph Transformer（HGT）[Hu+, WWW2020] – ノード埋め込みベクトルの写像関数をノード種毎に変更（K-Linear, Q-Linear, ALinear） – Attention計算を結合種毎に変更（） – Transformerと同様、Key, Value, Queryに分割、MultiHeadでAttention計算 8

アウトライン • • • • 背景関連研究提案手法実験・結果 9

10.

提案手法 • ユーザ・配信者・商品の情報をグラフ化 – ユーザ⇔配信者 • • 配信者に対するアクションの有無で結合を決定（e.g. like, buy） like数・buy数を結合特徴量として利用 – 配信者⇔商品 • • 配信者が紹介した商品に対して結合を生成紹介数を結合特徴量として利用 – ユーザ⇔ユーザ • 同一の配信者から購入している場合、隣接ノードとして考える – 商品⇔商品 • 同一の配信者が紹介している商品を隣接ノードとして考える – 配信者⇔配信者 • 同一のユーザ・商品と結合関係にある配信者を隣接ノードとして考える 10

11.

提案手法 • ユーザノード埋め込み – 隣接ユーザの埋め込みベクトルを取得 • 結合埋め込み（like数・buy数等）をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 u u1‘ u‘2 s 11

12.

提案手法 • 配信者ノード埋め込み – 隣接配信者の埋め込みベクトルを取得 • 結合埋め込み（ユーザ: like数・buy数、商品: 紹介数等）をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 u s s s i 12

13.

提案手法 • 商品ノード埋め込み – 隣接商品の埋め込みベクトルを取得 • 結合埋め込み（紹介数等）をConcat – HGTと同様、Multi-head Attentionで埋め込みを取得 s i i i 13

14.

提案手法 • 以下を入力にWide-and-Deep構造の二値分類モデルで不正を検出する – 各トランザクションに関連するノード・結合のembedding – トランザクションに直接関連する特徴量 14

15.

アウトライン • • • • 背景関連研究提案手法実験・結果 15

16.

実験 • データセット: Taobao Live – ユーザ・配信者・商品の3種で構成されたグラフデータ • • • 各ノードには属性が存在 – ユーザ（登録情報）、配信者（配信時間帯）、商品（価格・過去の販売数）等各結合は以下で定義し、回数などの属性を持つ – ユーザ⇔配信者（Like・フォロー・購入）、ユーザ⇔商品（購入）、配信者⇔商品（宣伝）等購入トランザクション – 注文時間・IP・価格・支払い方法 • データ分割 – 以下の要領で、不正検知対象のトランザクション発生前の時点でグラフを固定 • • Train: 1週間のユーザ行動（472万ユーザ・12万配信者・117万商品） Test: 1週間のユーザ行動（486万ユーザ・12万配信者・126万商品） 16

17.

実験 • 実験結果 – 提案法: LIFEがAUC, F1, Precision, R90Pでベースラインを上回る結果を確認 • • • vs HGT: 性能向上は結合特徴の導入有無の影響 vs GCN, GAT: 均質なグラフを想定した手法であり、異種グラフへの拡張が困難 vs HAN, HetGNN: GNNの重み行列がノード種・結合種で区別していない点の影響が大きい – 今回のタスクではノード種・結合種で次数などの特性が大きく異なるため、その影響の可能性 17

18.

実験 • ケーススタディ – 検出された不正ユーザを基に、不正コミュニティを探索を実施 • 不正ユーザの地理的な分布を分析した所、一部の地域にクラスターを作っていることを確認（下図左右） – 実際に検出された不正コミュニティが下図右 • • • 17人のユーザ、56人の配信者に対し、828本のエッジが貼られている 13人のユーザが同じIPアドレスを共有多数のデバイスで偽のトラフィックを発生させ、ランキング操作されている 18

19.

まとめ • ライブ配信プラットフォームに対する不正検知を行うGNNアプローチを紹介 – ユーザ・配信者・商品の関係性をグラフ化し、モデリング • 不正検知の実験において、本手法の有効性を確認 – – ユーザ→配信者のLike数などの結合特徴量が精度改善に貢献していることを確認ケーススタディにおいて、不正ユーザから不正コミュニティを探す分析を実施 19

20.

References • Li, Zhao, et al. "Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach." In KDD 2021. • Velickovic, Petar, et al. "Graph attention networks." In ICLR 2018. • Hu, Ziniu, et al. "Heterogeneous graph transformer." In WWW 2020. 20