Twitterにおけるアニメのネタバレ防止手法の提案

2K Views

March 16, 16

#アニメ #ネタバレ #Twitter #機械学習 #単語ベクトル

スライド概要

アニメのネタバレは視聴者の楽しむを奪う悩ましいものである．本研究ではTwitterのアニメのネタバレ防止を目的としており，ネタバレツイートを判定するために有効な事前処理と単語ベクトル手法を明らかにする．

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 31.7K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 24.3K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 20.9K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 17.3K

ComiQA: A Comic Quiz Sharing Service that Helps Users to Recollect the Content of Previous Volumes

comic manga recollection qa service

Nakamura Laboratory (Meiji University) 17.3K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 17.1K

各ページのテキスト

Twitterにおけるアニメのネタバレ防止手法の提案田島一樹(明治大学総合数理学部B3) 中村聡史(明治大学総合数理学部, JST CREST)

みなさんはネタバレをされた経験ありませんか？

ネタバレとは LAWSON ©遊☆戯☆王

新聞の記事でネタバレ LAWSON http://buzz-plus.com www.disney.co.jp 著作者:lwpkommunikacio

http://buzz-plus.com

Twitterでネタバレ LAWSON ©名探偵コナン ©僕だけがいない街 ©ドラゴンボール

Twitterでネタバレ LAWSON ©名探偵コナンお気に入り作品のネタバレを絶対に知りたくない人は多くいる ©僕だけがいない街 ©ドラゴンボール

Twitterでネタバレ LAWSON ©名探偵コナンお気に入り作品のネタバレを絶対にネタバレ防止研究には需要があり，知りたくない人は多くいる盛んになりつつある! ©僕だけがいない街 ©ドラゴンボール

d背景放送時間差によってアニメのネタバレをされる可能性のある視聴者は全体の70%[田島 2015] 例) www.tvq.co.jp ネタバレ s.mxtv.jp 福岡では平均2.5日遅れで放送

d背景放送時間差によってアニメのネタバレをされる可能性のある視聴者は全体の70%[田島 2015] 例) Twitterで起こるネタバレ防止が必要ネタバレ www.tvq.co.jp s.mxtv.jp 福岡では平均2.5日遅れで放送

10.

関連研究 LAWSON The Twitter Mute Button[Golbeck 2012] ・海外においてもTwitterでのネタバレが問題に・特定のスポーツやドラマに関する全てツイートの遮断を目指すドラマの放送開始時 (放送開始) まさか〜が生きてたなんて！！！！ (未放送) ネタバレがTwitter に投稿されてる… 時差３時間

11.

関連研究 LAWSON The Twitter Mute Button[Golbeck 2012] ・海外においてもTwitterでのネタバレが問題に・特定のスポーツやドラマに関する全てツイートの遮断を目指すドラマの放送開始時 (放送開始) ネタバレでない投稿の誤検知が多いまさか〜が生きてたなんて！！！！ →日常的なコミュニケーションまで遮断 (未放送) ネタバレがTwitter に投稿されてる… 時差３時間される可能性が高い

12.

å本研究の目的 Twitterでのアニメのネタバレを防止する・ネタバレを機械学習により判定する際に有効な事前処理と単語ベクトル生成手法を明らかにする・ネタバレ判定を同一作品内で行った場合とジャンル分けして行った場合のそれぞれの判定のしやすさ，しにくさなどを明らかにする

13.

提案手法事前処理正規化人物名一般化組み合わせ単語ベクトル生成形態素解析 or 係り受け解析 SVMを用いた機械学習によるネタバレツイート判定

14.

提案手法事前処理正規化人物名一般化組み合わせ単語ベクトル生成形態素解析 or 係り受け解析どの事前処理と単語ベクトル生成手法の SVMを用いた機械学習組み合わせが判定に有効か比較，検証によるネタバレツイート判定

15.

事前処理・ベースライン手法：ツイートをそのまま使用・正規化手法勝ったぞおおお!!!!!!! 勝ったぞおおおおおお!! 統一勝ったぞお! ・人物名一般化手法城之内死す→重要人物死す牛尾死す→モブ死す・正規化，人物名一般化組み合わせ手法上記２つの手法の処理を同時に実行

16.

形態素解析，係り受け解析形態素解析係り受け解析

17.

形態素解析，係り受け解析形態素解析係り受け解析

18.

形態素解析，係り受け解析形態素解析係り受け解析単語ベクトル犯人の/正体は/主人公が/駅前で/会った/おじさんだった/ 犯人の正体は/正体はおじさんだった/主人公が会った/ 駅前で会った/会ったおじさんだった

19.

番組連動ツイート収集と分類 › 12話 ✖ 3000 ✖ 3人 = 件 108000 件 ① アニメ12話選定 ② 実況ツイートを放送開始から終了まで取得 ③ 1話につき3000件のツイートをランダムで選定 ④ 3人の評価者がネタバレかどうか分類

20.

データセット構築 Twitterにネタバレが含まれていることを想定したデータセット・ネタバレツイート(正例) 評価者の2/3以上がネタバレと判定したツイート・一般ツイート(負例) StreamingAPIでアニメ放送時間外に全ツイートからランダムに取得したもの

21.

データセット分類・同一作品データセット作品ごとに特有な語があるという問題 ◦1種類の作品・ジャンル別データセットアニメジャンルによってどのような出来事がネタバレになるのか異なるという問題 ◦バトル系作品 ◦ミステリー系作品それぞれのデータセットごとに評価実験を行う

22.

評価実験同一作品過去の話で学習し，最新話のネタバレ判定学習用判定用学習用学習用判定用 anime-charlotte.com

23.

ジャンル別データセット

24.

評価実験バトル系，ミステリー系 4話中3話を学習に利用し，残った１話のネタバレを判定 ◦4話分のアニメについて判定し平均精度を算出ネタバレ判定学習モデル ©ワンパンマン ©遊☆戯☆王ARC-V ©fate/stay night ©黒子のバスケ

25.

結果（同一作品：形態素解析）適合率再現率適合率が高く，ネタバレの誤検知が少ない

26.

結果（同一作品：形態素解析）適合率再現率 4話と7話の展開が異なるため再現率が低い

27.

結果（同一作品：係り受け解析）適合率再現率係り受け解析では少ないデータで多くの単語ベクトルを生成でき，再現率が高い

28.

結果（同一作品：係り受け解析）適合率再現率ストーリーが進むにつれて展開が異なってくるため判定が難しくなった

29.

結果（バトル系）適合率再現率「勝った」「死んだ」といった語が共通して頻出し，再現率がかなり高い

30.

結果（ミステリー系）適合率再現率ミステリーではトリックや作品特有語が多様であり，再現率がかなり低い

31.

考察 LAWSON ・形態素解析よりも係り受け解析のほうが少ないデータで多くの単語ベクトルを作成でき，再現率が高かった・バトル系では「死んだ」「勝った」などの語が頻出したため再現率が高く，ミステリー系ではトリックなどのバリエーションが多いため再現率が低かった・登場人物名を一般化し，一般ツイートには含まれない単語ベクトルを作成したことで精度が向上

32.

s判定失敗ツイートの特徴同一作品バトル系ミステリー系キャラの正体キャラの特徴の変化キャラの正体キャラの特徴の変化例）記憶喪失，病んでるユーザ自身の感情表現例）やったあああああトリックに関する情報共通して判定失敗作品に特有な語，専門用語登場人物名と記号（絵文字）の組み合わせ例）城之内〜(T ^ T)(T ^ T) キャラ名が名称に置き換えられている例）博士，妹

33.

今後の展開 LAWSON 判定性能の向上・作品ごとの特有語をパターンマッチ・重要人物を男女区別可能に・ネタバレデータセットの拡張

34.

まとめ LAWSON ・Twitterのネタバレ判定には人物名一般化手法を利用し，かつ係り受け解析することが必須・同一作品内のネタバレは判定しやすいが，急展開後や1話目の判定が困難・バトル系のネタバレ判定はしやすいが，一方でミステリー系のネタバレ判定は困難