ストーリーコンテンツに対するネタバレの基礎調査とその判定手法の検討

1.2K Views

November 11, 15

#ネタバレ #アニメ #放送時間 #ネタバレ防止 #SNS

スライド概要

アニメやドラマなどのストーリーコンテンツに関してSNSで発信されるネタバレ情報は,本来作品を通して体験するはずだった興奮や感動的な体験を無くしてしまうものである.そこで本研究では,ストーリーコンテンツに限定し, ネタバレ情報を遮断する手法の検討を行う.ここでは人々が特に致命的なネタバレであると考えるものを調査し,そこからネタバレ情報をカテゴリ分けした.また,この各カテゴリに対するSVMでのネタバレの推定可能性について実験を行い,明らかにする

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 31.7K

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

Nakamura Laboratory (Meiji University) 24.3K

手書きとフォントの文字形状の違いによる記憶効果の比較

Nakamura Laboratory (Meiji University) 20.9K

Make-up FLOW 2.0: 美容系YouTuberの化粧フローチャートの共有・取り入れ手法

化粧メイク化粧工程フローチャート美容系youtuber 取り入れ

Nakamura Laboratory (Meiji University) 17.3K

周辺視野における妨害刺激の減衰が集中度に及ぼす影響

Nakamura Laboratory (Meiji University) 17.1K

ComiQA: A Comic Quiz Sharing Service that Helps Users to Recollect the Content of Previous Volumes

comic manga recollection qa service

Nakamura Laboratory (Meiji University) 17.3K

各ページのテキスト

ストーリーコンテンツに対するネタバレの基礎調査とその判定手法の検討田島一樹(明治大学総合数理学部B3) 中村聡史(明治大学総合数理学部, JST CREST)

本研究での貢献１. 放送時間差によって視聴者の70%はネタバレをされてしまう可能性があることが明らかに２. アニメのネタバレを345件収集、それらを12種類にカテゴリ分けし、その中から「正体・生死・勝敗人物特徴」に関する情報を致命的なネタバレとする３. 勝敗のネタバレの推定は容易であり、正体のネタバレの推定は困難であることが明らかに

背景・気になっていた黒幕の正体に関する情報をネット上で発見してしまった・登場人物が死ぬかどうかのハラハラする展開だったのに次回予告で結末が分かってしまう嘘でしょ！？〜が犯人！？【悲報】〜が黒可愛い顔してなんてことを… まだそこ見てない！！！💢 ネタバレ防止の必要性が生じている！！

Twitter上のネタバレ・リアルタイムでアニメを見ながら実況する人 →Twitterに突然アニメのネタバレが流れてくる例）アニメの出来事に対する投稿

考えられる対策① ・そもそも番組を観るまではTwitterなどのSNS を使わない Twitterは友人・知人とのコミュニケーションや情報収集(ニュースなど)のためのツールとして必要不可欠なので非現実的

考えられる対策② ・ハッシュタグ付きの投稿をブロック・何の話題か明示・他の投稿も検索可能ハッシュタグを付けずに投稿する人も多く、不完全

考えられる対策③ The Twitter Mute Button[Golbeck 2012] •海外における時差によって生まれるTwitter上でのネタバレを問題に •スポーツやドラマに関する投稿内の単語を登録し、それらが含まれる投稿をミュートすることでネタバレを防止ネタバレでない投稿までブロックする例）ドラマの放送が (放送中の地域) 始まると… まさか〜が生きてた →日常的なコミュニケーションまで妨げ (未放送の地域) 時差３時間られてしまう可能性が高いネタバレがTwitter に投稿されてる… なんて！！！！

ネタバレに対する反応個人的な事情放送局毎の放送日時の違い

研究目的１. 放送時間差によりネタバレされる可能性がある視聴者の規模を明らかにする２. アニメにおける致命的なネタバレを明らかにする３. 致命的なネタバレの判定がどの程度できるかを明らかにする

10.

１. 放送時間差によりネタバレされる可能性がある視聴者の規模の調査

11.

放送時間差の原因・アニメ番組は深夜帯に放送されるため、放送局による放送時間のバラつきが多い・番組を放送する局が少ない地域が存在する

12.

調査方法・アニメ20本(2015年放送開始)を無作為に選定・各アニメの番組名・放送局・放送時間を取得・放送局が放送する地域の世帯数を取得例）番組名：俺物語！！日本テレビ：04/08(水) 25:29〜ミヤギテレビ：04/17(金) 25:57〜世帯数：90.2万世帯など

13.

調査結果リアルタイム放送：2133万世帯放送時間差あり：4984万世帯ネタバレをされる可能性のある視聴者は全体の70%

14.

岐阜県高山市の場合リアルタイムで放送しないアニメ (2015年6、7月放送開始) →11個のうち5個平均3.6日遅れ

15.

２. ストーリーコンテンツにおける致命的なネタバレとは？

16.

ネタバレの基礎調査・ネタバレの収集・ネタバレ投稿サイト(http://netabare.meguri.org/) と学生100名以上に対するアンケート結果を利用・126個のアニメにおけるネタバレを345件収集・収集したネタバレの分析投稿されたネタバレの例・分析の結果、下の12種類のカテゴリのように分類。・巨人に食べられたエレンは生きてたそれぞれの投稿件数をカウント (進撃の巨人) ・フリーザがサイボーグ化して復活正体/生死/人間関係/人物特徴/仕掛け/目的/ (ドラゴンボールＺ) 勝敗/問題発生/過去/登場/地位・権力/作品の展開

http://netabare.meguri.org/

17.

各カテゴリの投稿数

18.

４カテゴリ正体生死これら４つのカテゴリを致命的なネタバレとして判定対象に！！勝敗人物特徴

19.

３.致命的なネタバレの判定がどの程度できるのか？

20.

評価用データセット構築・カテゴリごとに4作品ずつ選定例）コナン→主人公が犯人を暴く・アニメに対するハッシュタグの指定し、各作品のツイートを収集 #conan, #jojo̲animeなど・著者が各カテゴリに該当するネタバレかそうでないかを分類し、投稿にフラグ付け

21.

判定の手順ネタバレとなる投稿→正例ネタバレにならない投稿→負例 1. 正例、負例に分類したツイートを単語ベクトル化 2. 各カテゴリにおけるSVMの分類器を作成し、ネタバレかどうかの判定をする

22.

単語ベクトルの生成・収集したツイートを形態素解析(Mecabを使用) ・形態素に対しIDを割り当て、１行内での出現回数を記録

23.

単語ベクトル生成手法・単語ベクトルの生成時に形態素の処理を行うによって精度の向上を図る３つの手法を提案・ベースライン手法・正規化手法・人物名の一般化手法

24.

ベースライン手法・品詞は名詞、動詞、形容詞、副詞、連体詞の５つを利用・活用形のある単語は全て原形に置換例）死な死に死ぬ死ぬ

25.

正規化手法 Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! [Brody 2011] ・投稿者が自身の感情の強さを表すために一部が連続している単語を原形に戻す手法を提案連続している文字１文字に置換「！！！！！」「！」「やったあああ」「やったあ」「wwww」「w」

26.

人物名の一般化手法・登場人物名が作品や話数ごとに大きく異なる主要人物・ヤムチャ敗れる！！！(ドラゴンボール) 主要人物・ジョジョ敗れる！！！(ジョジョの奇妙な冒険) 登場人物名を一般的な語に置換悟空、ベジータ、フリーザウーロン、ランチ、ゴズ「主要人物」「モブ」

27.

評価実験・各カテゴリで選定した４つのアニメの内３つを学習用、残り１つを評価用に・４回検定を行い推定平均を出す (4-Fold Cross-Validation) 例）正体に関するネタバレなら推定精度を算出学習用評価用

28.

判定精度の算出評価尺度は適合率、再現率を利用再現率適合率

29.

結果（適合率）

30.

結果（再現率）

31.

判定しにくい投稿例・正体スパイ、ストーカー、被害者だった・生死良い奴だったよ…、タフすぎるw ・勝敗敗因、サヨナラホームラン・人物特徴パワーアップ、〜モード

32.

結果・正体に関するネタバレは判定しづらい・特徴語となる人物の正体にあたる単語 (特に名詞)が作品ごとに異なることが多い・勝敗に関するネタバレは判定しやすい・事実の表現のバリエーションが少ない

33.

考察・人物名の一般化手法ではキャラクターの名前以外のあだ名も網羅することによって精度の向上が期待できる・ネタバレとなる投稿に特有な単語が話数ごとに異ならないようにカテゴリ分けを工夫すると高い再現率が期待できる

34.

今後の課題・データセット構築の見直し・著者以外の者との協力・データ数を増やす・精度の低かったカテゴリ分けの見直し・扱うストーリーコンテンツの量を増やす・再現率の向上・ネタバレ防止のシステムの実装を想定

35.

システム実装の想定本研究での評価用データセットネタバレ(アニメ)となる投稿：ネタバレでない投稿＝１：１ネタバレとなる投稿：通常の投稿＝？：？実際のTwitter上における割合で判定精度を算出

36.

まとめ・放送時間を考慮したネタバレの防止が必要であることが明らかに・人々は正体、生死、勝敗、人物特徴に関する情報を致命的なネタバレと見なしている可能性が高いことが明らかに・話数が異なっても特徴となる単語が似通うカテゴリは判定しやすく、逆の場合は判定しづらい