254 Views
October 07, 15
スライド概要
サッカーの試合を録画して視聴することを楽しみにしているユーザにとって,SNS上で遭遇してしまうサッカーの試合結果を示唆するネタバレ情報は楽しみを減退させる忌むべきものである.本稿では,こうしたネタバレ情報を,単語から直接的に結果がわかる直接的ネタバレと,文脈から間接的に結果がわかる間接的ネタバレとに分類する.また,直接的ネタバレ,間接的ネタバレに関するデータセットを構築し,両者のネタバレの特徴を分析する.
明治大学 総合数理学部 先端メディアサイエンス学科 中村聡史研究室
SNS上でのサッカーの試合 に対する直接的・間接的 ネタバレの分析 白鳥裕士(明治大学総合数理学部3年) 中村聡史(明治大学総合数理学部、JST CREST)
本研究の貢献 • ネタバレの特性に応じてネタバレを定義 o 直接的ネタバレ、間接的ネタバレと定義 • 「直接的」「間接的」のデータセットを構築 o ウェブシステムを用いて分類 • 各ネタバレの分析 o 時間帯ごとに出現しやすいネタバレと出現しにくい ネタバレが存在 o 単語・表現の傾向 直接的: スコア、国名 間接的: 選手名、感情表現
研究背景
研究背景 • スポーツ o 筋書きのないドラマ o ハラハラ感・驚き o SNSでは悪意なく他者と繋がるため実況 されている
研究背景 リアルタイム で見れない 録画 録画視聴 安心してSNSを 使えない! コンテンツに対するコメントが 「ネタバレ」となり得る
研究目的 • SNS上のネタバレを防止したい o SNSを完全に使用しない • コミュニケーションは断ちたくない 直接的ネタバレ・間接的ネタ バレの特徴(パターン)を分析 コミュニケーションは遮断せずに ネタバレとなり得るコメントのみ 遮断したい
関連研究 • ストーリーコンテンツ内のネタバレに関する 単語の調査[前田 ‘15] o ストーリーコンテンツ以外は対象ではない • Twitter上のネタバレコメントを判定する手法 [Golbeck ‘12] o 対象コンテンツに関するツイートを全て遮断するこ とを重要視 • スポーツの結果記述によるネタバレを様々な 提示手法により防止[中村 ‘13] o ネタバレの判定にキーワードマッチングを使用
ネタバレの直接性・間接性 • 直接的なネタバレ: 試合結果や試 合展開が直接書かれているもの • 間接的なネタバレ: 文脈や時間的 要素から結果やスコア情報が読み 取れてしまsうもの
データセット構築 • 収集した試合 o 2014W杯グループリーグ「日本vsコートジボワール」(日 本敗北) o 2015女子W杯準決勝「日本vsイングランド」(日本勝利) o 2015女子W杯決勝「日本vsアメリカ」(日本敗北) • 3試合×1000件をTwitterを普段から用いている10 代から20代の男子大学生8人により分類 3試合 1000 ツイート 8人
データセット構築 選別 収集 • 関連するハッシュ タグを含むもの • 言語コード「ja」に限定 • 試合時間帯のツイートに 限定 • 「RT~~」のツイート を除去 処理 • ハッシュタグの削除
データセット構築 • コメントを「直接的」「間接的」「非ネタバレ」に分類
データセット構築 本田△ ここで決めちゃ うもんな~ 確実に 持ってる!!! 2014-06-15 01:17:11 「直接的」?「間接的」?「非ネタバレ」? 2 6 0
データセット構築 うわーショック過ぎ てうんこ漏れそう… 2014-06-15 03:00:15 「直接的」?「間接的」?「非ネタバレ」? 0 6 2
正解判定手法 • x人中何人の投票で正解とするのか? o 一票以上手法: 誰か一人が評価していたらその ネタバレとする手法 o 満票手法: 満場一致でそのネタバレとする手法 o 1位手法: 最も多くの評価者が評価していたらそ のネタバレとする手法
正解判定手法 • 直: 直接、間: 間接、非: 非ネタバレ コメントa コメントb コメントc 1票以上手法 満票 手法 1位手法 Aさん Bさん Cさん 正解 正解 正解 直 直 直 直 間 直 非 直 間 直 直 非 非 直 直 直,間 直,間,非 直,間,非
1000ツイート×3試合×8人で分類 [3試合平均] 直接的: 238.7件 間接的: 88.3件 非ネタバレ: 697.3件 コメント 投稿日時 分類 本田ゴール‼︎‼︎ 2014-06-15 01:19:01 直接的 前半終了日本1-0コートジボワール 2014-06-15 01:47:16 直接的 日本負けちゃった。。。 2014-06-15 02:55:01 直接的 さすが本田△大舞台に強いな。 2014-06-15 01:19:31 間接的 悔しい…です… 2014-06-15 02:53:45 間接的 ま、次とその次勝てばいいじゃん。 2014-06-15 02:59:57 間接的 さあキックオフ 2014-06-15 01:00:45 非ネタバレ ぬーんやはりパスミスは駄目だわ 2014-06-15 01:22:58 非ネタバレ あばばば 2014-06-15 02:41:29 非ネタバレ
分類結果 • 直接的 o 「◯vs◯」などのスコア情報 o 「ゴール」「負けた」などの特定の単語やパ ターン記述 • 間接的 o 「悔しい」「ショック」などの感情的な単語 o 「本田△」「本田〜!!」などの選手名 o 「次」「切り替え」などの変化への期待
試合経過に対する変化 「日本vsコートジボワール」 「日本vsイングランド」 「日本vsアメリカ」
試合開始~初得点 「日本vsコートジボワール」 「日本vsイングランド」 例:「【JPN 0-0 ENG】」 「日本vsアメリカ」
前半終了~後半初得点 「日本vsコートジボワール」 「日本vsイングランド」 「日本vsアメリカ」
得点後と失点後の比較 「日本vsコートジボワール」 得点後 失点後 「日本vsイングランド」 得点後 失点後
試合経過に対する変化 • 1票以上「間接的」だったら間接的ネタバレであると判定した 「日本vsイングランド」 「日本vsコートジボワール」
前半終了~後半初得点 「日本vsコートジボワール」 「日本vsイングランド」
前半終了~後半初得点(1票以上) 「日本vsコートジボワール」 「日本vsイングランド」
試合経過によるネタバレ傾向 • 前半開始/後半開始~最初のゴール o 直接のみ少量登場 o 間接はほぼ0 • ゴールについて o 得点の場合: それ以降,間接が一定期間登場 o 失点の場合: 間接が一切なくなる(萎えた?)
特徴語 • TF値を算出することによって,ネ タバレごとの特徴語を調査 o 単語分け: MeCab o 品詞: 名詞、形容詞
特徴語 名詞 形容詞 「ゴール」「先制」 直接的 「良い」「悪い」 国名 選手名 「悔しい」「強い」 「次」 「素晴らしい」 間接的
特徴語 • 直接的 o 国名 • 「◯vs◯」などのスコア情報と共起 o 「良い」「悪い」 • 「先制!良い時間帯」「1-0 いいね」 「負けた。○○の悪いところが出た」など、特定のパターン記述 に対する冷静な評価コメント • 間接的 o 感情的な単語、選手名 • 喜び→勝利、悲しみ→敗北 o 変化への期待 • 「次は勝つ」「次も勝つ」など、未来に期待することと現在起 こったことを関連づける語
今後の検討 • 間接的ネタバレの特徴を考慮したネタバレ防止手法の 検討 o 間接的ネタバレにもいくつか特定のパターンが存在し,直接的 ネタバレと同様に判定可能 o 各ネタバレに特化した判定手法を時間帯によって切り替える • データセット構築人数の検討 • 「ゴーーーーーール」「悔しいぃぃぃぃ」 「ほんだぁぁぁぁ」など伸ばされた単語の判定の検討 o Cooooooooooooooollllllllllllll!!!!!!!!!!!!!![Brodyら ‘11] • 対象とする試合数やスポーツの種類の拡張
まとめ • ネタバレに直接的ネタバレ、間接的ネタバレ を定義 • 「直接的」「間接的」のデータセットを構築 o 間接的ネタバレは人によるブレが大きい • 分析結果 o 直接的ネタバレは各ポイントで出現するが、間接的ネ タバレは出現しない区間が存在 o 単語・表現の傾向 直接的: スコア情報、ゴール、勝敗、国名、評価 間接的: 選手名、感情表現、次