配信ライブの同時視聴におけるヘッドバンギング同期のための動作推定手法

0.9K Views

March 17, 21

スライド概要

音楽ライブに参加する観客は演奏に合わせてサイリウムを振る，ヘッドバンギングをするなど，アーティストや他の観客との一体感や非日常感を楽しんでいる．また，ライブの模様を，インターネットを通じて配信する配信ライブも多く行われているが，自宅でひとりで鑑賞することが多く，アーティストや他のファンとのかかわりや一体感が希薄化する問題がある．そこで，配信ライブ中の視聴者間の一体感を向上させることを目的に，ライブ中に行われるヘッドバンギングを媒介として，その動作を検知し，タイミングを視聴者間で共有するシステムを提案する．本研究ではポケットに入れたスマートフォンのセンサデータを使い，ヘッドバンギングの予備動作からヘッドバンギングの推定に関する検討を行った．具体的には，ヘッドバンギング中のセンサデータに関するデータセット構築を行い，機械学習により，予備動作からヘッドバンギングの推定を行った．その結果，93.5% の精度で推定を行うことができた．

Nakamura Laboratory (Meiji University)

@nkmr-lab

スライド一覧

明治大学総合数理学部先端メディアサイエンス学科中村聡史研究室

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pdf - 1.96MB)

関連スライド

各ページのテキスト

配信ライブの同時視聴におけるヘッドバンギング同期のための動作推定手法二宮洸太中村聡史明治大学総合数理学部 4年 SIGMUS130/EC59

背景: ライブの盛り上がりライブが盛り上がっている 2019年観客動員数5497万人(2009年に比べて2倍以上) ライブ特有の音楽体験アーティストとファンが一体となって作りあげる非日常感ファン同士で行うライブモーション手拍子，サイリウム，ヘッドバンギングこれらによって一体感を生み出している

ヘッドバンギングとは？ヘッドバンギング(ヘドバン) メタル，ラウド等のロックバンドのライブで見られるライブモーション音楽のビートにあわせて激しくうなずくこと [Robertら 1993] ライブで他の観客とやると楽しいため，多く見られる https://youtu.be/kHPxKaCpXxI

https://youtu.be/kHPxKaCpXxI

背景: 配信ライブの広がりライブの模様をインターネットを通じて配信どこからでも視聴できる会場に多くの人を集める必要がない配信ライブ中の盛り上がり方コメント，投げ銭サイリウムを振る・ヘドバンをひとりで行う

背景: 配信ライブでの盛り上がり部屋真っ暗にして酒飲みながらヘドバンしてきますいきなりMonolithでパソコンに向かってヘドバンしながら脳内サークル体が勝手に動いて、気づいたらヘドバンしてた！近所迷惑になるので控えめに家で暴れました https://twitter.com/terucrossfaith/status/1302824740940201984

https://twitter.com/terucrossfaith/status/1302824740940201984

背景: 配信ライブでの盛り上がり部屋真っ暗にして酒飲みながらヘドバンしてきますいきなりMonolithでパソコンに向かってヘドバンしながら脳内サークル体が勝手に動いて、気づいたらヘドバンしてた！近所迷惑になるので控えめに家で暴れました多くの人が家でヘドバンしながら鑑賞している https://twitter.com/terucrossfaith/status/1302824740940201984

https://twitter.com/terucrossfaith/status/1302824740940201984

背景: 配信ライブでの盛り上がり部屋真っ暗にして酒飲みながらヘドバンしてきますいきなりMonolithでパソコンに向かってヘドバンしながら脳内サークル実際のライブのような一体感を得ることは難しい体が勝手に動いて、気づいたらヘドバンしてた！近所迷惑になるので控えめに家で暴れました多くの人が家でヘドバンしながら鑑賞している https://twitter.com/terucrossfaith/status/1302824740940201984

https://twitter.com/terucrossfaith/status/1302824740940201984

目的配信ライブ中のヘドバンを共有し一体感の向上を目指す

10.

目的配信ライブ中のヘドバンを共有し一体感の向上を目指すヘドバン共有システムを作成

11.

ヘドバン共有システム • 視聴者は各自宅で視聴 PCとスマホで視聴 • パソコンライブ映像の視聴 • スマートフォンセンサ情報取得ヘドバンの推定 • ヘドバン共有システム推定されたヘドバン情報を他の視聴者に共有一体感向上を図る

12.

13.

本発表の流れヘドバンデータセット構築機械学習によるヘドバンの推定

14.

ヘドバンデータセット構築ヘドバンを介した一体感向上 → ヘドバン動作の推定が必要ヘドバン動作と対応するセンサ情報のデータセットを構築センサ情報ヘドバンは動きが早くカメラで捉えづらいセンサ情報はスマートフォンで取得多くの人が利用できる環境を想定しスマホを利用収集はズボンのポケットで行うスマホが飛んでいく可能性が低いため

15.

データ収集システム Webシステムを作成スマホとPCを利用し，それらが同期スマホ: 楽曲再生(ヘドバンは楽曲を聴いて行う)・センサデータ取得 PC: 動画記録(ヘドバン情報のアノテーションに利用) 取得するセンサ情報(JavaScriptで取得) 3軸加速度(x, y, z) 3軸デバイス方向(alpha, beta, gamma) 楽曲(右表) ライブでヘドバンする曲歌唱アーティスト曲名 Fear, and Loathing in Las Vegas Twilight Crossfaith Monolith coldrain The Revelation SiM JACK. B Survive Said The Prophet TRANSlated

16.

データセット構築実験実験協力者: ヘドバンを行うライブに行く大学生6名(男: 5, 女: 1, 著者含む) 実験環境 • • • • • • 実験協力者の自宅で実施楽曲は事前に聴きこんでもらったヘドバン区間も事前に各自の判断で決定楽曲の再生はイヤホンを利用スマートフォンの向きは指示(右図) 首や腰への負担を加味し，複数日での実施を推奨試行回数 5曲 × 5回

17.

センサとラベル(大域)

18.

センサとラベル(大域)

19.

センサとラベル(詳細)

20.

機械学習による推定一緒にヘドバンをしていると感じる → 頭の下げ始め・上げ始めのタイミングが一致これを推定する非ヘドバン，振下開始，振上開始の3値分類リアルタイム推定を想定ある時点までのデータからその先を推定推定位置特徴量区間インターバルヘドバンの振下・振上動作予備動作を利用共有対象のヘドバン認識時間と通信遅延を加味頭の下げ始め

21.

機械学習: 学習方法データセット構築で得られた150試行を利用 80%をTrain，20%をTest アルゴリズムはRandom Forestを利用(scikit-learn) 特徴量区間内のデータ利用するデータ加速度とその差分デバイス方向とその差分 (差分導出: 𝑑𝑛 = 𝑥𝑛 − 𝑥𝑛−1 ) 統計量平均，標準偏差，最大，最小インターバルと特徴量区間の長さ短い時間で推定したい短いほど推定は難しい時間を変化させ，精度への影響を調査インターバル 50, 75, 100ミリ秒特徴量時間 100, 150, 200, 250, 300ミリ秒

22.

予測までの時間と精度推定位置特徴量区間インターバル 1回のヘドバン動作正解率インターバル特徴量区間 100 150 200 250 300 50 0.870 0.900 0.912 0.921 0.933 75 0.871 0.901 0.913 0.924 0.933 100 0.870 0.901 0.913 0.930 0.935

23.

予測までの時間と精度推定位置特徴量区間インターバル 1回のヘドバン動作特徴量区間は長いほど精度が高い正解率インターバル特徴量区間 100 150 200 250 300 50 0.870 0.900 0.912 0.921 0.933 75 0.871 0.901 0.913 0.924 0.933 100 0.870 0.901 0.913 0.930 0.935

24.

予測までの時間と精度推定位置特徴量区間インターバル 1回のヘドバン動作特徴量区間は長いほど精度が高いインターバルはあまり変化がない時間変化が25ミリ秒と短かった？正解率インターバル特徴量区間 100 150 200 250 300 50 0.870 0.900 0.912 0.921 0.933 75 0.871 0.901 0.913 0.924 0.933 100 0.870 0.901 0.913 0.930 0.935

25.

予測までの時間と精度推定位置特徴量区間インターバル 1回のヘドバン動作正解率インターバル特徴量区間 100 150 200 250 300 50 0.870 0.900 0.912 0.921 0.933 75 0.871 0.901 0.913 0.924 0.933 100 0.870 0.901 0.913 0.930 0.935 特徴量区間は長いほど精度が高いインターバルはあまり変化がない時間変化が25ミリ秒と短かった？ → インターバルの長さより特徴量区間の長さが重要

26.

展望 1. ヘドバン区間の分析 2. ヘドバン共有方法の検討

27.

展望: ヘドバン区間の分析任意の区間でヘドバンを行ってもらった多くの区間でヘドバン箇所が一致 → 楽曲特徴からヘドバン区間を決めている可能性がある

28.

29.

展望: ヘドバン共有方法目標とするシステムではヘドバンを視聴者間で共有これにより，一体感の向上を目指すヘドバン中画面を見ることができない → 視覚以外の方法で共有することが求められる共有方法聴覚情報: ライブ音声を変化させる触覚情報: スマートフォンを振動させる

30.

まとめ背景配信ライブではアーティストや他の視聴者の存在が希薄化し一体感を感じづらいライブ中に行うヘドバンなどをひとりで行っている目的配信ライブ中のヘドバンを検出し，共有することで一体感の向上を目指す提案手法ヘドバンデータセットを構築機械学習により，ヘドバンの開始地点を推定結果最大93.5%の精度で推定できた展望ヘドバンの共有方法の検討ヘドバン区間の楽曲的な特徴を明らかにする

配信ライブの同時視聴におけるヘッドバンギング同期のための動作推定手法

Nakamura Laboratory (Meiji University)

関連スライド

周辺視野に対するぼかしエフェクトが作業時の集中力に及ぼす影響の調査

色覚特性を考慮したゲームの有利不利制御のAmong Usを用いた検証

商品選択においてフォントがユーザの選択行動に及ぼす影響の調査

手書きとフォントの文字形状の違いによる記憶効果の比較

三択の選択肢の色の組み合わせが選択行動に及ぼす影響

周辺視野領域のぼかし強調による集中促進手法

各ページのテキスト