検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight

537 Views

December 05, 16

スライド概要

profile-image

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

検索クエリの時間差を可視化することで わかる人の行動パターン 2016年12月5日 D&S 関西 田村 健

2.

自己紹介 田村 健 ヤフー株式会社 データ&サイエンスソリューション統括本部 D&S関西 経歴 2009年4月 2009年10月 ヤフー新卒エンジニア入社(東京本社) 検索開発部配属(検索データの可視化チーム) 2012年10月 2015年10月 データソリューション開発部(現D&S統括本部)に異動 D&S関西に異動 お仕事:社内向けのデータ可視化ツールを作っています

3.

D&S関西とは?(宣伝) ヤフー大阪オフィス D&S関西チーム9名在籍(2016年10月時点) ヤフー福岡オフィス D&Sメンバは 1名在籍(2016年10月時点) ヤフー東京本社 D&S統括本部には 300名以上在籍 (2016年10月時点)

4.

なぜ関西にD&Sチームを作ったか? 関西のデータ&サイエンス人材に門戸を開きたい 主要なICT企業が東京に一極集中している中で、 関西で働きたい人材に、関西で輝ける場所を提供し、 地域の発展に貢献したい。

5.

今日のお話 検索データを使った • これまでのトレンド/人の行動理解の取り組みの事例 • 今取り組んでいる分析/可視化手法について

6.

長い期間をかけて少しずつ検索回数が伸びるているものを検知 2013年1月-2015年11月のYahoo!検索データ 検索回数 “airbnb” 2013/1 2015/11

9.

周期性のある検索クエリ 「ネクタイ 結び方」の検索数推移 4/1前後 1/15前後 4/1前後 1/15前後 2013年1月1日~2015年10月10日 毎年1月前半と4月頭に検索数が増えるという周期性が存在する

10.

地域性の可視化 回転焼き風おやつの検索数 が多い呼び方分布 今川焼き 大判焼き 回転焼き

11.

2015年3月30日-4月5日の検索データ 2015年4月6-12日の検索データ

12.

2015年3月30日-4月5日の検索データ 2015年4月6-12日の検索データ “花見”

13.

インフルエンザの感染状況可視化 Yahoo!JAPAN ビッグデータレポート http://docs.yahoo.co.jp/info/bigdata/influenza/2015/01/

15.

検索数 多 峠をこえる 蔓延 下降傾向 上昇傾向 収束 流行 検索数 少

16.

ニーズを深掘りする 第2ワードの抽出/可視化 “ドライヤー” を含む検索クエリ 検索量多 ダイソン ドライヤー 検索量少 ドライヤー 人気 パナソニック ドライヤー 復元 ドライヤー ドライヤー おすすめ ナノケア ドライヤー くるくるドライヤー ドライヤー パナソニック ドライヤー ヘアビューザー パナソニックドライヤー ドライヤー ランキング リュミエリーナ ドライヤー テスコム ドライヤー • 人気のメーカー(ダイソン、パナソニック) • 人気のタイプ(復元、ナノケア、くるくる) • ドライヤーの探し方(人気、おすすめ) などがわかる。

17.

ニーズを深掘りする 相関が高い(検索推移が似ている)検索クエリを抽出 “映画” と “漫画喫茶”

18.

ニーズを深掘りする 想像もつかない競合をデータを導くこともできる。 “映画” と “焼肉”

19.

検索推移だけを見ると・・ “映画” と “焼肉” は相関が高いクエリである(検索推移が似ている) でも、それは、 - 同じユーザが、“映画” と “焼肉” で悩んでいるのか? - “映画” と “焼肉” はまったく違うユーザセグメントなのか? キーワードとキーワードの関係を ユーザ軸に説明できない。 映画好き ?? 焼肉好き

20.

重複ユーザ数を計算 ここを調べたい 映画好き 焼肉好き あらゆる検索クエリに対応すると結構大変。 圧倒的なデータボリューム… 年間の検索クエリの種類:約100億種類 年間の検索データのレコード数:約7000億 ?? 検索クエリをハッシュ化し、256グループに分類。 256回重複計算を実施。

21.

あるワードを検索した人がよく検索している他のワード “ユニクロ” “アルマーニ” GU ドルチェ&ガッバーナ H&M gucchi Gap カルバンクライン

22.

“映画”を検索している人は、他にどんなことを検索している?

23.

“映画”を検索している人は、他にどんなことを検索している? “英語の勉強” “天気” “食べログ” “デートプラン” “休日 一人”

24.

検索時間差を可視化することで 物事の検討タイミング/行動パターンが可視化できるのでは? 焼肉 映画 time 検索時間差 映画 焼肉 time 映画 焼肉 time

25.

“咳止め 薬” の検索時間差ワード time -2.0 0 +2.0 集計期間 1週間

26.

“咳止め 薬” の検索時間差ワード time -2.0 0 +2.0 喉の痛み 治す 喉の痛み 薬 集計期間 1週間

27.

“咳止め 薬” の検索時間差ワード time -2.0 喉の痛み 治す 喉の痛み 薬 0 咳を止める方法 +2.0 メジコン 集計期間 1週間

28.

“咳止め 薬” の検索時間差ワード time -2.0 0 +2.0 喘息咳 治療 喉の痛み 治す 喉の痛み 薬 咳を止める方法 メジコン 肺炎 症状 集計期間 1週間

29.

“失恋” の検索時間差ワード time -2.0 0 +2.0 集計期間 1週間

30.

“失恋” の検索時間差ワード time -2.0 0 +2.0 好きな人にとる態度 告白 タイミング 集計期間 1週間

31.

“失恋” の検索時間差ワード time -2.0 好きな人にとる態度 告白 タイミング 0 +2.0 告白 失敗 LINE ブロック 集計期間 1週間

32.

“失恋” の検索時間差ワード time -2.0 0 +2.0 タロット占い 好きな人にとる態度 告白 タイミング 情緒不安定 告白 失敗 LINE ブロック 集計期間 1週間

33.

“粉ミルク” の検索時間差ワード time -250 0 +250 集計期間 1年間

34.

“粉ミルク” の検索時間差ワード つわり対策 time -250 0 +250 妊娠初期 集計期間 1年間

35.

“粉ミルク” の検索時間差ワード つわり対策 チャイルドシート口コミ time -250 妊娠初期 0 +250 赤ちゃん命名辞典 集計期間 1年間

36.

“粉ミルク” の検索時間差ワード つわり対策 チャイルドシート口コミ time -250 妊娠初期 0 赤ちゃん命名辞典 +250 新生児夜泣き おっぱいの飲ませ方 集計期間 1年間

37.

“粉ミルク” の検索時間差ワード つわり対策 離乳食 ベビーフード チャイルドシート口コミ time -250 妊娠初期 0 赤ちゃん命名辞典 +250 新生児夜泣き おっぱいの飲ませ方 集計期間 1年間

38.

“粉ミルク” の検索時間差ワード つわり対策 離乳食 ベビーフード チャイルドシート口コミ time -250 妊娠初期 0 赤ちゃん命名辞典 新生児夜泣き +250 ベビースイミング 1歳絵本 おっぱいの飲ませ方 集計期間 1年間

39.

最後に • 単純な手法でも、データボリュームと処理基盤があればインターネット のデータからリアルを可視化することができる。 • AIの時代だけど、人が理解出来る形での可視化は相変わらず重要だ と思う。 • ヤフーにしかできない可視化はすごく楽しい!