LLMを用いた住まい探しにおけるユーザ価値観の推定

669 Views

March 29, 24

lifull ai llm 大規模言語モデル研究開発

スライド概要

2024年2月24日に開催された「第86回 Machine Learning 15minutes! Hybrid」にて発表した資料となります。

Machine Learning 15 minutes! は機械学習に関するLTを複数人で行い、最新の技術や機械学習のプラットフォーム状況などを共有、議論する場です。第86回ではLIFULLから【LLMを用いた住まい探しにおけるユーザ価値観の推定】と題して、不動産業界におけるLLMの活用に向けた研究の紹介をしました。

株式会社LIFULL

@LIFULL

スライド一覧

LIFULL HOME'Sを運営する株式会社LIFULLのアカウントです。 LIFULLが主催するエンジニア向けイベント「Ltech」等で公開されたスライド等をこちらで共有しております。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pdf - 755.62kB)

関連スライド

pmconf2023【プロダクトマネジメントで高速PDCA】アウトカムが激増したLIFULL HOME’Sのグロース事例

プロダクトマネジメントプロダクトマネージャー lifull

株式会社LIFULL 21K

CloudWatch LogsからGrafana Lokiにログ基盤を移行

lifull aws grafana ログ

株式会社LIFULL 14.4K

HNSWの内部構造

lifull hnsw search

株式会社LIFULL 11.4K

LIFULL HOME'SでのSolrの構成と運用の変遷

lifull lifull home's engineering

株式会社LIFULL 10.4K

PrometheusとGrafanaで追求する、より良いアプリケーションの可観測性

lifull grafana ログ kuberentes

株式会社LIFULL 9.9K

趣味と仕事の違い、現場で求められるアプリケーションの可観測性

技育祭エンジニア engineering programming プログラミング

株式会社LIFULL 9.6K

各ページのテキスト

LLMを用いた住まい探しにおけるユーザ価値観の推定背景 1. 近年、大規模言語モデル（LLM）が急速に普及している 2. 単なる言語モデルではなく、ユーザ行動のシミュレーションなどにも応用されている1,2 3. LIFULLにおいてもユーザの行動の理解は重要 → サイト改善や推薦モデルの精度向上に利用できる（その他もたくさん） LLMを利用して人間の行動を模倣させたエージェント25体を同じ空間に配置。その様子（動作・会話など）を観察している。 1: Generative Agents: Interactive Simulacra of Human Behavior, https://arxiv.org/pdf/2304.03442.pdf 2: When Large Language Model based Agent Meets User Behavior Analysis: A Novel User Simulation Paradigm, https://arxiv.org/pdf/2306.02552v2.pdf Copyright© LIFULL All Rights Reserved.

LLMを用いた住まい探しにおけるユーザ価値観の推定目的（LLMによるユーザ行動のシミュレーションを応用して）「ユーザ行動・価値観を深く理解したクローン（デジタルクローン）」を作る活用先：物件の推薦やサイト（UI/UX）改善などなど ↓ デジタルクローンを使ってユーザの価値観にあった物件を自動で検索＆推薦...！ LIFULL HOME’S おすすめ物件ユーザ Copyright© LIFULL All Rights Reserved. ユーザの好みの物件検索デジタルクローン

LLMを用いた住まい探しにおけるユーザ価値観の推定論文紹介：LLMを用いた自律的エージェントのサーベイ論文 LLMを用いた自律的エージェントの研究の多くは下の4つの要素から構成されていると示されている。 Profile：人格・性格などを定義する Memory：環境やエージェントの行動を記録する Planning：複雑なタスクを分解する Action：エージェントの決定を処理に変換する A Survey on Large Language Model based Autonomous Agents, https://arxiv.org/pdf/2308.11432.pdf Copyright© LIFULL All Rights Reserved.

https://arxiv.org/pdf/2308.11432.pdf

LLMを用いた住まい探しにおけるユーザ価値観の推定論文紹介：LLMを用いたユーザ行動のシミュレート LLMを用いて特定の人間の性格・特徴などを模倣したエージェントでシミュレートを行った研究。エージェントの行動： 1. 見たい映画の検索・選択 2. 映画の感想を他のエージェントに共有 3. SNSで多数向けに映画の感想をポストこの研究では各エージェントが模倣する性格・特徴などを表にまとめ、それをもとにプロンプトを生成していた。（ユーザ行動のデータで同じようなことができるかも…？） When Large Language Model based Agent Meets User Behavior Analysis: A Novel User Simulation Paradigm, https://arxiv.org/pdf/2306.02552v2.pdf Copyright© LIFULL All Rights Reserved.

https://arxiv.org/pdf/2306.02552v2.pdf

LLMを用いた住まい探しにおけるユーザ価値観の推定不動産業界でのユーザ行動のシミュレートただ、“「ユーザ行動・価値観を深く理解したクローン」を作る”といっても、 • そもそも不動産ドメインで同じこと（シミュレーション）が可能か？ • どんなデータが必要なのか？ • 何を評価すれば良いのか？などわからない部分が多く、手探りの状態。そのため、初めは実験の対象者を絞って身軽に探索していく。〜 10 人（プロジェクト関係者）イマココ〜 100 人（実験協力者） LIFULL HOME’S 全ユーザ・不動産ドメインでの実現可能性・実験環境の整備・推薦などへの利用・LLMで解けるタスクの設定・デジタルクローンの精度評価・改善・運用に向けたシステム設計・運用・評価指標の選定・システム化へ向けた実装の整備・効果検証・必要なデータの調査 Copyright© LIFULL All Rights Reserved.

LLMを用いた住まい探しにおけるユーザ価値観の推定そもそも不動産ドメインでどんなタスクが解けそうか？ ”ユーザ行動・価値観を深く理解しているか“というのは具体的には以下の方法で評価できる 1. 特定の物件に対して絶対的な評価が一致するか 2. 複数物件を比較した相対的な評価が一致するかどちらも物件に対して“住みたいかどうか”の評価を行うが、評価方法によってタスク／システム的な難易度が変わってくる。 Copyright© LIFULL All Rights Reserved.

10.

LLMを用いた住まい探しにおけるユーザ価値観の推定 LLMによる物件評価の予測（絶対評価）まずは物件の評価を人間・LLMともに絶対評価（単一の物件での評価）を行い、どの程度正しく予測できるかを試してみる。入力は物件の紹介文、出力は物件の5段階評価（住みたいかどうかの観点）に設定。物件の紹介文人間評価値：3 LLM 評価値：4 この物件は〇〇県〇〇市にあり、月額賃料は〇万円で、広さは.. 人間の性格・特性この人物は〇〇歳で、〇〇県〇〇市に在住しており、年収は〇〇万円です。家族構成は.. Copyright© LIFULL All Rights Reserved.

11.

LLMを用いた住まい探しにおけるユーザ価値観の推定 LLMによる物件評価の予測（絶対評価）（サンプル数は少ないが）この方法で実際に評価をしてみると、LLMの予測が特定の評価値に大きく偏ることがあった。右の図はある被験者の予測結果を混同行列にまとめたものだが、LLMは5段階評価の2, 3を一度も出力することがなかった。 → そもそもタスクの難易度が高い？予測した5段階評価値（横軸）は、 2, 3の出力が一つもなく、主に 1, 4の出力に偏っている。縦軸：人間がつけた 5段階評価値横軸：予測した 5段階評価値 Copyright© LIFULL All Rights Reserved.

12.

LLMを用いた住まい探しにおけるユーザ価値観の推定 LLMによる物件評価の予測（相対評価）次に物件の評価を人間・LLMともに相対評価（2つの物件の比較）を行ってみる。相対評価では、2つの物件を比較し特定のグループ内での物件の相対的な順位を割り出す。 x N回（組み合わせ）人間物件Aの紹介文この物件は〇〇県〇〇市にあり、月額賃料は〇万円で、広さは.. 人間物件B 物件A 物件D LLM 人間の性格・特性この人物は〇〇歳で、〇〇県〇〇市に在住しており、年収は〇〇万円です。家族構成は.. Copyright© LIFULL All Rights Reserved. 物件E 並び順物件Bの紹介文この物件は〇〇県〇〇市にあり、月額賃料は〇万円で、広さは.. 物件C LLM 物件A 物件B 物件D 物件E 物件C

13.

LLMを用いた住まい探しにおけるユーザ価値観の推定 LLMによる物件評価の予測（相対評価）相対評価では、混同行列をみると対角成分に近い部分が高い値になっているため、人間の順位とLLMの順位が大きく外れてはいないことがわかる。 → タスクの難易度は低くなった？ただ相対評価の大変なところは、絶対評価と比べて比較回数が非常に多くなること。仮に1000件の相対評価を行いたいときは、約50万回の比較（つまりLLMの推論）が必要となってしまう。混同行列の対角成分に近い部分に多く集まっている。縦軸：人間がつけた 5段階の順位横軸：予測した 5段階の順位 Copyright© LIFULL All Rights Reserved.

14.

LLMを用いた住まい探しにおけるユーザ価値観の推定今後の課題今の所、絶対評価／相対評価では精度と計算量のトレードオフがありそう。そこで今後の動きとして以下の二つの方向性がある。 1. 絶対評価の精度を向上させる方向 → プロンプトエンジニアリング、推論方法の工夫（段階的な推論など） 2. 相対評価の計算量を削減する方向 → 比較する組み合わせの削減（冗長な組み合わせを省く、など）絶対評価・タスク難易度：高・システム難易度：低 Copyright© LIFULL All Rights Reserved. 相対評価・タスク難易度：低・システム難易度：高

15.

LLMを用いた住まい探しにおけるユーザ価値観の推定まとめ LIFULLのデータサイエンスグループではユーザ行動・価値観の理解のために LLMを使った住まい探しにおけるユーザ価値観の推定を行っています。 ● 気になったことがあればぜひ聞いてください！ ● 内容に興味のある人はあとでぜひ話しましょう！ ● 「こんなやり方もあるんじゃない？」みたいなアドバイスも大歓迎です！ Copyright© LIFULL All Rights Reserved.

16.