>100 Views
September 26, 25
スライド概要
Niigata5分テック #22の発表資料です
Cloudflare AI Search formerly AutoRAG Niigata 5min Tech #22 @circled9
自己紹介 松井 正志 (Matsui Masashi) 株式会社モニクル Bluesky: @kaffeine.jp Twitter: @circled9
まずRAGの話から
LLMの限界 • LLMはトレーニング時点までの情報しか知らない • Knowledge Cutoffと呼ばれる • 非公開な情報も知らない • 社内文書やSlackのメッセージの情報は知らない
ではどうするか
LLMが知らないなら教えればいい
RAG • Retrieval-Augumented Generationの略 • 検索拡張生成などと訳される • 質問に関連する文書を添付することで、LLMの回答の精度を上げる手 法 • 要するに「これ読んで質問に答えて」って頼む感じ
一般的なRAGの実装 • 文書をベクトル化してベクトルデータベースに保存する • 質問文に近い文書をベクトルデータベースで検索する • 検索結果をプロンプトに組み込んでLLMに質問する
https://developers.cloudflare.com/ai-search/concepts/what-is-rag/
作ったことあるけど 正直ちょっと面倒
できるけどやりたくない • 実装するのも動く環境を用意するのも面倒 • 色々なドキュメントのフォーマットに対応するのが面倒 • テキストファイル、PDF、Word文書、etc... • 車輪の再発明になりがち • やることはそんなに変わらない
AI Search
AI Search • Cloudflareの提供するフルマネージドなRAGのサービス • 昨日からAI Searchという名前になった • 一昨日までAutoRAGという名前だった
AI Searchのいい感じなところ • 色々なファイルをいい感じに変換して保存してくれる • 質問のクエリもいい感じに書き換えてくれる(らしい) • 環境構築もいい感じにやってくれる
AI Searchのざっくりとした流れ • 文書をR2にアップロードする • 文書がいい感じにVectorizeに保存される • Workers BingingやREST APIで質問したり検索したりできる
https://developers.cloudflare.com/ai-search/concepts/how-ai-search-works/
https://developers.cloudflare.com/ai-search/concepts/how-ai-search-works/
めっちゃ楽
まとめ • RAGの実装は自分で作れなくはないけど面倒 • AI Searchを使うと面倒なRAGの環境を簡単に用意できる • AutoRAGはAI Searchという名前になった