先端技術でリードする!ChatGPTによる社内データの活用連携

6K Views

July 07, 23

スライド概要

2023年6月16日に幕張メッセで開催された「Apps Japan 2023」での登壇資料です。
ChatGPTを社内活用されたい方に向けた基本的な情報になるかと思います。

profile-image

アステリア株式会社エバンジェリスト ブロックチェーンやAIなど先端技術に関するお話をさせていただいています。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

先端技術でリードする! ChatGPT による社内データの活⽤連携 アステリア株式会社 エバンジェリスト 森 ⼀弥 2023年6⽉16⽇ © 2023 Asteria Corporation

2.

⾃⼰紹介 アステリア株式会社 エバンジェリスト 森 ⼀弥 ⾃らプログラミングし経験したブロックチェーン AI や IoT など先端技術の可能性、勘所を これから業務に採⽤する皆様にお伝えします ■ TV・雑誌取材(AI関連のみ抜粋) ITmedia:「ChatGPT」は業務をどう変えるのか? インプレス:今話題のAI「ChatGPT」とは何か? ⼈の仕事は奪われるのか? PC-Webzine:ChatGPTは何者か・ChatGPT の基礎解説と⽤途の可能性 企画・原作 特許 © 2023 Asteria Corporation 2

3.

アステリアとは n 1998年創業、企業向けソフトウェア製品を開発・販売 n ⽇本のソフトウェアメーカー n 「ノーコード」や「つなぐ」をキーワードとした製品を展開 ノーコード データ連携基盤 コンテンツ管理 プラットフォーム モバイルアプリ 作成ツール エッジコンピューティング IoTプラットフォーム © 2023 Asteria Corporation 3

4.

アステリアARTとは n アステリア Artificial Recognition Technology 合同会社 u略称:アステリアART uアステリア株式会社の⼦会社として2019年4⽉に設⽴ u代表は早稲⽥⼤学にて講師も務める情報科学博⼠、園⽥智也⽒ u⾳声認識などAI企業「ウタゴエ」の創業社⻑も 勤める u現在は AI + Robotics 研究開発を⾏っている © 2023 Asteria Corporation 4

5.

ChatGPTとは何か? © 2023 Asteria © 2023 Corporation Asteria Corporation

6.

ChatGPT とは ⾃然⾔語処理の AIチャット OpenAIが 開発 誰でも無料で 使える ⽇本語にも対応した ⼤規模⾔語モデルを 使⽤したチャット イーロン・マスクが 創業に関わり マイクロソフトが 出資したAI研究所 今のところ 無料のプレビュー として 誰でも利⽤可能 © 2023 Asteria Corporation 6

7.

そのままのChatGPTで使える応⽤術 ⽂書の 要約・翻訳 ⽂書の 雛形作成 プログラム ⽣成 ミスの指摘 校正 技術書や 論⽂の要約 ⽂書の翻訳 記事、契約書 帳票などの 雛形作成 雛形作成や テストデータの 作成 ⽂書や プログラムの ミスを指摘 誰かの仕事を奪うものではなく「便利な道具」の登場と捉えるべき © 2023 Asteria Corporation 7

8.

プラグインやWeb情報の参照も 5/12 の更新でベータ版ながら弱点の1つであった ネット上の最新情報の取得も可能になった 不安点や機能不⾜はすでに解消されているかも!? © 2023 Asteria Corporation 8

9.

ジェネレーティブAIの利⽤意識 国内で「積極的に利⽤する」企業はアメリカの半分以下 時期 エリア 対象者 :2023年2⽉ :⽶国、英国、デンマーク、オランダ、スウェーデン、ドイツ、フランス、オーストラリア、 ニュージーランド、⽇本、インド、シンガポール、タイ、マレーシア計14ヵ国 :1万3,000⼈の消費者と4,250⼈の顧客体験(CX)およびマーケティングの専⾨家 出典:アドビ株式会社 プレスリリース https://www.adobe.com/jp/news-room/news/202304/20230420_adobe-digital-economy-survey.html © 2023 Asteria Corporation 9

10.

つかう?つかわない? 禁⽌ 活⽤を表明 社内業務やアイデア創出で 実証実験を開始 全社員がさまざまな業務に 活⽤ ChatGPT活⽤表彰制度を開始 書類の作成などの業務を⽀援 EU⼀般データ保護規則(GDPR)違反で ⼀時的に禁⽌ →データ収集についての対策が整った として解除 政策策定等、県の業務で使⽤当⾯禁⽌ 第三者提供のAI系サービスの利⽤は禁⽌ ただし社内利⽤申請があれば検討 ChatGPTの有料会員の ⽉額使⽤料の補助 社内向けAIチャットサービス 「Benesse GPT」 ※ ChatGPTが⼀気に話題になってきた2023年3⽉〜に対応を表明された企業、団体が中⼼です © 2023 Asteria Corporation 10

11.

確かにリスクもある 情報漏えい 倫理観の⽋如 虚偽情報 著作権や プライバシー侵害 プロンプト インジェクション SAMSUNG では 3⽉ に少なくとも3件の 情報漏えいが発⽣ 特に外部に出すような ものに関しては 情報の精査は必要 制作物、学習データ 共に各国のスタンス も異なる 公開されたサービスで 裏をかこうとする 攻撃が頻発 API利⽤や Opt-out 申請などを⾏う 社外に提出するものなどは精査を⾏う 対策⼿段も 定⽯ができつつある © 2023 Asteria Corporation 11

12.

簡単にできる情報漏えい対策として セキュリティのページ( https://openai.com/security )の FAQに記載あり API 利⽤の場合は学習データに 使われない ブラウザから使う場合は、 「Settings」から 学習データへの利⽤をOFFに API利⽤以外でも学習データに 使わないようにリクエストできる データ削除のリクエストもできる © 2023 Asteria Corporation 12

13.

プロンプトエンジニアリング © 2023 Asteria © 2023 Corporation Asteria Corporation

14.

プロンプトエンジニアリングとは 望んだ回答を得られるように AIへの問いかけ⽂「プロンプト」に⼯夫をする⽅法 キャラ設定 制約条件 例を⽰す 過程を⽰す 前提知識を⽰す 「あなたは〇〇 です」 「⼩学⽣でもわ かるように〜」 質問と回答の例 を複数⽰した上 で問いかける 「ステップバイ ステップで」 参考となる⽂章 を質問⽂に含め て問いかける ※ プロンプトエンジニアリングは⽇々研究されているので、 上記だけではなく新しい⼿法が次々と出てきています © 2023 Asteria Corporation 14

15.

キャラ設定 今晩の晩ごはんのアイデアを考えてください。 あなたは⽇本の主婦です。今晩の晩ごはんの アイデアを考えてください。 © 2023 Asteria Corporation 15

16.

制約条件 ⽉について教えてください。 ⽉について、⼩学⽣でもわかるように300⽂ 字以内で教えて下さい。 ⽂字数の成約が効いてい るほか、「公転」使われ なくなったりしている © 2023 Asteria Corporation 16

17.

例を⽰す 12星座占いで使われる星座と該当する 誕⽣⽇の期間を教えてください 12星座占いで使われる星座と該当する誕⽣⽇ の期間を以下の出⼒形式で教えてください ### 出⼒形式 ### 星座名,英語名,開始⽇,終了⽇ 指定した形式で コピーもできる ボタンまで 付けてくれた © 2023 Asteria Corporation 17

18.

過程を⽰す 計算問題などで、「ステップバイステップで考えてください」と 付け加えるだけで精度が上がる 初期状態でも過程を⽰した回答が出されることが多くなってきた ため、OpenAI側で修正されてきていると思われる © 2023 Asteria Corporation 18

19.

前提知識を⽰す 簡単に⾃炊できる⼣飯のメニューを 考えてください。 簡単に⾃炊できる⼣飯のメニューを考えて ください。 ### 前提知識 ### ・冷蔵庫には豚⾁、キャベツがあります ・ご飯は炊くことができます。 ・家族には⾟いものが苦⼿な⼈がいます。 ・キッチンはガスコンロはありますが、 オーブンはありません。 指定した前提知識に 基づいて回答された © 2023 Asteria Corporation 19

20.

⾃社データの活⽤ © 2023 Asteria © 2023 Corporation Asteria Corporation

21.

⾃社データとAPI を使って活⽤も サポート 業務⽀援 ボットで 時間の短縮 負担軽減など 帳票作成 ⾃社サイトや アプリ⽀援 アンケートや SNS分析 ⽉次・週次 レポート作成 分析・調査など サイトの案内や 商品の説明 など ⼤量コメントを ⼀括に ポジネガ分析 業務に関わる仕組みに取り込めば効率化に貢献 © 2023 Asteria Corporation 21

22.

独⾃(⾃社)データの利⽤⽅法 ChatGPTの回答はOpenAIが学習させたネット上の情報のみで ⾃社データなど独⾃情報を元に回答してもらうには⼯夫が必要 ファインチューニング で追加学習 前提知識を使った プロンプトエンジニアリング プラグインの 開発・利⽤ AIモデル⾃体を 「追加学習」する 別途⽤意した 関連⽂書をふまえた 回答を要求する 5⽉よりできた プラグインでPDFを 読み込んだりできる © 2023 Asteria Corporation 22

23.

関連情報を使ったプロンプト 例えば社内業務のヘルプボットを作ろうとした場合 新しく購⼊したPCでの、 プリンターの接続⽅法を 教えてほしい 質問者 索 検 を 報 情 • 社内にはネットワーク 関連 プリンタがあります • プリンタのIPアドレス は192.168.0.123です • プリンタのドライバは 社内の 社内のネット データベース https://192.168.0.10/prin ter-driver にあります あなたは社内業務に関する オペレーターです。以下の関連 情報を踏まえた上で、質問に回 答してください。 ### 関連情報 ### ChatGPT ### 質問内容 ### © 2023 Asteria Corporation 23

24.

必要な技術 Vector Store [0.123,0.456,・・・] [0.123,0.456,・・・] [0.123,0.456,・・・] Embedding Document Loader Text Splitter こんにちは [0.123,0.456,・・・] n ベクトル情報を保存す るDBの⼀種 n 「似ているもの」を 探すことが得意 n ECストアの「おすす め商品」などでも 使われる n ⽂字や単語、⽂書など のテキストデータを ベクトル情報に変換 する⼿法 n OpenAIのEmbedding APIでは 1536 次元の データに変換 n PDFやWord、Excelな どから⽂字情報を取得 するDocument Loader n ⽂字情報を任意の区切 り⽂字や⽂字数で分割 するText Splitter © 2023 Asteria Corporation 24

25.

Vector Store いろいろ オープンソースやクラウドサービスなど様々 Chroma Faiss ※ ⼤規模⾔語モデルをあつかうフレームワーク「LangChain」の Python版、JS版の両⽅で使えそうなものをピックアップ © 2023 Asteria Corporation 25

26.

🦜🔗 LangChain とは n OpenAI を始めとして複数の n n 出典:https://blog.langchain.dev/ ⼤規模⾔語モデルを扱う フレームワーク 様々な形式の Document Loader や、VectorStore に対応し注⽬されている プログラムがある程度 わかる⽅であれば調べる 価値あり © 2023 Asteria Corporation 26

27.

Embedding Embedding⽤の AIモデルは複数ある 蓄積⽤と検索は 同じモデルを使う ⾔語・⽤途に合った モデルを使う n OpenAIだけでなく 公開モデルは複数存在 している n それぞれ次元数も 異なり、同じ⽂字の 変換結果も異なる n VectorStoreに⼊れる データと、問い合わせ のデータは同じモデル で変換する n 変更は再構築が必要な ので、少量でテスト・ 検討すべき n モデルによっては英語 のみで学習されたもの などがあるので、⽤途 に合わせて選択する n 専⾨⽤語の多い領域は ファインチューニング が必要 © 2023 Asteria Corporation 27

28.

Document Loader と Text Splitter Document Loader n LangChainにも様々な種類の ローダが付属している n 利⽤したいデータがテキスト に変換されれば何でもOK Text Splitter n 単純に⽂字数で切る、句読点 で切る、ページ数で切るなど n Wordの⾒出し単位で切るなど 意味を重視する⽅法も © 2023 Asteria Corporation 28

29.

ちょっと宣伝 n 様々なデータの変換、連携なら「ASTERIA Warp」 n アイコンを並べていく n n 「ノーコード」開発環境 各種データベースやクラウド との連携が簡単に実現 テキストの加⼯変換も アイコン操作で実現 © 2023 Asteria Corporation 29

30.

API の利⽤料について OpenAI のAPI利⽤には利⽤料(従量課⾦)がかかる 従量課⾦が気になる⽅はある程度の回避は可能 課⾦の単位は 「トークン」 n 英語だとおおよそ 1単語1トークン n ⽇本語だと1⽂字 1トークンくらい ちょっとの⼯夫で 節約 n プロンプトの定形部分 など部分的にでも英語 にする n ⽂字数を減らす⼯夫 ※ 6/13に価格改定が⼊り値下げされています。 独⾃データは 別のEmbeddingでも n VectorStoreは別の Embeddingモデルを 使って作るのもあり © 2023 Asteria Corporation 30

31.

まとめ © 2023 Asteria © 2023 Corporation Asteria Corporation

32.

まとめ まずご⾃⾝で 使ってみましょう そのリスク まだあります? 独⾃データの活⽤ そのままでも ⼗分便利な道具です 動きの早い技術です 情報収集はネットで! ⼯夫とアイデア次第で ⼤幅な業務改善 © 2023 Asteria Corporation 32

33.

ご相談承ります 社内向けのセミナー ⾃社データ活⽤のアドバイス メール等でご連絡ください kmori@asteria.com © 2023 Asteria Corporation 33