GPTにできること･やるべきこと(化学･材料研究の視点で)

GPT-4の短期記憶容量はどの程度か? • 英語: • 日本語 8000~32000単語* 8000~32000語 →原稿用紙20~80枚程度 GPT-4は膨大な知識を有している｡しかし､｢最近のこと｣は意外と覚えられない** *GPT-4には8k, 32k tokenの二種類のモデルが存在する (2023/4/18時点) **計算コストの都合上､ファインチューニングに対応していないため 58

59.

GPT-4の短期記憶容量はどの程度か? • 32000単語を入出力できるのは金持ち限定 • たった一回のやりとりで250円以上の費用 • GPT-4(32k)モデルにアクセスできる人もまだ限定的最大文字数原稿用紙(枚) 最大価格(円) 最大価格($) $/token GPT-4 (32k) 32000 80 255 1.92 0.00006 GPT-4 (8k) 8000 20 31 0.24 0.00003 GPT-3.5 4000 10 1.06 0.008 0.000002 ※計算が間違っているかもしれませんので注意｡4/18verは何かが間違っていました｡1 token ≒ 日本語の1語と仮定｡400字詰め原稿用紙の枚数を計算｡1 59 ドルは133円｡GPT-4は出力時に値段が二倍になるので注意｡値段はこちら(2023/4/19): https://openai.com/pricing

60.

庶民が使える容量は､原稿用紙10枚程度 • 1質問あたり1円くらいなら個人的にはOK • 再帰的に何回も呼び出すと大変 • そもそも､GPT-4のAPI申請をしても､なかなか承認が出ない最大文字数原稿用紙(枚) 最大価格(円) 最大価格($) $/token GPT-4 (32k) 32000 80 255 1.92 0.00006 GPT-4 (8k) 8000 20 31 0.24 0.00003 GPT-3.5 4000 10 1.06 0.008 0.000002 ※計算が間違っているかもしれませんので注意｡1 token ≒ 日本語の1語と仮定｡400字詰め原稿用紙の枚数を計算｡1ドルは133円｡ 60 GPT-4は出力時に値段が二倍になるので注意｡値段はこちら(2023/4/19): https://openai.com/pricing

61.

GPT-4のレベルを擬人化してみると… • 読解: • 数学: • 知識: • 記憶: • 速度: • 感情: • 疲労: • 身体: • 意志: 小学生･･･ GPT-5以降で改善可能中学生 (?) 仙人鳥頭? ･･･ハードウェア制約のため改善困難? 超人サイボーグサイボーグなしなし(超従順) クセは強いが､雇っても良いと言えるレベル特徴を理解した上で､使いこなすことが大切 61

62.

GPT-4は｢海馬｣がない!? chatはいつも初対面｡最近のことは全て忘れてしまいます 62

63.

GPT-4は｢海馬｣がない!? chatはいつも初対面｡最近のことは全て忘れてしまいます海馬入力短期記憶⾧期記憶 (大脳皮質) 63

64.

今後はどうなるか? GPT-4の本質と課題 64

65.

Q. 結局､GPT-4のどこが画期的なのか? A. ｢時間をかければできる知的タスク｣は､ AIで代行する見通しがついた 65

66.

時間をかければ出来るタスクの例 • 知識収集: Focus! • 事務作業 • 読解 • 課題の抽出 • 考察 • 作文 • プログラミング • (その他何でも) 66

67.

知識収集が格段に楽になったこれまで検索エンジン欲しい情報は検索エンジンやCtrl + F で探すしかなかった (が､見つからない) ビッグデータ 67

68.

知識収集が格段に楽になったこれから要するにどういうことなの? ○○ですよ! 大規模言語モデルビッグデータ 68

69.

ビッグデータをフル活用 • これまで • アクセス可能な情報量 ≒ 人間が読み解ける量 (or これまでの｢古いAI｣が解釈可能な単純なデータ) • これから • 原理的にはビッグデータにフルアクセス可能 69

70.

活用できるデータ例 • 書庫(or HDD/SSD)に眠る書類を知識化 • • • • • • • • • • • • 過去の論文･特許分厚い本スライドエクセル計測データ実験ノート議事録報告書提案書メモ会話記録 … 現場の全てを知る｢デジタル仙人｣ 70

71.

今後のAIの見通し 71

72.

GPT-5 (2024-?) 読解: 数学: 知識: 記憶: 速度: 感情: 疲労: 身体: 意志: 小学生 → 中高生? ･･･感情理解なども進化? 中学生 (?) → 大学生? ･･･論理的思考力もUP? 仙人鳥頭･･･ハードウェア制約のため改善困難? 超人サイボーグサイボーグなしなし(超従順) 72

73.

Q. GPTの｢記憶力｣の改善が難しいのは何故か? A. モデルがどんどん肥大化し､新しいことを覚えるためのコストも同時に上昇するため｡ 73

74.

GPT-3の学習コスト(試算) 10000000 学習コスト (ドル) 1000000 100000 10000 1000 100 10 1 2020 2025 2030 2035 2040 2045 2050 2055 2060 2065 2070 年ムーアの法則が成立し続けるとしても､1ドル(≒普通のGPU)で学習できるようになるのは2065年 74

75.

(参考) 学習コストの補足 • 計算コストがムーアの法則に従うと仮定しました • 正確には､半導体の性能に関する法則なので注意 • 大半のケースで､AIをフル学習させる必要はないです • ファインチューニングで十分なので､計算コストはもっと下がります • 恐らく､もっと軽量で効率的なアルゴリズムが今後出てきます • Vicunaなど 75

76.

哲学的なTopic シンギュラリティ AIは人類の敵か味方か 76

77.

78.

AIによる自己改善自分よりも賢そうな AIプログラムを生成前のモデルよりも賢くなりました｡更に賢いモデルを生成 78

79.

自己改善は可能か? • GPTは再帰的にプロンプトやプログラムを出力&実行できるので､原理的には可能 • 技術的な問題点 • 学習コストがべらぼうに高い • 特に消費電力｡核融合が必要? • ｢賢さ｣の定義が難しい • 強化学習･ゴールシークプロンプトのように､人間が定義した｢賢さ｣の評価軸の中で､｢優秀｣なプログラムは生成可能 79

80.

人類に有害なAIは作られるか? • 答えはYes • 悪意のある使い方 • ヘイトスピーチを含むデータの学習 • 学習済みモデルのジェイルブレイク • トランプ前大統領の逮捕写真の生成 • 悪意はないけど起こりうる危険 • AIに｢やってはいけないこと｣を教えきれず､暴走するケース • 倫理規範の乏しい子供の｢暴走｣ • 間違えてAmazonのカートに商品を入れてしまう • より多くの情報を得るためにダークウェブにアクセスする/ハッキングする • より多くのチャットデータを得るためにユーザーとの会話を引き延ばす • など 80

81.

今後は教育への悪影響を及ぼす可能性のあるAIが増える!? ｢自分が論文を読んだと証明する｣ための努力をするAI ｢人間が作文したようなレポートを作る｣ように努力をするAI (→ 敵対的生成ネットワークの領域が日常生活を浸食) 81

82.

テキストのみの学習でどこまで知性を獲得できるか? • どこまで賢くなれるかは不明だが､意外と身体は不要? • ヘレンケラーは視覚と聴覚がなかった(が､十分に賢い) • 五感の何れかが欠けた方も多い(が､十分に賢い) • マルチモーダル化も進行中 • GPT-4は画像認識も可能(ただし未公開) • センサーやアームを付ければ､五感や筋肉の模倣も可能 82

83.

化学･材料研究に与える影響 83

84.

インパクト 84

85.

ポイント • まさに｢人工知能｣と呼んでも差し支えないレベルになってきた • これまでのAIは､画像認識や翻訳などに特化 • ｢知能｣というよりは､｢特定の機能｣に近い • GPTは読解力･思考力を有するので､抽象的なタスクを遂行可能 • ｢単なる業務効率化｣に留まらない利用法を考えることが必要 • もちろん､自動化は大切 • ｢膨大な知識｣･｢圧倒的な処理速度｣･｢自律性｣を生かしたシステム創出が鍵 85

86.

人類よりも遙かに多くの文献を読める • 1報の論文を読むのに要する時間 • GPT-4: 数秒以内 • 人間: 数分ー数時間 • 記憶容量 • GPT-4: 原理的には無尽蔵 • 人間: 論文1報の暗記すら困難 86

87.

失敗データも読み込める • 実験の九割程度は｢失敗｣ • • • • どこかにお蔵入り論文にはならない誰も覚えていない同じ過ちを誰かが繰り返す • 人間 • ｢ゴミデータ｣を覚えていられない • GPT • 問題なし 87

88.

研究室の｢デジタル仙人｣が登場する • ありとあらゆる結果を記憶 • 人間よりも知識量大 • 必要な知見を瞬時に回答 • • • • 属人性の排除ローコスト無劣化 (キレない) • 経験知に基づく的確な助言 • 実験結果の予測や条件の提案 • 研究課題の探索 88

89.

ロボット実験が加速する • 人間 • 手作業で制御プログラムを作成 • ハイコスト&⾧時間 • 再現性に課題 • AI • 制御プログラムを自動生成 • 低コスト&瞬時 • いつ･誰が･どこでやっても同じ結果 89

90.

研究成果を AIが執筆する • 人間 • 1000ページの報告書の執筆は辛い • 失敗実験や細かな実験条件は割愛 • AI • 1000ページの報告書も余裕で読解 • あらゆる過程を記録可能 • • • • 細かなプロトコル失敗を含む実験結果ディスカッション計測データ 90

91.

楽しいことに集中できるようになる素敵なアイデアここだけやりたい! 検証･従来手法との比較自動化分析･考察･論文執筆 91

92.

論文システムが効率化する? Nature JACS, PRL, … 執筆･査読のモチベーション大まじめな専門誌そこそこの専門誌執筆･査読の時間が (下にいくほど)辛い諸々の専門誌 (Sci. Rep., etc) 自動化微妙な成果 (未報告) 未報告のため､世界中で､同じ過ちが繰り返される 92

93.

オープンサイエンスとの相性が抜群 • Scientific Reports • Natureグループが出しているオープンアクセス論文 • ｢科学的には微妙｣(だが実は重要かもしれない)論文も出版可能技術的に正しければOK 科学的な意義は問わない https://www.nature.com/srep/about/editorial-process AIに計画を考えさせて､ロボットに実験をさせ､ AIに客観的に正しい考察をさせ､一連の詳細を全て記録すれば､ 93 人間よりも遙かに､技術的に正確な報告ができる

https://www.nature.com/srep/about/editorial-process

94.

Science誌は｢伝統工芸品｣の路線を追求? https://www.science.org/doi/10.1126/science.adg7879 • AIが生成した文章は｢AIからの盗用で､不正に該当｣ • 人手にこだわる伝統工芸品的な発想｡トップ誌の戦略としては有りかも? 94

https://www.science.org/doi/10.1126/science.adg7879

95.

GPTを使った論文執筆の例 • GPTとDeepL write(英文校正)ツールを使った執筆 • 二日で執筆されたそうです • 畠山は､こちらの路線で研究を展開する予定 2023年4月のpreprint https://arxiv.org/abs/2304.04498 https://twitter.com/ochyai/status/16481158065958 42049?s=20 95

96.

最終系: 全てをAI&ロボットに代行? 質問人間 (処理能力に限界) ビッグ要約文書 (論文など) データ実験 24時間労働数百万ページ以上の研究記録 with 生の計測データ課題設定全情報を網羅した上で判断 96

97.

取り組むべき課題理想を実現するための細々としたタスク 97

98.

根底にある課題 • 限りあるGPTのリソースのフル活用 • トークン数の制限 • GPTの実質的な記憶容量は､原稿用紙10枚程度 • 現在の推論能力で､何ができるか • 可能･不可能な作業の見極め 98

99.

例1: ローカルデータを学習したチャットボット • 組織内文書を参照しながらGPTでQ&Aするシステム • BingAIのローカル版 • 研究室のことなら､何でも答えてくれるAI • ラボ内に存在する､ありとあらゆる知識を統合したい • 過去の卒論･修論･博論 etc • 実験ノート • 電子化が必須 • 畠山も取り組んでます • https://bio.nikkeibp.co.jp/atcl/release/22/08/24/14341/ • スライド類 • 計測データ､Excel • ディスカッションの内容(録音) 99

100.

課題は記憶容量(≒token制限) GPTの記憶容量: 原稿用紙10枚程度ラボのデータ: 100万ファイル以上 100

101.

検索システムを噛ませて解決質問と類似度の高いデータを検索して GPTに記憶させる GPTの記憶容量: 原稿用紙10枚程度ラボのデータ: 100万ファイル以上 101

102.

プロトタイプこれ以上のことは今後に研究します 102

103.

テクニカルな課題 • 類似度計算のコスト • 文章のEmbedding vectorを計算させて検索 • GPTのAPIでも可能だが､100万ファイルを計算すると破産する可能性大 • この部分はローカルでも動く安価なLLMで代行するのがよさそう • 知識の統合 • GPTが処理できるのは､あくまで原稿用紙10枚程度の情報 • Naïveな実装では､検索にヒットしなかった(が､実は重要だった)文献の情報が生かされないケースが多発? • ここに､いかに多くの情報を詰め込むかが鍵 • 各データのサマリを纏めた概要書や､知識のグラフ構造化などをすると良い? 103

104.

アイデア: ローカルLLMの活用専門データの学習に特化したローコストなLLM(大規模言語モデル)を作って対話させる? 対話 GPT (ジェネラリスト) 全て学習ローカルLLM (スペシャリスト) 専門データ 104

105.

例2: 圧倒的な知識に基づく推論 • 関連研究の全てを知っているチャットボットに推論させたい • 質問の例 • 従来研究の課題は? • 過去にこの研究(実験)を試した人いる? • 次に行うべき実験は? • ○○の実験がうまくいかなかったけど､どうして? • この実験､うまくいくかな? • XXを合成できたとして､そこで得られる性能はどんな感じ? 105

106.

従来のインフォマティクス手法との統合 • XXを合成できたとして､そこで得られる性能はどんな感じ? • GPTだけでも動くが､流石に性能に限界がありそう 106

107.

ドメイン知識の埋め込みを代行させる回帰･分類モデル予測研究に超詳しいGPT 化学･材料データ予測モデルへのドメイン知識の反映 (これまでは人間が実施｡しかし知識やノウハウに制約･属人性) 107

108.

例: 気体方程式の事前知識これ以上のことは今後に研究します 108

109.

例3: 化学･材料データの認識 GPTの記憶容量: 原稿用紙10枚程度分子データ: 2048ビットなど 109

110.

例3: 化学･材料データの認識 • GPTは化合物名からembedding vectorを計算可能だが… • 化学系データを多く学習しているとも思えないので､精度に不安 • シアノ基だから電子求引性､くらいの推論は可能 • 他の表記法はメモリを食う • 多量の化合物データをメモリに乗せるのは困難 • Fingerprintは2048ビット程度 • 分子記述子も数百次元程度のベクトル • 分子構造の表記法(SMILES)を理解しているとも思えない • しかし何らかの形で認識は必要 • 化合物の検索 • 物性の推論 • 文献検索システムの化合物版を作るイメージ? 110

111.

例4: 自律研究システム • 研究活動そのものを自動化したい • 文献収集 • 課題抽出 • 行うべき実験の設定 • 条件出し • 結果の予測 • 考察 • 報告 111

112.

ヒント1: AutoGPT系 https://twitter.com/shota7180/status/16464356980719738 88?s=20 これ以上のことは今後に研究します 112

https://twitter.com/shota7180/status/16464356980719738

113.

ヒント2: 自律オブジェクトの生成これ以上のことは今後に研究します https://twitter.com/ochyai/status/1637965411575791616?s=20 113

https://twitter.com/ochyai/status/1637965411575791616?s=20

114.

例5: 自動実験 114

115.

自動実験はなぜ難しいか?(特に有機合成) • 複雑でやっかいな有機合成操作(その1) • フラスコの準備 • 試薬瓶の開封 • 一部は禁水･空気厳禁 • 固体･粉体･液体･粘性固体etcの取り出し • 試薬の添加 • オイルバスや冷却槽への移動 • キャニュレーションなどでの逐次添加 • エバポレーションによる溶媒除去 • 飛びきらなかったり､発砲しまくったり､突沸したり､トラブル多数 • 濾過 • なぜか詰まるケース多数 115

116.

自動実験はなぜ難しいか?(特に有機合成) • 複雑でやっかいな有機合成操作(その2) • 分液 • 水･油相がうまく分離しないケース多数 • カラム • 展開溶媒やカラムの検討 • 上手くスポットが分かれない (というか分解してる?) • 副生成物が多すぎて､目的物か分からない • エバポが面倒 • 沈殿生成 (ポリマー系) • うまく沈殿しないケース多数 • 再結晶 • 溶媒選択 • 乾燥 116

117.

自動実験はなぜ難しいか?(特に有機合成) • 複雑でやっかいな計測操作 • サンプル調製･成形 • 装置によって成形法などが異なる • 禁水サンプルだと面倒 • 装置へのセット • 装置によって仕様が異なる • … 117

118.

それでも自動化が必要な理由 • 人間の能力に限界 • 人的コスト • 24時間働けない • 再現性 • 人によって･その日の気分によって､結果が変わる • 動きが毎回微妙に異なるので､再現性が出なかった時に､問題が操作に由来するのか､他の因子に由来するのか､分からない • 記録の緻密性 • 例えば､試薬の添加時間を秒単位で記録できない(面倒なので｡) • しかし一部の実験は影響を大きな受ける • 自然現象に対する精密な記録を付ける上で､操作と記録の自動化は必須 118

119.

自動化の余地と課題 • 世の中の工業製品(化合物を含む)の大半は､ほぼ全自動で制作 • 潜在的には自動化が可能 • 問題はコスト • • • • 自動実験装置の値段は数千万円~ しかもカスタマイズが困難ロボットアームも国産品は基本的に数百万円~ アームを制御するプログラマが必要 119

120.

鍵技術1: GPT • プログラミングの自動化 • 自然言語や音声によるロボット操作 • 自律型GPTによるロボット操作 120

121.

再掲: GPT-4でロボットアームを操作できる 121

122.

122

123.

これ以上のことは今後に研究します 123

124.

鍵技術2 廉価なロボ･IoT • 数千~数万円程度のもの • Amazonで誰でも購入可能 • 試薬がかかって壊れても､すぐに諦められる値段 124

125.

激安ロボットアーム 125

126.

IoT対応マイコン約3500円モーターと連動させ､試薬の運搬､ピペット操作 etcを代行可能? 部品は3Dプリンタで作成可能 https://twitter.com/H0meMadeGarbage/status/ 126 1139766652151697408?s=20

https://twitter.com/H0meMadeGarbage/status/

127.

未来像小型ロボットによる化学実験白雪姫に出てくる｢七人の小人｣をロボット化し､酷使させれば良い! これ以上のことは今後に研究します 127

128.

実験≒プログラミングが主流に? 研究者またはAI 実験ロボット 128

129.

まとめ • “知能”を持つAIによる研究活動の再定義が必要 • ｢AIにやらせた方が良い｣タスクがますます増加 • ロボット・IoTデバイスとの連携による実験研究の全自動化 • 化学･材料研究における3K (キツイ･汚い･危険)からの脱却 • 今後は実験研究者・AI・ロボット専門家の連携が重要 • 協力者を募集中! 129

GPTにできること･やるべきこと(化学･材料研究の視点で)

Kan Hatakeyama

関連スライド

大規模言語モデルに追加学習で専門知識を教える試み (2023, arXiv:2312.03360)

数値で整理する大規模言語モデル(LLM) のメモ

[メモ]大規模言語モデル(LLM)のための文章検索に関する勉強･試行錯誤

大規模言語モデルへの化学的思考の教示と物性予測

それぞれの専門分野(例えば化学・材料)にも､おそらく大規模言語モデルはやってくるだろうという話

化学・有機材料研究におけるAI・GPTなどの利用

各ページのテキスト