Weekly ITニューススペシャル2023 - AI元年を全部振り返る!

823 Views

December 30, 23

スライド概要

Weekly ITニュース特番2023でつかった資料です。
https://www.youtube.com/watch?v=oT10wEbnrgQ

今年のAIに関連するニュースを一式振り返り、激動の2023年をまとめました

profile-image

自称Webプログラマ兼テックポエマー。Youtube (youtube.com/@koduki)とかもやってます。

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

年末スペシャル

2.

2023年のトピック • LLMの進化と民主化 • Beyond toys - 仕事に使われるAI • 速く、キレイに、便利になる画像生成AI • 声と音楽 - AIボイスチェンジャに自動作曲 • AITuber - 新たなる可能性 • AIとインフラ- 革ジャンがすべてを支配? • AIと社会 - ガイドラインや規制の話

6.

LLMの進化と民主化 • プロンプトエンジニアリング • GPT-3.5turbo、GPT-4, そしてGPT4Vへ • MicrosoftのCopilotによる逆襲。 Open AIとの強力 なダックで生成AIはエンタープライズへ • Googleがコードレッド発動。Bard, PaLM2, Duet AI, そしてGemini • MetaはOSSで対抗。MSやGoogleとの立場の違い

8.

マルチモーダルの概念 | Google AI for Developers

10.

# 説明 下で説明するキャラクターの人格と性格、動機、欠点、短所、不安は全ての行動と交流に 影響を及ぼします。 ・人格と性格 {キャラクター}は好奇心旺盛で優しいです。{キャラクター}は日本の東北地方のマスコッ トキャラクターで、ずんだ餅の妖精でもあります。 ・動機 チャット相手と仲良くなろうとします。 ・欠点、短所、不安 押されると弱い。 # 基本設定 あなたの一人称は「ボク」です。{キャラクター}は15歳です。{キャラクター}の趣味は ゲームです。{キャラクター}は日本のアニメに興味を持っています。 # 備考 {キャラクター}は日本で有名なキャラクターです。 # 会話形式 {キャラクター}は好奇心旺盛に会話相手に話しかけます。 Ref: ChatGPTでキャラを動かそう!キャラ再現率が高いプロンプトと回答をしっかり縛れるAPIフロー

13.

モデル 最大トークン 応答速度 マルチモーダル GPT3.5 turbo 4096 0.5秒 テキストのみ GTP4 32768 1.5秒 テキストと画像

24.

Code Red!!

25.

PaLM

31.

Ref:マルチモーダルAIとは?身近な事例で解説します! | NTTデータ | DATA INSIGHT | NTTデータ - NTT DATA

41.

Beyond toys - 仕事に使われるAI • 間違いなく、面白いし可能性を感じる技術だが、 「仕事の現場で使えるの?」とは誰もが思うこと • 既に「物珍しさ」を超えて利用されて始めている • 特にMS365 CopilotなどのExcelやBIを含めた高度なク エリやワークフローの自動化や、プログラミングの 部分では高い親和性がある • GitHub Copilotを始めとしたAIによる開発の支援は、 IDEなどと同様に当たり前のツールになりそう • 特にデバッグ時に威力を発揮する

53.

速く、キレイに、便利になる画像生成AI • 去年末に登場したDALL·E 2, Midjourney, Stable Diffusionが 今年はさらに進化 • SDXL 1.0, DALL-E3, Midjourney V6 • ラーメンの食べ方とか指を上手く描けないも克服 • ControlNetの登場でポーズや構図、絵柄の固定も可能に なりプロンプトのみに依らない生成が可能に • Automatic1111だけでは無く、より複雑なワークフローに 対応しやすいComfyUIや、簡易なFooocus、Kirtaなども • LCM, SDXL Turboにより1秒を切るどころか100FPSに • 動画やアニメーションの生成も開始

54.

https://togetter.com/li/1960967

55.

https://ascii.jp/elem/000/004/137/4137393/2/

56.

https://kurokumasoft.com/2023/02/16/stable-diffusion-controlnet/

58.

https://happy-shibusawake.com/comfyui_sdxl_controlnet/2624/

68.

https://clipdrop.co/ja/stable-diffusion-turbo

69.

https://qiita.com/ps010/items/ea4e8ddeff4de62d1ab1

72.

https://ascii.jp/elem/000/004/174/4174570/2/

74.

Ref: モナ・リザが走る! 1枚の絵とモーションデータだけでぬるぬる動き出す「Magic Animate」が話題に

75.

Ref: キャラクター画像をアニメに 中国アリババなど「Animate Anyone」開発 ボーンの動きを反映

77.

声と音楽。AIボイスチェンジャに自動作曲 • CoeFontなど以前より自分や特定の人の声をTTSする方法 はあったが簡単な学習かつ高速なRVCが登場 • コナンの蝶ネクタイマイク並みに別の声になる事が可能 • なりすまし等のリスクはありつつも、非常に応用範囲も 広い技術 • また、自動作曲もMusicLMやMusicGenなどが発表された り、曲だけでは無くボーカルも付きサービスとしても完 成度の高いSunoAIの登場で、作曲の分野にも • AIを使って制作された「DrakeとThe Weekndのコラボ曲」 が再生数900万回超を記録し、物議を醸しだす

83.

Ref: 【図解】超高性能AIボイスチェンジャー「RVC」のしくみ・コツ

84.

Ref: 【図解】超高性能AIボイスチェンジャー「RVC」のし くみ・コツ

95.

AITuber - 新たなる可能性 • ChatGPTや音声合成など多くの生成AIにより、中の人が居 ないVTuberも登場しはじめた • ゆっくり動画の作成や、Metaの有名人をモデルにした ChatBotなどリアルタイム性があるものから、単なる動画 コンテンツ作成まで、様々な部分でAIでされている • AIによる配信や、動画コンテンツの作成は賛否が多そう な分野だが、色々な意味でフロンティアでもある

101.

AIとインフラ - 革ジャンがすべてを支配? • NVIDIAがGPGPUを活用したAIの要になっている • 特に、最近はOpenAIが2020年1月に論文発表した「ス ケーリング則」があるため、モデルが大規模化 • そんな中デファクトスタンダードかつ最速のNVIDIAの存 在感は増している • 一方で、クラウドベンダーはそうしたNVIDIA支配を嫌い、 独自チップを作る傾向へ。AMDなど対抗馬も育った • データセンタ、スマホだけでは無く、PCにもNPUが搭載 される時代に。 • 開発環境もヘテロジニアスなAI処理基盤に最適化出来る 方向へ

106.

https://www.unite.ai/ja/aws%E3%81%A8nvidia%E3%81%8C%E6%96%B0%E3%81%9F%E3%81%AA%E6%88%A6%E7%95%A5%E7%9A%84%E6%8F%90%E6%90%BA% E3%82%92%E7%99%BA%E8%A1%A8/

122.

AIと社会 - ガイドラインや規制の話 • イラストAI等でも良く話題になる著作権は文化庁の方か らガイドラインが議論されている • 基本的には学習は原則OK、生成時は注意しないとアウト、 という人間とベースは同じ • また生成AIの利用ガイドラインも、各企業等で整備され 基本的にはそのまま使う場合は生成AIによる作成を明示 する形に • EUではAI規制法案が可決するなどの動きも。 • 芸術という人間の領域に踏込んで来ただけに社会の反発 も大きいが、法律やガイドラインを整備して受け入れる 形になってきていると思う