158 Views
November 14, 25
スライド概要
Generative Ai Study Group Master
GENERATIVE AI STUDY GROUP 第58回 2025年11月11日 画像生成AIの進化と"一貫性"の時代 ― 仕事でも使える時代へ、画像生成AIの新しい使い方 ― 武藤 本資料では、Stable Diffsion XL および Google Gemini Flash Image(Nano Banana)で 生成・加工した画像を使用しています 1
アジェンダ ➢ 画像生成AIの最新技術 ➢ 画像生成AIの進化の歴史 ➢ 最新画像生成AIは何が凄いのか ➢ 最新画像生成AIの産業界への応用 2
画像生成AIの 最新技術
画像生成AIによる人物写真の生成 画像生成AIに、以下のプロンプトを与えて画像生成 masterpiece, best quality, ultra-detailed, photorealistic, 8k, sharp focus, photograph of a young Japanese woman, 25 years old, looking at viewer, gentle smile, studio portrait, studio lighting, soft light, simple grey background, 実在の人物の写真と区別がつかない画像を簡単に作成 画像やイラスト生成には十分な性能を発揮 実行環境:ローカルマシンにAutomatic1111をインストール 利用モデル:Stable Diffsion XL 1.0系 GPU:16GB 4
これまでの画像生成AIの限界 横顔になるようにプロンプトの一部のみ変更 masterpiece, best quality, ultra-detailed, photorealistic, 8k, sharp focus, photograph of a young Japanese woman, 25 years old, side profile, gentle smile, studio portrait, studio lighting, soft light, simple grey background, パラメータを固定したにも関わらず、 プロンプトの一部変更のみで顔が異なる。 髪型や服も変わっている。 画像一貫性(再現性)の欠如 これまでビジネスに使えなかった理由の一つ 5
一貫性の欠如のビジネス利用上の問題点 ➢ 広告モデルの例 • 状況:画像生成AIで広告モデル(人物)の画像を作成 • ニーズ:広告モデルの服装を変えて広告展開したい • 困りごと:夏服から冬服に変えると、広告モデルが別人・・・・・・ ➢ 自動車のコンセプトデザインの例 • 状況:画像生成AIで次世代電気自動車のコンセプトデザイン画像を作成 • ニーズ:横方向からのデザインも作成したい • 困りごと:特徴的なデザインだった流線的なラインが再現されていない・・・・・・ 6
Google Gemini Flash Image(Nano Banana) 2025年8月に公開された最新の画像生成AI GoogleのGemini 2.5 Flash Image(通称 Nano Banana)による 横顔生成 Google Geminiに 「この画像の横顔を生成してください」 と指示 画像一貫性 顔、髪型、服装まで、ほぼ同一人物で生成 7
既存技術と最新技術の比較 既存技術 最新技術 既存の画像生成AI: 被写体を理解せずに画像生成 最新の画像生成AI: 被写体の特徴を把握して画像生成 画像一貫性は、ビジネスにおいて 様々な応用が考えられます。 • • 同じ人物で服だけ変える 商品の別角度の画像を作る など 8
画像生成AIの 進化の歴史
画像生成AIの歴史 2025年 「Nano Banana」 2022年前半 「Midjourney」 「Stable Diffusion」 「DALL-E 2」 一貫性を保ったまま 画像生成が可能 ビジネス利用の時代へ プロンプトから画像を作る Diffusionモデルがオープンソース化 誰でも本格的な画像を作れる時代に 2019年 「This Person Does Not Exist」 サイト公開 2022年11月 「ChatGPT」公開 画像生成AIの基盤技術GANで 「実在しない人物の写真」を作成 ChatGPTが話題になったのは 画像生成AIよりも後 GAN Diffusion Model 2014年 2020年 画像一貫性 2022年 2025年 10
GAN(Generative Adversarial Network):敵対的生成ネットワーク GAN - 「贋作作家」と「鑑定士」の終わりなき戦い 真贋が見極められない領域へ 本物だと思わせる 偽物を見破る 絵画の贋作作家 絵画の美術鑑定士 リアルな人物画像の生成に成功 「望み通りの画像」は作れない LLMとの対比:一方的に喋り続けるAI こちらの意図を汲んだ対話はできない 引用:Karras et al., “A Style-Based Generator Architecture for GANs”, CVPR 2019 11
Diffusion Model – 言葉から絵を作る仕組み StableDiffusion、Midjourney、DALL-Eなど、現在主流の画像生成AIが採用している手法 プロンプト:若い、日本人、女性、微笑み、…… 「望み通りの画像」が生成できる 「一貫性のある画像」は作れない 画像生成 LLMとの対比:会話ができるAI 質問に対して回答ができる 12
LoRA – 「ファインチューニング」による一貫性 「一貫性がある画像」が生成できる 「ポーズや構図」は指示できない LLMとの対比:ファインチューニングされたAI 追加学習によって、回答の傾向を調整 13
ControlNet - 画像生成AIにポーズや構図を指示する OpenPose機能を利用 骨格図を参照して 画像に「ポーズや構図」を取らせる LLMとの対比:ファイル参照できるAI(RAG等) ファイルを参照して応答を返す 14
Automatic1111によるStable Diffusionのデモ ➢ プロンプトでの画像生成 ➢ LoRAを用いた画像一貫性 ➢ ControlNetを用いたポーズ指定 実行環境:ローカルマシンにAutomatic1111をインストール 利用モデル:Stable Diffsion XL 1.0 GPU:16GB 15
最新画像生成AIは 何が凄いのか
Nano Bananaで何が変わったか 最新技術 (Nano Banana) LoRAによる学習(ファインチューニング)なしで 「画像一貫性」がある「ポーズや構図の変更」が可能に 17
Nano Bananaのデモ 18
最新画像生成AIの 産業界への応用
最新技術の産業界への応用 – 広告・マーケティング 人物モデルによるブランディング ➢ 従来技術 • 季節ごとのバナーを作るため、モデルの撮影を年4回行っていた(コスト大、スケ ジュール調整が大変)。 • 画像生成AIで季節ごとの画像を生成しようとすると、毎回別人が生成され、ブラ ンドイメージが崩壊。 ➢ 最新技術 • 最初に画像生成AIで生成した1枚の「完璧なAIモデル」を基に、指示するだけで 「浴衣姿」「サンタ衣装」などを無限に生成。 • 効果: 撮影コストをほぼゼロにし、クリエイティブの制作スピードが劇的に向上。 20
最新技術の産業界への応用 – 広告・マーケティング AIモデル 浴衣 サンタ 21
最新技術の産業界への応用 – EC・アパレル 宣伝・バーチャル試着 ➢ 従来技術 • 新作の服が出るたびに、モデルが着て撮影する必要があった。 • 従来のバーチャル試着技術は不自然で、購買意欲をそぐことも。 ➢ 最新技術 • ユーザーがアップロードした自分の写真に、ECサイト上の服を自然に着せ替え。 あらゆる角度からの確認が可能。 • 効果: 顧客体験が向上し、購入率アップと返品率低下に貢献。 22
最新技術の産業界への応用 – EC・アパレル ユーザーの写真 バーチャル試着 角度、ポーズ変更 23
最新技術の産業界への応用 – 製造・プロダクトデザイン 自動車コンセプトデザイン ➢ 従来技術 • 1つのデザイン画から、デザイナーが手描きで他のアングルを書き起こしてい た(時間がかかる)。 • 画像生成AIで別アングルを生成すると、デザインの整合性が取れず使えない。 ➢ 最新技術 • 元のデザイン画を元に、リア、サイド、内装のラフデザインを数分で大量生成。 • 効果: アイデア出しから詳細検討への移行がスムーズになり、開発期間を短縮。 24
最新技術の産業界への応用 – 製造・プロダクトデザイン 基本デザイン 側面図 内装図 25
最新技術の産業界への応用 – 建設・不動産 施主へのプレゼン力向上 ➢ 従来技術 • 住宅やビルなどの完成予想図は専門家が作成し、修正に時間とコストがかかっ ていた。 • 「雨の日の見え方は?」「夜のライティングは?」といった急な要望に即答できな かった。 ➢ 最新技術 • 1枚の基本画像から、天候、時間帯、季節を変えたバリエーションをその場で生成 して提示。 • 効果: 施主との合意形成が早まり、成約率アップにつながる。 26
最新技術の産業界への応用 – 建設・不動産 住宅完成予想図 夜間照明 角度変更 27
まとめ
まとめ 1. 画像生成AIの最大の壁 • 従来技術では、高品質な画像を生成できても、状況を変えると「別人」になってしまう • ビジネス利用において致命的 2. 最新技術(Nano Banana)の登場によるブレイクスルー • 画像一貫性により、ビジネスに使える画像生成AIに 3. 画像生成AIの進化の歴史 • GAN • DiffusionModel • LoRA • ControlNet • 最新技術で画像一貫性を獲得 4. ビジネス応用 • コスト削減から新しい価値創造まで、画像生成AIによる新たな可能性が広がった • LLMが「テキスト業務」を変えたように、最新の画像生成AIはビジネスの「ビジュアル業務」を変革 • 画像生成AIのビジネス活用が現実になってくる時代 29
ご清聴ありがとうございました