aa-2. データサイエンス・AIの事例

693 Views

April 22, 22

人工知能データサイエンス平均人工知能による分類人工知能による合成散布図合計分布密度特徴抽出

スライド概要

トピックス: 表計算ソフトウエア Excel，散布図（Excel を使用），合計、平均（Excel を使用），分布、密度（Excel を使用），人工知能による分類，特徴抽出，人工知能による生成
--------------------

人工知能
https://www.kkaneko.jp/db/mi/index.html
--------------------

【外部ページへのリンク】
人工知能のデモサイト

顔の表情など：https://cloud.google.com/vision/docs/drag-and-drop
どちらが実在で，どちらがフェイクの顔か： https://www.whichfaceisreal.com/
イラストの合成 (Waifu Labs): https://waifulabs.com/
--------------------

YouTube 動画
https://youtu.be/bJjGqTGXUZI

kunihikokaneko

@6674398749

スライド一覧

金子邦彦（かねこくにひこ）福山大学・工学部・教授ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pptx - 33.33MB)

ダウンロード(pdf - 3.83MB)

関連スライド

各ページのテキスト

2. データサイエンス・AI の事例（人工知能） URL: https://www.kkaneko.jp/cc/mi/index.html 金子邦彦 1

https://www.kkaneko.jp/cc/mi/index.html

アウトライン 1. 表計算ソフトウエア Excel 2. 散布図（Excel を使用） 3. 合計、平均（Excel を使用） 4. 分布、密度（Excel を使用） 5. 人工知能による分類、特徴抽出 6. 人工知能による生成 2

2-1 表計算ソフトウエア Excel 3

パソコンの威力 • ワープロ文書の編集、清書．目次、表の作成など • 表計算データの管理、計算、グラフ作成など • プレゼンビジュアル資料作成 • インターネット情報収集、コミュニケーションデータはすべてデジタル（ファイル）．管理、共有、交換が簡単 4

Excel の画面（メニュー、リボン、ワークシートなど）メニューリボンワークシートの中には、表形式で値などが入る． ※グラフの挿入なども可能表形式で、値や数式を並べる Excel の画面（Excel 2019 の画面を示している） 5

Excel のブック • Excel のブックは、Excel のファイルのこと • １つあるいは複数のワークシートを、１つのブックに保存することができる Excel で保存するときに、ファイル名などを設定できる． 6

Excel のスタート画面 Excel を起動すると、最初にスタート画面が表示される 7

Excel のスタート画面 Excel を起動すると、最初にスタート画面が表示される新しい空白のブックの作成新しいブックの作成メニュー最近使用したブックがあるときは、その一覧が表示される使用する Excel のバージョンによって，画面構成が異なる場合がある 8

Excel の起動直後の画面種類として「空白のブック」を選んだ場合メニューリボン空のワークシート 9

10.

2-2 散布図（Excel を使用） 10

11.

12.

Excel での散布図の作成手順元データ ② ① グラフ化したい部分を範囲選択リボンで「挿入」→散布図の選択散布図が得られる 12

13.

Excel での散布図の種類の選択挿入散布図を展開一番左上の散布図をクリック 13

14.

元データ年次出生数死亡数 1985 1432 752 1990 1222 820 1995 1187 922 1600 2000 1191 962 1400 2005 1063 1084 2010 1071 1197 グラフタイトル 1200 1000 800 600 400 200 0 1980 1985 1990 1995 2000 出生数死亡数散布図 2005 2010 14

15.

散布図の用途 • 時間変化 • 分布横軸は時間．横軸と縦軸は，２つの量．散布図から時間変化を読み取る２つの量の間の関係を見る 15

16.

分布から読み取れること２つの量に関係がある密集縦軸は花びらの幅密集密集かたまりかたまり横軸は花びらの長さ 16

17.

2-3 データの合計、平均（Excel を使用） 17

18.

Excel で合計を求める SUM =SUM(C2:C7) は，範囲 C2 から C7 の合計を求める 18

19.

Excel で平均を求める AVERAGE =AVERAGE(B2:B7) は，範囲 B2 から B7 の平均を求める 19

20.

平均 • 平均の基本，合計して，データの個数で割る 10, 40, 30, 40 の平均: 120 ÷ 4 で 30 • 複数の値の組の平均を考えることもある (10, 5), (40, 10), (30, 5), (40, 20) の平均: 合計は 120 と 40．4で割って (30, 10) 平均は，データ集合の代表とみることができる場合がある平均計測に誤差があるとき，複数の計測を繰り返し，平均をとることで，誤差を軽減できることも 20

21.

平均を使うときの注意点平均平均このような平均に，意味があるでしょうか？データの分布によっては，平均では役に立たないこともある．（平均は万能ではない） 21

22.

2-4 データの分布、密度（Excel を使用） 22

23.

ヒストグラムヒストグラムは，区間ごとに，データを数え上げたものデータが何個あるのか区間 0.6 ～ 1.1 のデータは 10個 23

24.

Excel でのヒストグラムの作成手順元データ ② ① ヒストグラム化したい列を選択リボンで「挿入」→ヒストグラムの選択ヒストグラムが得られる 24

25.

ヒストグラムから読み取れること密度が高い密度が低い【全体の傾向】山が２つある（１つではない） 25

26.

データサイエンスの要点 • データから，正しく知見や結論を導くこと • 決して「難解な数式が出てきて難しい」ものではない • 正しい手順を踏んで，データから知見や結論を導くことにつながる 26

27.

2-5 データの分類，特徴抽出での人工知能の応用 27

28.

大量の分類済みデータ３種類に分類済み学習学習者データの傾向，どういう基準で分類されているかを学習（特徴抽出）上にあれば：水色左下にあれば：オレンジ右下にあれば：緑色 28

29.

学習者新しいデータ新しいデータを自動で分類できる能力を獲得新しいデータは：水色 • 間違えることもある • 学習に使うデータは多いほど良い結果になる 29

30.

アヤメ属 (Iris) 内花被片 • 多年草 • 世界に 150種. 日本に 9種. • 花被片は 6個外花被片 • 外花被片（がいかひへん） Sepal 3個（大型で下に垂れる） • 内花被片（ないかひへん） Petal 3個（直立する） 30

31.

Iris データセット Iris データセットのうち、先頭 10 行 ◆ 3種のアヤメの外花被辺、内花被片を計測 ◆ 種類のデータも setosa versicolor virginica ◆ データ数は 50 × 3 外花被片(Sepal) 内花被片(Petal) 種類の長さと幅の長さと幅作成者：Ronald Fisher 作成年：1936 31

32.

Iris データセットの散布図縦軸：内花被片の幅横軸：内花被片の長さ次の３種類の分類済みのデータ setosa versicolor virginica 32

33.

人工知能分野の手法（LDA法）による分析例元データ LDA 法の結果空間が区分けされた．新しいデータを自動で分類できる能力を獲得 33

34.

人工知能の一種であるニューラルネットワークは，「データからのパターンの抽出」を行っているという考え方もニューラルネットワークが扱うさまざまなレベルのパターン MIT Introduction to Deep Learning | 6.S191, https://www.youtube.com/watch?v=5tvmMX8r_OM の「Why Deep Learning」のページ 34

https://www.youtube.com/watch?v=5tvmMX8r_OM

35.

画像分類を行うオンラインサービス元画像画像分類の結果 URL：https://cloud.google.com/vision/docs/drag-and-drop 35

https://cloud.google.com/vision/docs/drag-and-drop

36.

データの分類，特徴抽出での人工知能の応用 • データによる学習を行う • 学習を重ねることで上達する • データは大量にあればあるほど良い • 「学習によって，未知のデータに対しても当てはまるパターンや規則を抽出（特徴抽出）している」という考え方もある 36

37.

人工知能の利用での注意点思い込みを疑い，根拠を確認することが大切．《思い込みの例》 • 「人工知能だから，１００％正解」 • 「人工知能の能力は，必ず，人間を上回る」 • 「人工知能に，すべてを任せても大丈夫」人工知能は，データによる学習で動く．間違った結果を出すこともある．万能ではない． 37

38.

2-6 AI による生成（人工知能）金子邦彦 38

39.

GAN （敵対性生成ネットワーク）のニュース • 実在しない人間の顔画像を生成 tl-GAN, https://docs.google.com/presentation/d/1OpcYLBVpUF1LwwPHu_CyKjXqXD0oRwBoGP2peSCrSA/edit#slide=id.g4551faa5ed_0_208 より • 色分け図や線画をリアルに変換 Video-to-Video Synthesis, https://www.youtube.com/watch?v=S1OwOd-war8 より 39

40.

GAN を利用したオンラインのデモサイト • どちらが実在で，どちらがフェイクかのクイズを行うオンラインのサイト https://www.whichfaceisreal.com/ 実在（デモサイト）フェイク 40

https://www.whichfaceisreal.com/

41.

GAN を利用したオンラインのデモサイト Waifu Labs • Waifu Labs の URL https://waifulabs.com/ （デモサイト） • 人工知能が二次元イラストを生成選択画面選択画面選択画面生成された画像 41

https://waifulabs.com/

42.

GAN の仕組みディープラーニングによるデータの生成能力を示す研究のひとつノイズ人工知能による生成データの生成生成されたデータと実在のデータが識別できなくなるように学習生成されたデータ実在のデータ人工知能による識別実在，フェイク実在なのかフェイクなのかを識別 Generative Adversarial Networks, Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, https://arxiv.org/abs/1406.2661 42

43.

GAN の仕組み • 人工知能による生成フェイクだと見分けがつかないように生成することを学習 • 人工知能による識別生成されたデータが現実なのかフェイクなのかの識別を学習 43

44.

GAN の自律動作マシンへの応用（ニュース） • 自律動作マシンの動作検証や，内蔵の人工知能の学習 • 現実世界で行うには手間がかる • 人工知能を用いて，仮想世界を生成し，使用．人工知能で生成された画像を，自動運転車の学習に利用 SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving Zhenpei Yang, Yuning Chai, Dragomir Anguelov, Yin Zhou, Pei Sun, Dumitru Erhan, Sean Rafferty, Henrik Kretzschmar 44

45.

人工知能で，年齢，髪量，口の開き具合，髪の波うち，眼鏡などさまざまな特徴に応じた顔を生成可能 tl-GAN, https://docs.google.com/presentation/d/1OpcYLBVpUF1LwwPHu_CyKjXqXD0oRwBoGP2peSCrSA/edit#slide=id.g4551faa5ed_0_208 より45

https://docs.google.com/presentation/d/1OpcYLBVpUF1L-wwPHu_CyKjXqXD0oRwBoGP2peSCrSA/edit

46.

GAN を用いた高解像度化（ニュース）低解像度の画像をもとに，高解像度の画像を人工知能で生成 https://techxplore.com/news/2020-06-artificial-intelligence-blurry-sharper.html より 46

https://techxplore.com/news/2020-06-artificial-intelligence-blurry-sharper.html

47.

GAN を用いた画像改善（ニュース）暗い画像を，明るくすることが人工知能で可能に EnlightenGAN: Deep Light Enhancement without Paired Supervision Yifan Jiang, Xinyu Gong, Ding Liu, Yu Cheng, Chen Fang, Xiaohui Shen, Jianchao Yang, Pan Zhou, Zhangyang Wang 47

48.

GAN を用いた種々の画像の合成（ニュース）さまざまな種類の画像を，安定して，高精細に生成することが可能に Large Scale GAN Training for High Fidelity Natural Image Synthesis Andrew Brock, Jeff Donahue, Karen Simonyan, https://arxiv.org/abs/1809.11096v2

aa-2. データサイエンス・AIの事例

kunihikokaneko

関連スライド

dn-5. 顔検出， 顔認識（Dlib, InsightFace を使用）

bt-7. Blender 3.0 の液体のアニメーション

NVIDIA ドライバ, CUDA 11.6, cuDNN 8.4 のインストール (Windows 上) (2022年4月の最新版)

ae-9. 姿勢推定

1. データベースとは，データベースシステムとは，情報とデータ

ae7ae-7. 予測・判断（時系列データ，リカレントニューラルネットワーク，LSTM）

各ページのテキスト

dn-5. 顔検出，顔認識（Dlib, InsightFace を使用）