aa-2. データサイエンス・AIの事例

380 Views

April 22, 22

スライド概要

トピックス: 表計算ソフトウエア Excel,散布図(Excel を使用),合計、平均(Excel を使用),分布、密度(Excel を使用),人工知能による分類,特徴抽出,人工知能による生成
--------------------

人工知能
https://www.kkaneko.jp/db/mi/index.html
--------------------

【外部ページへのリンク】
人工知能のデモサイト

顔の表情など:https://cloud.google.com/vision/docs/drag-and-drop
どちらが実在で,どちらがフェイクの顔か: https://www.whichfaceisreal.com/
イラストの合成 (Waifu Labs): https://waifulabs.com/
--------------------

YouTube 動画
https://youtu.be/bJjGqTGXUZI

profile-image

金子邦彦(かねこくにひこ) 福山大学・工学部・教授 ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

シェア

埋め込む »CMSなどでJSが使えない場合

各ページのテキスト
1.

2. データサイエンス・AI の事例 (人工知能) URL: https://www.kkaneko.jp/cc/mi/index.html 金子邦彦 1

2.

アウトライン 1. 表計算ソフトウエア Excel 2. 散布図(Excel を使用) 3. 合計、平均(Excel を使用) 4. 分布、密度(Excel を使用) 5. 人工知能による分類、特徴抽出 6. 人工知能による生成 2

3.

2-1 表計算ソフトウエア Excel 3

4.

パソコンの威力 • ワープロ 文書の編集、清書.目次、表の作成など • 表計算 データの管理、計算、グラフ作成など • プレゼン ビジュアル資料作成 • インターネット 情報収集、コミュニケーション データはすべてデジタル(ファイル). 管理、共有、交換が簡単 4

5.

Excel の画面(メニュー、リボン、ワーク シートなど) メニュー リボン ワークシートの 中には、表形式 で値などが入る. ※グラフの挿入 なども可能 表形式で、値や数式を並べる Excel の画面 (Excel 2019 の画面を示している) 5

6.

Excel のブック • Excel のブックは、Excel のファイルのこと • 1つあるいは複数のワークシートを、1つのブックに保存 することができる Excel で保存するときに、ファイル名などを設定できる. 6

7.

Excel のスタート画面 Excel を起動すると、最初にスタート画面が表示される 7

8.

Excel のスタート画面 Excel を起動すると、最初にスタート画面が表示される 新しい空白の ブックの作成 新しいブック の作成 メニュー 最近使用し たブックが あるときは、 その一覧が 表示される 使用する Excel のバージョンによって, 画面構成が異なる場合がある 8

9.

Excel の起動直後の画面 種類として「空白のブック」を選んだ場合 メニュー リボン 空のワークシート 9

10.

2-2 散布図(Excel を使用) 10

12.

Excel での散布図の作成手順 元データ ② ① グラフ化したい部分を範囲選択 リボンで「挿入」→散布図の選択 散布図が得られる 12

13.

Excel での散布図の種類の選択 挿入 散布図を 展開 一番左上の散布 図をクリック 13

14.

元データ 年次 出生数 死亡数 1985 1432 752 1990 1222 820 1995 1187 922 1600 2000 1191 962 1400 2005 1063 1084 2010 1071 1197 グラフ タイトル 1200 1000 800 600 400 200 0 1980 1985 1990 1995 2000 出生数 死亡数 散布図 2005 2010 14

15.

散布図の用途 • 時間変化 • 分布 横軸は時間. 横軸と縦軸は,2つの量. 散布図から時間変化を読み取る 2つの量の間の関係を見る 15

16.

分布から読み取れること 2つの量に関係がある 密集 縦 軸 は 花 び ら の 幅 密集 密集 かたまり かたまり 横軸は花びらの長さ 16

17.

2-3 データの合計、平均 (Excel を使用) 17

18.

Excel で合計を求める SUM =SUM(C2:C7) は, 範囲 C2 から C7 の 合計を求める 18

19.

Excel で平均を求める AVERAGE =AVERAGE(B2:B7) は, 範囲 B2 から B7 の 平均を求める 19

20.

平均 • 平均の基本,合計して,データの個数で割る 10, 40, 30, 40 の平均: 120 ÷ 4 で 30 • 複数の値の組の平均を考えることもある (10, 5), (40, 10), (30, 5), (40, 20) の平均: 合計は 120 と 40.4で割って (30, 10) 平均は,データ集合の代表とみる ことができる場合がある 平均 計測に誤差があるとき, 複数の計測を繰り返し,平均をとる ことで,誤差を軽減できることも 20

21.

平均を使うときの注意点 平均 平均 このような平均に, 意味があるでしょうか? データの分布によっては,平均では役に 立たないこともある. (平均は万能ではない) 21

22.

2-4 データの分布、密度 (Excel を使用) 22

23.

ヒストグラム ヒストグラムは,区間ごとに,データを数え上げた もの データが 何個あるのか 区間 0.6 ~ 1.1 の データは 10個 23

24.

Excel でのヒストグラムの作成手順 元データ ② ① ヒストグラム化したい列を選択 リボンで「挿入」→ヒストグラム の選択 ヒストグラムが得られる 24

25.

ヒストグラムから読み取れること 密度が高い 密度が低い 【全体の傾向】 山が2つある(1つではない) 25

26.

データサイエンスの要点 • データから,正しく知見や結論を導くこと • 決して「難解な数式が出てきて難しい」ものでは ない • 正しい手順を踏んで,データから知見や結論を導 くことにつながる 26

27.

2-5 データの分類,特徴抽出 での人工知能の応用 27

28.

大量の分類済み データ 3種類に分類済み 学習 学習者 データの傾向,どういう 基準で分類されているか を学習(特徴抽出) 上にあれば:水色 左下にあれば:オレンジ 右下にあれば:緑色 28

29.

学習者 新しいデータ 新しいデータを自動で 分類できる能力を獲得 新しいデータは:水色 • 間違えることもある • 学習に使うデータは多い ほど良い結果になる 29

30.

アヤメ属 (Iris) 内花被片 • 多年草 • 世界に 150種. 日本に 9種. • 花被片は 6個 外花被片 • 外花被片(がいかひへん) Sepal 3個(大型で下に垂れる) • 内花被片(ないかひへん) Petal 3個(直立する) 30

31.

Iris データセット Iris データセットのうち、先頭 10 行 ◆ 3種のアヤメの外花被 辺、内花被片を計測 ◆ 種類のデータも setosa versicolor virginica ◆ データ数は 50 × 3 外花被片(Sepal) 内花被片(Petal) 種類 の長さと幅 の長さと幅 作成者:Ronald Fisher 作成年:1936 31

32.

Iris データセットの散布図 縦 軸 : 内 花 被 片 の 幅 横軸:内花被片の長さ 次の3種類の分類済みのデータ setosa versicolor virginica 32

33.

人工知能分野の手法(LDA法)による分析例 元データ LDA 法の結果 空間が区分けされた. 新しいデータを自動で 分類できる能力を獲得 33

34.

人工知能の一種であるニューラルネットワークは, 「データからのパターンの抽出」を行っているとい う考え方も ニューラルネットワークが扱うさまざまなレベルのパターン MIT Introduction to Deep Learning | 6.S191, https://www.youtube.com/watch?v=5tvmMX8r_OM の「Why Deep Learning」のページ 34

35.

画像分類を行うオンラインサービス 元画像 画像分類の結果 URL:https://cloud.google.com/vision/docs/drag-and-drop 35

36.

データの分類,特徴抽出での人工知能の応用 • データによる学習を行う • 学習を重ねることで上達する • データは大量にあればあるほど良い • 「学習によって,未知のデータに対しても当て はまるパターンや規則を抽出(特徴抽出)して いる」という考え方もある 36

37.

人工知能の利用での注意点 思い込みを疑い,根拠を確認することが大切. 《思い込みの例》 • 「人工知能だから,100%正解」 • 「人工知能の能力は,必ず,人間を上回る」 • 「人工知能に,すべてを任せても大丈夫」 人工知能は,データによる学習で動く.間違った結果を出す こともある.万能ではない. 37

38.

2-6 AI による生成 (人工知能) 金子邦彦 38

39.

GAN (敵対性生成ネットワーク)のニュース • 実在しない人間の顔画像を生成 tl-GAN, https://docs.google.com/presentation/d/1OpcYLBVpUF1LwwPHu_CyKjXqXD0oRwBoGP2peSCrSA/edit#slide=id.g4551faa5ed_0_208 より • 色分け図や線画をリアルに変換 Video-to-Video Synthesis, https://www.youtube.com/watch?v=S1OwOd-war8 より 39

40.

GAN を利用したオンラインのデモサイト • どちらが実在で,どちらがフェイクかのクイズを 行うオンラインのサイト https://www.whichfaceisreal.com/ 実在 (デモサイト) フェイク 40

41.

GAN を利用したオンラインのデモサイト Waifu Labs • Waifu Labs の URL https://waifulabs.com/ (デモサイト) • 人工知能が二次元イラストを生成 選択画面 選択画面 選択画面 生成された 画像 41

42.

GAN の仕組み ディープラーニングによるデータの生成能力を示す 研究のひとつ ノイズ 人工知能に よる生成 データの生成 生成されたデータと 実在のデータが識別 できなくなるように学習 生成され たデータ 実在の データ 人工知能に よる識別 実在, フェイク 実在なのかフェイク なのかを識別 Generative Adversarial Networks, Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, https://arxiv.org/abs/1406.2661 42

43.

GAN の仕組み • 人工知能による生成 フェイクだと見分けがつかないように生成する ことを学習 • 人工知能による識別 生成されたデータが現実なのかフェイクなのか の識別を学習 43

44.

GAN の自律動作マシンへの応用(ニュース) • 自律動作マシンの動作検証や,内蔵の人工知能の学習 • 現実世界で行うには手間がかる • 人工知能を用いて,仮想世界を生成し,使用. 人工知能で生成された画像を,自動運転車の学習に利用 SurfelGAN: Synthesizing Realistic Sensor Data for Autonomous Driving Zhenpei Yang, Yuning Chai, Dragomir Anguelov, Yin Zhou, Pei Sun, Dumitru Erhan, Sean Rafferty, Henrik Kretzschmar 44

45.

人工知能で,年齢,髪量,口の開き具合,髪の波う ち,眼鏡などさまざまな特徴に応じた顔を生成可能 tl-GAN, https://docs.google.com/presentation/d/1OpcYLBVpUF1LwwPHu_CyKjXqXD0oRwBoGP2peSCrSA/edit#slide=id.g4551faa5ed_0_208 より45

46.

GAN を用いた高解像度化(ニュース) 低解像度の画像をもとに,高解像度の画像を人工知 能で生成 https://techxplore.com/news/2020-06-artificial-intelligence-blurry-sharper.html より 46

47.

GAN を用いた画像改善(ニュース) 暗い画像を,明るくすることが人工知能で可能に EnlightenGAN: Deep Light Enhancement without Paired Supervision Yifan Jiang, Xinyu Gong, Ding Liu, Yu Cheng, Chen Fang, Xiaohui Shen, Jianchao Yang, Pan Zhou, Zhangyang Wang 47

48.

GAN を用いた種々の画像の合成(ニュース) さまざまな種類の画像を,安定して,高精細に生成すること が可能に Large Scale GAN Training for High Fidelity Natural Image Synthesis Andrew Brock, Jeff Donahue, Karen Simonyan, https://arxiv.org/abs/1809.11096v2