cs-6. データベース,データサイエンス

スライド概要

コンピューターサイエンス
URL: https://www.kkaneko.jp/cc/cs/index.html

profile-image

kunihikokaneko

@6674398749

作者について:

金子邦彦(かねこくにひこ) 福山大学・工学部・教授 ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

スライド一覧
シェア
埋め込む»CMSなどでJSが使えない場合

公開日

2021-12-17 04:38:00

各ページのテキスト

1. cs-6. データベース, データサイエンス (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 謝辞:この資料では「かわいいフリー素材集 いらすとや」のイラストを使用しています 1

2. アウトライン 1. データベース 2. 表計算ソフトウエア 3. Office 365 と Excel 4. Excel の基本 5. 散布図(Excel を使用) 6. 合計、平均(Excel を使用) 7. 分布、密度(Excel を使用) 8. 人工知能でのデータの活用 2

3. 6-1 データベース (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 謝辞:この資料では「かわいいフリー素材集 いらすとや」のイラストを使用しています 3

4. データベースとは データベースとは、あるテーマに沿って収集さ れた大量のデータ 取引 記入 データ収集 データベース 計測 撮影 データ保存 4

5. なぜデータベースが必要なのか • • • • 銀行 銀行口座のデータベース 商店 商品のデータベース 交通機関 座席のデータベース 電話会社 通話量のデータベース など データベースが無くては、 もはや、生活が成り立たない 5

6. データベースのさまざまな活用例 • 米国クイズ番組 「ジョバディ」 に挑戦する人工知能 • IBM 社 Watson • 約2億ページ(本、百科事典など)のデータベー スを活用 クイズ番組と人工知能 (thegurdian社Webページより転載) • 将来の天候、台風の進度などを予測する天気予報 • 過去の気温、降水、日照、降雨、降雪、風向、 風速、 • 湿度、気圧、雲量のデータベースを活用 • ブログ,記事投稿での情報共有 • 食べログ (http://tabelog.com) は、70万以上の店 舗情報、 • 500万以上の記事のデータベース 6

7. サイバーフィジカル 現実世界(フィジカル)を、サイバー世界で再現、 シミュレーション 農林畜産業、 医療、 ヘルスケア、 製造業、 都市交通、 電力 など 実世界 サービス 提供 センサー センサーの設置 分析、 予知・予測 センサー データ サイバー世界 センサーで計 測された距離 画像 実世界に張り巡らされたセンサーネットワークの情 報から、新しい社会サービスを生み出す 人間の通過記録 7

8. 6-2 表計算ソフトウエア (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 8

9. パソコンの威力 • ワープロ 文書の編集、清書.目次、表の作成など • 表計算 データの管理、計算、グラフ作成など • プレゼン ビジュアル資料作成 • インターネット 情報収集、コミュニケーション データはすべてデジタル(ファイル). 管理、共有、交換が簡単 9

10. 表計算ソフトウエアは何の役に立つのか • データの記録、保管、共有 • 表計算の機能 = 集計・集約、グラフ作成など

11. 例えば、こんなことが簡単にできます 表の作成 単価を書き変えると Excel の画面 合計が自動で 再計算される Excel の画面

12. 例えば、こんなことが簡単にできます グラフ

13. 例えば、こんなことが簡単にできます 条件に合致するデータの 強調表示 並べ替え

14. 6-3 Office 365 と Excel (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 14

15. Office 365 の主な機能 ワード (文書作成) エクセル (表計算) ワンノート (電子ノート) パワーポイント (プレゼン) アウトルック (電子メール) • パソコンでレポートを作成したり,発表したり, データをまとめたりで便利 15

16. Office 365 の種類 • Office 365 のオンライン版 WEBブラウザで使う. https://portal.office.com 各自の ID とパスワードでサインインが必要. • Office 365 のアプリ版 前もってインストールが必要. インストールでは,大量の通信が行われる. (時間がかかる.通信費用にも注意) 2種類ある.この授業では,どちらを使用しても問題 ない 16

17. Office 365 オンライン版で Excel を起動 【要点】 Web ブラウザで,次のページを開き,各自の ID とパスワードでサインイン https://portal.office.com 17

18. Office 365 オンライン版で Excel を起動 ① Web ブラウザで,次のページを開く https://portal.office.com ② 電子メールアドレスを入れる.「次へ」をクリック. (例)p1234567@fukuyama-u.ac.jp 18

19. Office 365 オンライン版で Excel を起動 ③ パスワードを入れ,「サインイン」をクリック パスワードは,各自が設定したもの ④ Excel を使いたいときは,メニューで Excel を選ぶ さまざまなメニュー 19

20. Office 365 オンライン版で Excel を起動 ⑤ Excel のブックの種類を選ぶ この授業では「新しい空白のブック」を使う ⑥ Excel の画面が開く 20

21. Office 365 アプリ版のインストールと Excel の起動 【要点】 インストールは,Office 365 アプリ版を使えるよう にするための作業(最初に行う). そのとき,次のページを開き,各自の ID とパスワードでサ インイン https://portal.office.com インストールが終わったら,スタートメニュー等で Excel を 起動 21

22. Office 365 アプリ版のインストールと Excel の起動 ① Web ブラウザで,次のページを開く https://portal.office.com ② 電子メールアドレスを入れる.「次へ」をクリック. (例)p1234567@fukuyama-u.ac.jp 22

23. Office 365 アプリ版のインストールと Excel の起動 ③ パスワードを入れ,「サインイン」をクリック パスワードは,各自が設定したもの ④ 画面で「Office のインストール」をクリック.メニューで 「Office 365 のアプリ」を選ぶ 23

24. Office 365 アプリ版のインストールと Excel の起動 ⑤ 画面の指示に従い,インストールを行う インストールでは,大量の通信が行われる. (時間がかかる.通信費用にも注意) 次のような指示がでる 1.保存する 2.フォルダーを開く 3.実行し,その後も,画面の指示に従う 24

25. Office 365 アプリ版のインストールと Excel の起動 ⑥ Excel を使うときは,スタートメニューなどで Excel を選ぶ ⑦ Excel のブックの種類を選ぶ この授業では「新しい空白のブック」を使う ⑧ Excel の画面が開く 25

26. 6-4 Excel の基本 (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 26

27. オンライン版の Excel の画面(メニュー、リ ボン、ワークシートなど) メニュー リボン ワークシート 表形式で値など が入る. グラフの挿入な ども可能 表形式で、値や数式を並べる オンライン版の Excel の画面 27

28. アプリ版の Excel の画面(メニュー、リボン、 ワークシートなど) メニュー リボン ワークシート 表形式で値など が入る. グラフの挿入な ども可能 表形式で、値や数式を並べる アプリ版の Excel の画面 (Excel 2019 の画面を示している)28

29. Excel のワークシート Excel のワークシート(シートともいう)には、 表形式で、値や数式を並べる. グラフの挿入なども可能 Excel のワークシートの例

30. Excel のブック • Excel のブックは、Excel のファイルのこと • 1つあるいは複数のワークシートを、1つのブックに保存 することができる Excel で保存するときに、ファイル名などを設定できる. 30

31. Excel のスタート画面 Excel を起動すると、最初にスタート画面が表示される. 作成したいブックの種類を選ぶことができる. 過去の履歴の確認もできる この授業では「新しい空白 のブック」を使う オンライン版 アプリ版

32. アクティブセル • Excel での編集中のセル 32

33. アクティブセルでの数式の入力 数式を入力したいときは、頭に半角の「=」を付ける キーボードで「=100+200」と 入力を終わりたいので 打つと、アクティブセルに数式が入る Enter キーを押す. すると、数式が自動計算される

34. 数式バーで数式の確認① 数式バーに 数式が表示される (ここで修正もできる) 「300」のところを クリック アクティブセルが動く

35. 数式バーで数式の確認② 数式バーに 数式が表示される (ここで修正もできる) 「300」のところを ダブルクリック アクティブセルのところ に数式が表示される (ここでも修正できる)

36. アクティブセルでの数式の入力 「=B3+B4」のような数式もある キーボードで「=B3+B4」と 打つと、アクティブセルに数式が入る 入力を終わりたいので Enter キーを押す. すると、数式が自動計算される

37. Excel の数式 • Excel では、数式の頭に、半角の「=」を付ける • 数式は、半角文字である • 数式の中には、番地(「B3」や「B4」など)を書 くことができる

38. セルの数式と値のクリア 消えた! クリアしたいセルを右クリックして、 「数式と値のクリア」を選ぶ

39. セルの数値と値のクリア 消えた! クリアしたいセルを範囲選択(マウスでド ラッグ)したあと、右クリックして、「数式 と値のクリア」を選ぶ

40. 元に戻す操作 「元に戻す」 ボタン オンライン版の Excel でも 「元に戻す」ボタンはある 何かの操作を したとする 「元に戻す」ボタン を押すと元に戻る もとに戻す操作は CTRL + Z (コントロールキーと「Z」を同時押し)でも,できる

41. 6-5 散布図(Excel を使用) (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 41

42. 散布図の用途 • 時間変化 横軸は時間. 散布図から, 時間変化を読み取る • 分布 横軸と縦軸は,2つの量. 散布図から, 2つの量の間の関係を見る 42

43. 分布から読み取れること 2つの量に関係がある 密集 縦 軸 は 花 び ら の 幅 密集 密集 かたまり かたまり 横軸は花びらの長さ 43

44. Excel での散布図の作成手順 元データ ① グラフ化したい部分を範囲選択 アプリ版の Excel オンライン版の Excel ② リボンで「挿入」→散布図 散布図が得られる 44

45. Excel での散布図の種類の選択 挿入 散布図を展開 アプリ版の Excel 一番左上の散布図 をクリック 挿入 散布図を展開 オンライン版の Excel 一番左の散布図を クリック 45

46. 元データ 年次 出生数 死亡数 1985 1432 752 1990 1222 820 1995 1187 922 1600 2000 1191 962 1400 2005 1063 1084 2010 1071 1197 グラフ タイトル 1200 1000 800 600 400 200 0 1980 1985 1990 1995 2000 出生数 死亡数 散布図 2005 2010 46

47. 6-6 合計、平均(Excel を使用) (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 47

48. Excel で合計を求める SUM =SUM(C2:C7) は, 範囲 C2 から C7 の 合計を求める 48

49. Excel で平均を求める AVERAGE =AVERAGE(B2:B7) は, 範囲 B2 から B7 の 平均を求める 49

50. 平均 • 平均の基本,合計して,データの個数で割る 10, 40, 30, 40 の平均: 120 ÷ 4 で 30 • 複数の値の組の平均を考えることもある (10, 5), (40, 10), (30, 5), (40, 20) の平均: 合計は 120 と 40.4で割って (30, 10) 平均は,データ集合の代表とみる ことができる場合がある 平均 計測に誤差があるとき, 複数の計測を繰り返し,平均をとる ことで,誤差を軽減できることも 50

51. 平均を使うときの注意点 平均 平均 このような平均に, 意味があるでしょうか? データの分布によっては,平均では役に 立たないこともある. (平均は万能ではない) 51

52. 6-7 分布、密度(Excel を使用) (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 52

53. ヒストグラム ヒストグラムは,区間ごとに,データを数え上げた もの データが 何個あるのか 区間 0.6 ~ 1.1 の データは 10個 53

54. Excel でのヒストグラムの作成手順 元データ ① ヒストグラム化したい列を選択 アプリ版の Excel オンライン版の Excel ② リボンで「挿入」→ヒストグラム の選択 ヒストグラムが得られる 54

55. ヒストグラムから読み取れること 密度が高い 密度が低い 【全体の傾向】 山が2つある(1つではない) 55

56. データサイエンスの要点 • データから,正しく知見や結論を導くこと • 決して「難解な数式が出てきて難しい」ものでは ない • 正しい手順を踏んで,データから知見や結論を導 くことにつながる 56

57. 6-8 人工知能でのデータの活用 (コンピューターサイエンス) URL: https://www.kkaneko.jp/cc/cs/index.html 金子邦彦 57

58. 大量の分類済み データ 3種類に分類済み 学習 学習者 データの傾向,どういう 基準で分類されているか などを学習(特徴抽出) 上にあれば:水色 左下にあれば:オレンジ 右下にあれば:緑色 58

59. 学習者 新しいデータ 新しいデータを自動で 分類できる能力を獲得 新しいデータは:赤色 • 間違えることもある • 学習に使うデータは多い ほど良い結果になる 59

60. アヤメ属 (Iris) 内花被片 • 多年草 • 世界に 150種. 日本に 9種. • 花被片は 6個 外花被片 • 外花被片(がいかひへん) Sepal 3個(大型で下に垂れる) • 内花被片(ないかひへん) Petal 3個(直立する) 60

61. Iris データセット Iris データセットのうち、先頭 10 行 ◆ 3種のアヤメの外花被 辺、内花被片を計測 ◆ 種類のデータも setosa versicolor virginica ◆ データ数は 50 × 3 外花被片(Sepal) 内花被片(Petal) 種類 の長さと幅 の長さと幅 作成者:Ronald Fisher 作成年:1936 61

62. Iris データセットの散布図 縦 軸 : 内 花 被 片 の 幅 横軸:内花被片の長さ 次の3種類の分類済みのデータ setosa versicolor virginica 62

63. 演習 63

64. ① 次のデータについて,Excel で散布図を作る ② 次のデータについて,出生数 1432, 1222, 1187, 1191, 1063, 1071 の合計と平均を求める 64

65. ③ Iris データセットについて,C 列と D 列で散布 図を作る ④ Iris データセットについて, D 列でヒストグラ ムを作る 65