5. 集計・集約

>100 Views

January 12, 22

スライド概要

(リレーショナルデータベースの基本)(全15回)
URL: https://www.kkaneko.jp/cc/ds/index.html

profile-image

金子邦彦(かねこくにひこ) 福山大学・工学部・教授 ホームページ: https://www.kkaneko.jp/index.html 金子邦彦 YouTube チャンネル: https://youtube.com/user/kunihikokaneko

シェア

埋め込む »CMSなどでJSが使えない場合

各ページのテキスト
1.

5. 集計・集約 URL: https://www.kkaneko.jp/cc/ds/index.html 金子邦彦 謝辞:この資料では「いらすとや」のイラストを使用しています 1

2.

アウトライン 番号 項目 説明時間の 目安 5-1 集計・集約 6分 5-2 SQL での集計・集約 9分 5-3 Access を用いた集計・集約の実演・実習 14分 2

3.

リレーショナルデータベースでの集計集約 米国成人調査データ 調査に協力した人たちの年 齢分布は? 教育と年収の関係を見る 3

4.

今日の内容 • SQL を用いた集計・集約の方法、そのバリエーションを知る グループ化の基準となる属性(複数可能)、 集計・集約の種類 4

5.

5-1. 集計・集約 5

6.

集計・集約の例 元データ A B 3 2 行数 A B 90 93 得点の平均 6

7.

集計・集約とは ◆ 集計・集約は、データをグループ化して、 グループごとに何らかの計算を行うこと A B 3 2 行数 Aさんは 3科目 Bさんは 2科目受講した A B 90 93 得点の平均 Aさんは平均 90 Bさんは平均 93 7

8.

集計・集約のバリエーション① 集計・集約の種類のバリエーション 元データ A B 270 186 A B 3 2 行数 A B 90 93 得点の平均 A B 95 96 得点の最大 A B 85 90 得点の最小 得点の合計 8

9.

集計・集約のバリエーション② グループ化の基準となる属性のバリエーション A B 3 2 行数 A B 90 93 得点の平均 「受講者」でグループ化 国語 算数 理科 2 2 1 行数 グループ化の基準となる属性は、 1個でもよいし複数個でもよい (あとで実演・実習) 国語 算数 理科 87.5 93 95 得点の平均 「科目」でグループ化 9

10.

グループ化の基準が受講者 「受講者」でグループ化 元データ A B 90 93 得点の平均 10

11.

グループ化の基準が科目 「科目」でグループ化 元データ 国語 算数 理科 87.5 93 95 得点の平均 11

12.

5-2. SQL での集計・集約 12

13.

リレーショナルデータベースシステム データベースシステムの一種 コンピュータ 記憶 装置 リレーショナル リレーショナル データベース データベース 管理システム たくさんのテーブルが格納される あわせて リレーショナルデータベースシステム 13

14.

SQL での集計・集約の書き方 select ○, ○, ○ フィールド名、 count(*) sum(集計するフィールド名) avg(集計するフィールド名) max(集計するフィールド名) min(集計するフィールド名) を並べる from <集計・集約したいテーブル名> group by <グループ化の基準> 14

15.

SQL のキーワード • 行数 count • 合計 sum • 平均 avg • 最大 max • 最小 min 15

16.

集計・集約を行う問い合わせ(クエリ)の例 集計・集約結果は 1つのテーブル select 受講者, count(*) from 成績 group by 受講者; 問い合わせ(クエリ) のコマンド A B 3 2 結果 成績テーブル 16

17.

集計・集約を行う問い合わせ(クエリ)の例 select 受講者, avg(得点) from 成績 group by 受講者; select 科目, avg(得点) from 成績 group by 科目; グループ化の基準の違い (Access での実行結果画面を示す) 17

18.

5-3. Access を用いた集計・集 約の実演・実習 18

19.

実演・実習で使うデータベース 米国成人調査データ (1994年、米国における統計調査データのうち 32561 人分) ※ このデータを使います (演習では、特定の職業、学歴、性別、母国を差別的に見ないようにしてください) データの出典:Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science (米国) 19

20.

実演・実習用のデータベースファイル • 実演・実習用の Access データベースファイル ※ セレッソの利用者は,セレッソからダウンロー ド可能 • 「コンテンツの有効化」のメッセージが出たとき は、確認のうえ、次にすすむ • つぎのような表示が出たときは、確認のうえ、 「はい」 20

21.

米国成人調査データ 21

22.

SELECT 年齢, count(*) FROM 米国成人調査データ GROUP BY 年齢; ・空白文字や , や count(*) は半角 ・「;」は最後にだけ 調査に協力した人たちの年齢分布は? 22

23.

SELECT 教育, count(*) FROM 米国成人調査データ GROUP BY 教育; ・空白文字や , や count(*) は半角 ・「;」は最後にだけ 調査に協力した人たちの教育の分布は? 23

24.

SELECT 週当たり労働時間, count(*) FROM 米国成人調査データ GROUP BY 週当たり労働時間; ・空白文字や , や count(*) は半角 ・「;」は最後にだけ 調査に協力した人たちの週当たり労働時間の分布は? 24

25.

SELECT 年収5万ドル以上か, count(*) FROM 米国成人調査データ GROUP BY 年収5万ドル以上か; ・空白文字や , や count(*) は半角 ・「年収5万ドル以上か」は全角 ・「;」は最後にだけ 25

26.

SELECT 教育, 年収5万ドル以上か, count(*) FROM 米国成人調査データ GROUP BY 教育, 年収5万ドル以上か; ・空白文字や , や count(*) は半角 ・「年収5万ドル以上か」は全角 ・「;」は最後にだけ 教育と年収の関係を見る 26

27.

関連資料 • リレーショナルデータベース序論(全4回) 全体を知る. https://www.kkaneko.jp/cc/di/index.html • リレーショナルデータベースの基本(全15回) 基礎を学ぶ. https://www.kkaneko.jp/cc/ds/index.html • リレーショナルデータベース演習(全15回) 演習により修得する. https://www.kkaneko.jp/cc/de/index.html 27