アルゴリズム超初心者入門

2.2K Views

June 02, 23

スライド概要

中学生向けのプログラミングのワークショップで作成したスライドです

profile-image

画像生成AIについて研究している大学院生です。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

アルゴリズム超初心者入門 探索アルゴリズムをscratchで実装してみよう

2.

この資料について 対象とする読者: • scratch学習済み • プログラミングを知らない人向け(中学生想定) 内容: • 探索アルゴリズム • 線形探索、二分探索、ハッシュ探索について

3.

「問題を解決する定型的な手法・技法」のこと。(広辞苑から引用)

4.

「問題を解決する定型的な手法・技法」のこと。(広辞苑から引用) →色々な「問題」がある Ex) ・クラス全員を身長の高い順に並べる(整列) ・特定の身長に一致する人物を探し出す(探索) ・文章の中から特定の単語を探す(文字列照合)

5.

「問題を解決する定型的な手法・技法」のこと。(広辞苑から引用) →色々な「問題」がある Ex) ・クラス全員を身長の高い順に並べる(整列) ・特定の身長に一致する人物を探し出す(探索) ・文章の中から特定の単語を探す(文字列照合) →これら問題ごとに「定型的な」解き方が存在することが多い →「アルゴリズム」と呼ぶ

6.

今回扱うアルゴリズム:探索(サーチ) 例)クラス全員の身長を集めたデータの中から、 特定の身長に一致する人物を探す

7.

今回扱うアルゴリズム:探索(サーチ) 例)クラス全員の身長を集めたデータの中から、 特定の身長に一致する人物を探す より一般には「探索」とは、 あるデータの集合から、特定の値を持った要素を取り出すこと

8.

今回扱うアルゴリズム:探索(サーチ) 例)クラス全員の身長を集めたデータの中から、 特定の身長に一致する人物を探す より一般には「探索」とは、 あるデータの集合から、特定の値を持った要素を取り出すこと 例えば、 [165, 161, 157, 171, 160, 172, 168] という配列から171を探す。 ・何番目にある? ・そもそもあるかどうかもわからない

9.

同じ問題を解くにしても、 いろんなアルゴリズムがある 今回紹介する探索のアルゴリズムは3つ • 線形探索 • 二分探索 • ハッシュ探索 ・それぞれメリットやデメリットがある。 ・どんな状況でどんな探索をしたいかによって使い分ける

10.

さっそくアルゴリズムの解説 ・・・のまえに、実際に探索アルゴリズムを 利用した例を紹介してみる

11.

Q. とある1週間にTwitterに投稿された全フリー素材の中で、 RT数がちょうど100のものを見てみたい

12.

Q. とある1週間にTwitterに投稿された全フリー素材の中で、 RT数がちょうど100のものを⾒てみたい RT数がちょうど100のものを見てみたい データの集合…Twitter API というものを使って ツイートの情報を取得できる ※2021/6/14~6/21に、#フリー素材 をつけて投稿されたものをデータの対象とした

13.

Q. とある1週間にTwitterに投稿された全フリー素材の中で、 RT数がちょうど100のものを見てみたい データの集合…Twitter API というものを使って ツイートの情報を取得できる ※2021/6/14~6/21に、#フリー素材 をつけて投稿されたものをデータの対象とした 実際にデータを集めてみると、731ツイートもある 目視で探すのは大変・・・

14.

Q. とある1週間にTwitterに投稿された全フリー素材の中で、 RT数がちょうど100のものを見てみたい データの集合…Twitter API というものを使って ツイートの情報を取得できる ※2021/6/14~6/21に、#フリー素材 をつけて投稿されたものをデータの対象とした 実際にデータを集めてみると、731ツイートもある 目視で探すのは大変・・・ →探索アルゴリズムの出番

15.

結果 無事、所望のイラストを 見つけることができた 出典 : @mirumirumirumo_ https://twitter.com/mirumirumirumo_/status/140510998 6913525760

16.

結果 無事、所望のイラストを 見つけることができた 「え?どうやったの?」 出典 : @mirumirumirumo_ https://twitter.com/mirumirumirumo_/status/140510998 6913525760

17.

結果 無事、所望のイラストを 見つけることができた 「え?どうやったの?」 さっそくアルゴリズムを学んでいきましょう 出典 : @mirumirumirumo_ https://twitter.com/mirumirumirumo_/status/140510998 6913525760

18.

線形探索

19.

線形:「直線状」 • 単純に一番左から順番に探していく。

20.

線形:「直線状」 • 単純に一番左から順番に探していく。 [165, 161, 157, 171, 160, 172, 168] から171を探す

21.

線形:「直線状」 • 単純に一番左から順番に探していく。 [165, 161, 157, 171, 160, 172, 168] から171を探す ①165は171じゃない

22.

線形:「直線状」 • 単純に一番左から順番に探していく。 [165, 161, 157, 171, 160, 172, 168] から171を探す ①165は171じゃない ②161は171じゃない

23.

線形:「直線状」 • 単純に一番左から順番に探していく。 [165, 161, 157, 171, 160, 172, 168] から171を探す ①165は171じゃない ②161は171じゃない ③157は171じゃない

24.

線形:「直線状」 • 単純に一番左から順番に探していく。 [165, 161, 157, 171, 160, 172, 168] から171を探す ①165は171じゃない ②161は171じゃない ③157は171じゃない ④171は171 → 見つけた!

25.

Scratchで実装してみよう #データ集合を作る #linear_searchブロックで線形探索を行う

26.

#発見!

27.

・メリット:元のデータの形はなんでもよい ・デメリット:時間がかかる

28.

・メリット:元のデータの形はなんでもよい ・デメリット:時間がかかる 先ほどの例では配列の要素数が7 →探す値によって何回目に見つかるかが変わるが、 平均的にはだいたい4回目に見つかる

29.

・メリット:元のデータの形はなんでもよい ・デメリット:時間がかかる 先ほどの例では配列の要素数が7 →探す値によって何回目に見つかるかが変わるが、 平均的にはだいたい4回目に見つかる →配列の要素数が70なら、だいたい35回目 →配列の要素数が700なら、だいたい350回目 →配列の要素数が2Nなら、だいたいN回目

30.

・メリット:元のデータの形はなんでもよい ・デメリット:時間がかかる 先ほどの例では配列の要素数が7 →探す値によって何回目に見つかるかが変わるが、 平均的にはだいたい4回目に見つかる →配列の要素数が70なら、だいたい35回目 →配列の要素数が700なら、だいたい350回目 →配列の要素数が2Nなら、だいたいN回目 1回の操作で要素1つの正誤を判断しているので、操作回数は要素数に比例する

31.

二分探索

32.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する

33.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する [157, 160, 161, 165, 168, 171, 172] から171を探す ※昇順に整列しといた

34.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する [157, 160, 161, 165, 168, 171, 172] から171を探す ①165は171より小さい ※昇順に整列しといた

35.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する [157, 160, 161, 165, 168, 171, 172] から171を探す ※昇順に整列しといた ①165は171より小さい したがって171は後半のどこかにある

36.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する [157, 160, 161, 165, 168, 171, 172] から171を探す ※昇順に整列しといた ①165は171より小さい したがって171は後半のどこかにある [168, 171, 172] から171を探す

37.

• 昇順(or降順)に整列されたデータの集合に対して 適用できるアルゴリズム • まず真ん中の要素から比較する [157, 160, 161, 165, 168, 171, 172] から171を探す ※昇順に整列しといた ①165は171より小さい したがって171は後半のどこかにある [168, 171, 172] から171を探す 以降同じことを繰り返す

38.

scratchで実装してみよう #昇順に並んだデータを適当に生成 #「答え」に探したいキーを入力

39.

#リストの要素からsearchvalueを探す #findID番目にあるとする #見つかったら終わり #見つからなくても全て探索したら終わり

40.

#見つかったということ #右半分にsearchValueがあるはず # 左半分にsearchValueがあるはず

41.

・デメリット:元のデータの形が整列されてなければ使えない ・メリット:線形探索に比べて速い

42.

・デメリット:元のデータの形が整列されてなければ使えない ・メリット:線形探索に比べて速い 1回比較するごとに探す範囲が半分になっていく 配列の要素数が7のとき: 配列の要素数が70のとき:

43.

・デメリット:元のデータの形が整列されてなければ使えない ・メリット:線形探索に比べて速い 1回比較するごとに探す範囲が半分になっていく 配列の要素数が7のとき: 7→4→2→1 3回で終わる 配列の要素数が70のとき:

44.

・デメリット:元のデータの形が整列されてなければ使えない ・メリット:線形探索に比べて速い 1回比較するごとに探す範囲が半分になっていく 配列の要素数が7のとき: 7→4→2→1 3回で終わる 配列の要素数が70のとき:70→35→18→9→5→3→2→1 7回で終わる

45.

・デメリット:元のデータの形が整列されてなければ使えない ・メリット:線形探索に比べて速い 1回比較するごとに探す範囲が半分になっていく 配列の要素数が7のとき: 7→4→2→1 3回で終わる 配列の要素数が70のとき:70→35→18→9→5→3→2→1 7回で終わる やはり、平均35回かかる線形探索より早い!

46.

配列の要素数が700のときは?

47.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる

48.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる →10回で終わる

49.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる →10回で終わる つまり、配列の要素数が1024(=210)以下なら、最大でも10回で終わる

50.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる →10回で終わる つまり、配列の要素数が1024(=210)以下なら、最大でも10回で終わる 配列の要素数が2NならN回で終わる!

51.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる →10回で終わる つまり、配列の要素数が1024(=210)以下なら、最大でも10回で終わる 配列の要素数が2NならN回で終わる! 線形探索の2N個から探すだけで平均N回もかかった

52.

配列の要素数が700のときは? 700を2で割っていくと(商は切り上げ)、10回目で1になる →10回で終わる つまり、配列の要素数が1024(=210)以下なら、最大でも10回で終わる 配列の要素数が2NならN回で終わる! 線形探索のN回は2N個しか探せなかった Nが大きくなるほど差がつく 二分探索は線形探索に比べ指数的に早くなっていく

53.

Q 紙を何回折ると月に届く?

54.

Q 紙を何回折ると月に届く? 0.1mmの紙を1回折ると0.2mm、2回折ると0.4mm 折るごとに厚さは2倍になっていく

55.

Q 紙を何回折ると月に届く? 0.1mmの紙を1回折ると0.2mm、2回折ると0.4mm 折るごとに厚さは2倍になっていく 25回折ると富士山とほぼ同じ高さ 35回折ると日本列島の長さ

56.

Q 紙を何回折ると月に届く? 0.1mmの紙を1回折ると0.2mm、2回折ると0.4mm 折るごとに厚さは2倍になっていく 25回折ると富士山とほぼ同じ高さ 35回折ると日本列島の長さ 41回折ると約22万km 42回折ると約44万km > 地球と月の距離約38万km

57.

Q 紙を何回折ると月に届く? 0.1mmの紙を1回折ると0.2mm、2回折ると0.4mm 折るごとに厚さは2倍になっていく 25回折ると富士山とほぼ同じ高さ 35回折ると日本列島の長さ 41回折ると約22万km 42回折ると約44万km > 地球と月の距離約38万km 242 2×42 44万>>>84

58.

ハッシュ探索

59.

• 探索対象のデータ集合がハッシュになっている場合に使える

60.

• 探索対象のデータ集合がハッシュになっている場合に使える • 「ハッシュ値とは、元になるデータから一定の計算手順により 求められた固定長の値」 IT用語辞典から引用

61.

• 探索対象のデータ集合がハッシュになっている場合に使える • 「ハッシュ値とは、元になるデータから一定の計算手順により 求められた固定長の値」 IT用語辞典から引用 • 計算手順はなんでもいい 良し悪しはあるが

62.

• 探索対象のデータ集合がハッシュになっている場合に使える • 「ハッシュ値とは、元になるデータから一定の計算手順により 求められた固定長の値」 IT用語辞典から引用 • 計算手順はなんでもいい 良し悪しはあるが 例えば157で割ったときの余りをハッシュ値とする 165, 161, 157, 171, 160, 172, 168でハッシュを作ると、

63.

• 探索対象のデータ集合がハッシュになっている場合に使える • 「ハッシュ値とは、元になるデータから一定の計算手順により 求められた固定長の値」 IT用語辞典から引用 • 計算手順はなんでもいい 良し悪しはあるが 例えば157で割ったときの余りをハッシュ値とする 165, 161, 157, 171, 160, 172, 168でハッシュを作ると、 余り 0 データ 157 1 2 3 4 160 161 5 6 7 8 165 9 10 11 168 12 13 14 15 171 172 16

64.

• 171を探す 余り 0 データ 157 1 2 3 4 160 161 5 6 7 8 165 9 10 11 168 12 13 14 15 171 172 16

65.

• 171を探す 余り 0 データ 157 1 2 3 4 160 161 5 6 7 ①171のハッシュ値を計算する 171÷157=1余り14 8 165 9 10 11 168 12 13 14 15 171 172 16

66.

• 171を探す 余り 0 データ 157 1 2 3 4 160 161 5 6 7 ①171のハッシュ値を計算する 171÷157=1余り14 ②データの14番目を探す 8 165 9 10 11 168 12 13 14 15 171 172 16

67.

• 171を探す 余り 0 データ 157 1 2 3 4 160 161 5 6 7 ①171のハッシュ値を計算する 171÷157=1余り14 ②データの14番目を探す 8 165 9 10 11 168 12 13 14 15 171 172 16

68.

• 171を探す 余り 0 データ 157 1 2 3 4 160 161 5 6 7 8 165 9 10 11 168 ①171のハッシュ値を計算する 171÷157=1余り14 ②データの14番目を探す ③171があったら探索成功、 なかったらデータ全体に無いということ 12 13 14 15 171 172 16

69.

・デメリット:データの衝突が起きる可能性がある →色々な解決法

70.

・デメリット:データの衝突が起きる可能性がある →色々な解決法 ・メリット:どの要素も(殆ど)一発で見つかる →データの要素数Nに対して、常に1回

71.

・デメリット:データの衝突が起きる可能性がある →色々な解決法 ・メリット:どの要素も(殆ど)一発で見つかる →データの要素数Nに対して、常に1回 当然、線形探索や二分探索より圧倒的に早い! ただし、ハッシュを構築しておく必要がある

72.

・線形探索 ・二分探索 ・ハッシュ探索

73.

・線形探索 ・二分探索 ・ハッシュ探索 課題: ・二分探索をするためにはデータをソート(整列)させておく必要がある ・ハッシュ探索で衝突したらどうする? ・他にどんなアルゴリズムがあるか?