イラストで学ぶ音声認識 1章

120 Views

August 26, 23

音声認識

スライド概要

荒木雅弘

@MasahiroAraki

スライド一覧

機械学習や音声認識に関する書籍を執筆しています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

ダウンロード(pdf - 687.92kB)

関連スライド

ChatGPT 研修用資料 1. ChatGPT の仕組みと基本的な使い⽅

chatgpt

荒木雅弘 2.9K

ChatGPT 研修用資料 3. デザイン思考を題材としたプロンプトエンジニアリングの実践

chatgpt デザイン思考

荒木雅弘 2.9K

ChatGPT 研修用資料 2. プロンプトエンジニアリングの概要

chatgpt

荒木雅弘 1.8K

フリーソフトではじめる機械学習入門 (第2版) 第2章

機械学習 scikit-learn

荒木雅弘 896

フリーソフトではじめる機械学習入門 (第2版) 第1章

機械学習

荒木雅弘 644

フリーソフトではじめる機械学習入門 (第2版) 第8章

機械学習ニューラルネットワーク

荒木雅弘 630

各ページのテキスト

1. はじめに 1.1 1.2 1.3 1.4 1.5 音声認識とは音声認識の歴史どこで役立つのか何が難しいのか本書のねらい • 荒木雅弘 :『イラストで学ぶ音声認識』（講談社, 2015年） • サポートページ

https://masahiroaraki.github.io/GuideToASR/

1.1 音声認識とは • 音声認識の定義 • 人間が声で話す言葉を文字に変換する技術 • 機械可読な意味表現に変換するところまでを含む場合もある • 音声認識における問題設定 • 使用環境 • 利用者 • 単語数 • 出力

1.2 音声認識の歴史 2015年以降・ロボットの音声インタフェース・スマートスピーカー

1.3 どこで役立つのか • ヒューマンインタフェースとして • 携帯端末（スマートフォン、タブレット）や家電・スマートスピーカーなどへの入力手段 • カーナビなど、ハンズフリーが要求される状況 • 情報蓄積・検索 • 会議の議事録作成 • テレビ放送・動画への字幕付与 • 音声検索

1.4 何が難しいのか

1.5 本書のねらい • 音声認識技術の難しさへの対処 1. 分野横断的な技術であるイラストによる直観的な理解 2. パターン認識問題の中でも最も難しいクラスの問題 WFSTによる解決法の解説 3. 実用化の際にノウハウが必要ノウハウを学べるフリーソフトの紹介

本書の構成