イラストで学ぶ音声認識 14章

>100 Views

August 26, 23

スライド概要

profile-image

機械学習や音声認識に関する書籍を執筆しています。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

14. おわりに 14.1 音声分析ツール wavesurfer 14.2 HMM 作成ツール HTK 14.3 大語彙連続音声認識エンジン Julius 14.4 バーチャルエージェント対話ツール MMDAgent • 荒木雅弘 :『イラストで学ぶ音声認識』 (講談社, 2015年) • サポートページ

2.

14.1 音声分析ツール wavesurfer • ダウンロードサイト https://sourceforge.net/projects/wavesurfer/ • 音声の録音・再生・分析を行うツール • 音声波形・スペクトログラム・基本周波数などを表示すること ができる • 特定区間の周波数分析結果も表示可能 • 最新版: 2020年5月公開

3.

14.2 HMM 作成ツール HTK • ダウンロードサイト http://htk.eng.cam.ac.uk/ • 音声認識用のHMMを作成し、評価するまでの一連のツール群 • • • • • • • HSLab: 音声収録・ラベル付けツール HCopy: MFCCなどの特徴量計算 HInit: HMMを学習させる際の初期値計算 HRest: バウム・ウェルチアルゴリズムによるHMMの学習 HParse: 正規文法をネットワーク文法に変換 HVite: ビタビアルゴリズムで認識結果を求める HResult: 作成したHMMの評価コマンド • ver3.5ではDNNに対応 • 最新版: 2016年6月公開

4.

14.3 大語彙連続音声認識エンジン Julius • ダウンロードサイト https://github.com/julius-speech/julius • フリーの音声認識用汎用デコーダ • ver4.4以降では、GMM-HMMとDNN-HMMを切り替えて使用 することが可能 • ディクテーションを行うためのキット(音響モデル・言語モデ ル込み)も配布されている • 文法を用いた認識を行うためのキット(サンプル文法込み)も 配布されている • 最新版: 2020年9月公開

5.

14.4 バーチャルエージェント対話ツール MMDAgent • ダウンロードサイト http://mmdagent.jp/ • 音声認識・音声合成・バーチャルエージェントを組み合わせた 対話システム開発キット • FSTで対話パターンを記述する • マニュアル・講習会資料等 http://www.udialogue.org/ja/encyclopedia-ja • 最新版: 2021年10月公開 https://mmdagent-ex.dev/ja/