音声の認識に必要な情報はどれくらい?
2017年3月14日 (火) 投稿者: メディア技術コース
みなさん、こんにちは、
コンピュータによる音声認識には、高度の信号処理、複雑なプログラムと膨大な記憶装置を必要とします。人間の音声認識性能はそれ以上ですので、脳の中ににはさらに高性能で規模の大きな情報処理システムがあると考えられます。
それでは、次の音声を聞いてください。
何と言っていましたか?雑音っぽいですが、「おもしろい」ですよね?
さて、この音声のサウンドスペクトログラムを見てみましょう。
これは、どうやって作ったかというと
1、音声を800ヘルツの間隔で7つの周波数成分に分ける。
2、各周波数の音声の音量変化を調べる
3、各周波数の雑音を発生させて、音量変化だけは音声と同じにする。
4、その7つの雑音を足し合わせる。
通常「あ」や「い」の周波数成分の情報を表現するには256もの値が必要なのですが、それをわずか7つにまでにしてしまっているのです。
それでは、さらにそれを1500ヘルツ間隔にした音声を聞いてみましょう。
どうですか?何とか「おもしろい」にきこえますね?スペクトログラムを見るとびっくりです。
「在学生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019.03.14)
- あにめたまご2019「文化庁若手アニメータ等人材育成事業」(2019.03.12)
- タイの提携校、キンモンクット大学トンブリに短期訪問しませんか?(2019.03.11)
- 学会紹介:ADADA Japan学術大会と情報処理学会EC2019(2019.03.09)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
「高校生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019.03.14)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- ゲームの学会?!(2019.03.07)
- 香港理工大学デザイン学部の紹介(2019.03.04)
- 香港理工大学デザイン学部を訪問し、学部長Lee先生にお会いしました!(2019.03.03)
「おもしろメディア学」カテゴリの記事
- 【研究紹介】お城を数値で作り上げる!:日本城郭のプロシージャルモデリング(2019.01.22)
- 【研究紹介】プロジェクションマッピングはエンタメだけじゃない!プロジェクションマッピングによる動作支援(2019.01.15)
- 高大連携企画・映像制作ワークショップを開催しました(2019.01.14)
- 【再掲】世にも恐ろしい本当にあった話...(からぁ~の,エール!)(2019.01.09)
- 【研究紹介】”匂い”で季節感を感じさせることはできるか?(2019.01.06)