« CHI2025 LBW採択 | トップページ | 無限の理論の開拓者 »

音を聞き取るAIについての教科書

2025年2月26日 (水) 投稿者: メディア技術コース

メディア学部の大淵です。

コロナ社から出ている「メディアテクノロジーシリーズ」には、メディア学部からも多くの先生方が編者・著者として関わられていますが、このたび新たに「音源分離・音声認識」という本が出版されました。私は編者としてのみ関わり、実際の内容は、大阪大学の武田龍先生と、神戸大学の高島遼一先生が執筆してくださいました。雑音の中で、聞きたい音声だけを取り出す技術が音源分離、そしてそれをコンピューターに聞き取らせるのが音声認識です。スマホに向かって話した内容をAIが文字にしてくれるアプリは、こうした技術に支えられています。

Mediatechnology9

本書が扱う分野は、研究としての歴史も長く、よい教科書もたくさん出版されています。ただ、長らく「実用化まであと一歩」と評されていた分野であり、どの教科書も、同じ分野の研究者が次の一歩を進めるために書かれているという印象でした。しかし、近年の深層学習の進歩により、"声を聞き取るコンピューター"が身近なものになってきたのは、皆さんもご存じの通りです。実用レベルの性能が実現されるようになると、様々な分野の研究者が、この技術を使って何か面白いことができないかと考えるようになります。そういった方に、音源分離と音声認識の最新動向を知っていただきたいというのが、今回この本を出そうと思ったきっかけでした。

画像処理やUI、インタラクティブシステムなど、異なる分野の研究者の方にこそ読んでいただきたい一冊です。ぜひご一読ください。

お知らせ」カテゴリの記事

« CHI2025 LBW採択 | トップページ | 無限の理論の開拓者 »