« 変数名一つ考えるのに半日 | トップページ | Introduction to Exchange Activities with KMUTT Thailand-Tokyo University of Technology,Japan »

大学院講義紹介「先端音声処理特論」

2017年2月 4日 (土) 投稿者: メディア技術コース

「音声処理」は、メディア学部の重要な研究分野の一つです。一方で、人工知能の発展とともに、その元となる「機械学習」への注目度が高まっています。それではこの2つのテーマは実際にはどのように結びつくのでしょうか。大学院講義「先端音声処理特論」では、音声認識や話者認識といった応用を例に、機械学習で用いられる様々な概念について解説します。

毎週の講義前半では、前の週に学んだトピックに関連する論文を、輪講形式で紹介してもらいます。講義では出てこない、データ処理の細かいノウハウなども、論文を読む中で学んでいくことができます。そして講義後半では、翌週の論文で扱うテーマについて、概要を解説します。

2016年の講義で紹介してもらった論文は、音声認識・音声合成・話者認識・音響分類・特徴抽出・音声データベースという6テーマに関するものでした。こうした応用を念頭に置いて学ぶことで、機械学習の様々な手法についても、理解を深められたのではないかと思います。

もちろん、8回の講義という限られた時間では、こうした最先端の研究の全貌を把握するところまでは行けません。本講義で最も重要視しているのは、データを集めて、分析して、実際のシステムで活用するという一連の流れを実感して、そうした観点から自分の研究を見直してもらうことです。音声処理のテーマで研究を行っている人は、講義で得られた知識を実行に移すために、方法論の詳細を自ら学んでくれることでしょう。一方で、音声処理そのもののテーマに従事してはいない人も、何らかの意味でのデータ処理には関わっているはずですから、そこで「あれ、自分のやり方はこれで良かったのかな」と振り返ってもらえれば、本講義の価値はあったと言えるでしょう。

そして最後に、「英語の論文を読んで、内容を理解し、自分の言葉でそれをプレゼンテーションする」ということも、大学院で学ぶべき大切なことの一つです。プレゼンテーションの技術についても、講義を通じていろいろと学んでもらえればと思っています。

(大淵 康成)

授業紹介」カテゴリの記事

« 変数名一つ考えるのに半日 | トップページ | Introduction to Exchange Activities with KMUTT Thailand-Tokyo University of Technology,Japan »