« 映像表現・芸術科学フォーラムで3年越しの発表 | トップページ | 卒業する皆さんへ »

情報処理学会全国大会での発表

2023年3月16日 (木) 投稿者: メディア技術コース

みなさん、こんにちは。

3月2日から4日にかけて東京都調布市の電気通信大学で情報処理学会第85回全国大会が開催されました。今回、私の研究室の大学院生の北村さんが発表したので簡単にレポートしたいと思います。学会発表はコロナ前のような対面発表が増えてきましたが、今回もZoom併用のハイブリッド開催でした。北村さんは現地の電気通信大学の会場で発表しました。

Img_3957s Img_3958s
情報処理学会はコンピュータやネットワークなど情報処理に関するあらゆる分野の研究者が会員となっている情報系ではかなり大きな学会です。その全国大会は毎年3月に数日間をかけ多様な分野ごとの研究発表が行われる場になっています。大学4年生や大学院修士課程2年生の卒業・修了の時期でもあるので、その成果発表の場にもなっています。学部生・大学院修士課程の学生までが対象の学生セッションと博士課程の学生や社会人研究者が対象の一般セッションがあります。

Img_3949s

北村さんは今回、学生セッションで発表しました。発表タイトルは「日本語文読唇向けデータセット構築のための口形素ベースコーパスの基礎検討」です。この研究は、現在活用分野が広がっている音声認識の音声の代わりに人が話している顔(とくに口の周囲)の映像から何を話しているのかを判断する(ためのデータに関しての)ものです。この分野では深層学習という手法を使うのが主流となっていますが、深層学習では学習に使う膨大なデータが必要となり、それが性能に与える影響も大きいため、データをどのように用意すればよいのかについて検討しました。具体的にはどんな日本語文をどのくらいの種類読み上げてもらい、その様子を撮影して学習に用いるデータとするのがよいのか、発話時の口の形に着目して検討しました。

今回の発表は修士課程で研究したことの一部ですが、北村さんの修士の研究は大変手間のかかる作業を地道に進めたものでした。コロナで様々な制約もあって思い通りに進められなかった部分もありました。研究としてはまだまだやることがたくさん残されています。北村さんは3月で卒業(修了)しますが、この研究を後輩の誰かが引き継いでやってくれることを期待しています。

(メディア学部 寺澤卓也)

研究紹介」カテゴリの記事

« 映像表現・芸術科学フォーラムで3年越しの発表 | トップページ | 卒業する皆さんへ »