深層学習の落とし穴
2023年11月 3日 (金) 投稿者: メディア技術コース
渡辺です。ブログはしばらくご無沙汰してしまっておりました。今回は、「深層学習」(Deep Learing)について思うところを書いていきたいと思います。
「深層学習」とは、元々は脳の神経細胞(ニューロン)の仕組みを倣った「ニューラルネットワーク」と呼ばれる理論体系がベースとなっています。詳しい話はここでは省きますが、ニューラルネットワークの仕組みをより多層に構築し、さらに学習を実現するための様々なアイデアが盛り込まれています。2015年、深層学習を用いて開発された「AlphaGo」というシステムが、当事の囲碁の世界最高棋士に勝ったことで有名となりました。それ以後、様々な応用に用いられていますが、有名なものとしてはヒントとなる文章から画像を自動生成する「Stable Diffusion」などの画像生成AIや、日本語や英語などの自然言語による質問にやはり自然言語で回答する「ChatGPT」があります。
これらの技術があまりにも衝撃的であるため、様々な分野で深層学習が注目されています。実際に成果が挙がっていなくても、「深層学習を用いた」というだけで注目されているということも、たまに見受けられますね。
それはともかくとして、最近よく感じるのは「学生が研究で安易に深層学習に手を出す」ということです。深層学習は確かに凄い理論であることは間違いないのですが、有用な成果を挙げることは決して容易ではありません。深層学習をプログラム内で用いる方法は、検索すればすぐに出て来ますし、自分のPCにインストールして簡単に動かすことができます。それを実体験した学生が、「自分でもまったく新しい成果が挙げられるかも」と期待するのは無理もありません。しかし、そこに落とし穴があります。
実際のところ、深層学習が有効に働くには多くの「コツ」が必要となります。入力データをどのように揃えるのか、パラメータや評価関数をいかにうまく設定するか、どのような深層学習理論を用いることが適切なのか、どういったデータを出力することで有用性が出せるのかなどなど、様々な要因があります。こういったことは、決して「試しに触ってみた」というレベルで身につくものではなく、平たく言えば「深層学習を使う練習と実践」が必要になるわけですね。ですが、研究で深層学習を利用したいという学生のほとんどは、実際にはほぼ未経験の状態なことが多く、なかなか思い通りの成果が挙がることはありません。「何か変な画像が出力されてしまいました」という状況ならまだマシで、大抵は「そもそも出力が得られてない」という段階で終わることも多いようです。
また、深層学習を利用する手法だと、うまくいかないときにどうすればいいのかの判断が非常に難しいという特性があります。深層学習を用いない、演繹的な手法だと、うまくいかないときもどの部分が悪いのかを検討する余地があります。しかし、深層学習だと「どうすればよくなるのかさっぱりわからない」となってしまうことが結構あります。
深層学習を研究に取り入れること自体については、非常に有効となる可能性はあります。ただ、それならば事前に深層学習についてよく理解しておくことが重要だと思います。
(メディア学部教授 渡辺大地)
「研究紹介」カテゴリの記事
- 映像表現・芸術科学フォーラムにて卒研生が優秀発表賞を受賞(2019.03.17)
- 自由な言葉でライブパフォーマンスをアレンジする(2019.03.16)
- 先端メディア学II(2年生)の学生が人工知能学会の研究会で発表(2019.03.15)
- 映像表現・芸術科学フォーラムでの発表(2019.03.10)
- ゲームの学会?!(2019.03.07)