技術

大学から見える意外なランドマーク(2)

2020年2月 5日 (水) 投稿者: メディア技術コース

助教の戀津です。

先日の記事に続き、学内から見えるもうひとつの意外なランドマークのお話です。
片柳研究所から都心の方を見ると、頭一つ(という表現はちょっと違うかもですが・・・。)抜けた高い高い建造物が見えます。

Dsc_0047_20200201130301

流石に遠いのでズームします。

Dsc_0048_20200201130301

更に拡大・・・。

Dsc_0048z

はい。スカイツリーですね。特徴的なシルエットと、何より大変高いのでわかりやすいです。

探してみたら総務省の公開するこのようなデータがありました。関東広域圏東京親局というのですね。
関東平野の広域にテレビ電波を発信できるように建造されているので、山などに遮られない限り非常に広範囲まで電波が届いていることがわかります。

電波は基本的には直進します。つまり、テレビの電波が届くということは間に何もないということになります。
(厳密には回折や反射といった現象や、中継局などがあるので
その限りではないですが・・・。)
そのため、東京工科大学からは44Kmほど離れていますが、高い位置からであれば視認可能なんですね。

そういう意味ではあまり意外ではないのですが、そんなに遠いのに見えるんだという意味で意外なランドマークのお話でした。

2020年2月 5日 (水)

夜景写真を自動的につくる研究

2020年1月17日 (金) 投稿者: メディア技術コース

 大学院メディアサイエンス専攻修士2年の王 旭(おう きょく)さんの学会誌論文が採録されました。
 
 王 旭,渡辺大地,柿本正憲,2019,昼間の都市俯瞰画像からの夜景画像の生成,画像電子学会誌,48(3),375-384
 
 都市の建物群を撮影した写真一枚から、同じアングルの夜景写真を自動計算で生成するという研究です。
 
4_20200115091101

 この分野は一般に画像のスタイル変換と呼ばれ、近年盛んに研究されています。AIによる画像認識はすっかり世の中に定着しています。画像のスタイル変換にもAI技術が使われます。
 
 ただ、夜景画像は特殊で、昼間には存在しなかった膨大な数の細かいけど明るい光が現れます。これは一般的なスタイル変換では扱いにくい対象です。今回の研究ではAIの手法は使わず、建物群の遠景画像を徹底的に分析し推定する方法を選びました。
 
 例えば、道路付近の街灯や店の灯りや車のヘッドライトなどが高層ビルを下から照らす効果も入れています。また、最終的に描画する細かい光は、色の種類が現実世界と同じような割合になるように工夫しています。1000枚近い既存の夜景写真を分析した結果です。
 
 現在、このような分析的な手法ではなく、日々進歩しているAIの技法をうまく使えるような手法を研究中です。成果が楽しみです。
 
 メディア学部 柿本正憲

2020年1月17日 (金)

昆虫の複眼の研究で最優秀ポスター賞

2019年12月23日 (月) 投稿者: メディア技術コース

 大学院メディアサイエンス専攻修士1年の佐藤葵君が「画像関連学会連合会第6回秋季大会」で最優秀ポスター賞を受賞しました。
 
 画像関連学会連合会(日本画像学会・画像電子学会・日本写真学会・日本印刷学会)
 第6回秋季大会(10月31日、会場:京都工芸繊維大学)
 最優秀ポスター賞
 佐藤葵、戀津魁、柿本正憲(東京工科大学)
 「昆虫の複眼による見え方の推定と動体視認実験」
 
 佐藤くんの研究は、昆虫の視覚、つまり外界をどう見ているかを探求するものです。いくつかの仮説に基づいて、多数の微小な個眼の集約である複眼による見え方を推定しました。
 
 一方で、昆虫の複眼は動いている物体の認識に優れているはず、という別の仮説があります。今回の発表は、その検証実験により推定した見え方の妥当性を評価する報告です。実験はディスプレイ上に示した「普通の見え方」と「複眼の見え方」の両方で動く物を被験者の人が認識する早さを調べ、結果を比較しました。
 Img_2070

 ポスター発表の様子

 この写真では説明を聴いている参加者は一人ですが、時間によってはとても多くの参加者が集まっていたそうです。写真学会の会長さんからも、たいへん気に入った研究ですというコメントを個別にいただきました。

 
 S__56623106
画像電子学会会長の斎藤隆文先生と

 この研究テーマのきっかけは、佐藤くんが虫が大好きだということです。卒研で虫をテーマにするには、という議論にはだいぶ時間をかけました。視覚に注目すればメディア学部らしい研究になり得るし、指導教員の専門分野なので指導もできます。これまでにも昆虫の色覚や人間の近視や乱視による見え方シミュレーションの研究は行ってきました。
 
 この研究はまだまだ道半ばです。複眼による見え方にはわからないところがたくさんあり、これからの研究の進展が楽しみです。
 
 メディア学部 柿本 正憲

2019年12月23日 (月)

【研究紹介】数式で髪を編む技術 - Procedural Hair Styling ー

2019年11月 5日 (火) 投稿者: メディアコンテンツコース

本ブログをご覧の皆様,こんにちは.

メディア学部教授 菊池 です.

本日のブログでは,「数式で髪を編む技術 - Procedural Hair Styling -」について紹介したいと思います.

CG で人型のキャラクターを制作する場合,肌や髪などの質感に加えて,表情や動作も人間そのもののようなリアリティのある表現が求められます.特に髪の表現に関しては様々なスタイルがあり,特定の髪型を制作することによってキャラクターの個性を引き出すことが可能となります.すなわち,ヘアースタイリングはキャラクターモデリングにおいて必要不可欠な要素です.

CG におけるヘアースタイリング技術は,人の写真から髪型の情報を読み取って自動的に生成するものが主流となっています.しかしながらこの手法は,三つ編みやお団子,短髪すぎるものなどの髪の流れる方向を読み取れないものには適していません.

そこで我々の研究室では,ガイドカーブを用いて三つ編みを作る Braid パラメータ,一定のカールを作る Coil パラメータ,およびランダムにカールを作る Curl パラメータの3つによって,複雑に編み込まれたような髪型でもパラメータを調整するだけでスタイリングが可能な技術を開発しました.
三つ編みにはリサージュ曲線を,カールヘアーにはヘリックスをそれぞれ制御関数として用い,上記3つのパラメータの変化でスタイリングを行います(図1参照,動画も公開中です).

Fig_20191102000501
図1.スタイリング例


本研究は,「映像表現・芸術科学フォーラム 2019 [1] 」にて発表を行いました.

[1] 中村史穂,菊池 司,”ヘアーのプロシージャルモデリング”,映像表現・芸術科学フォーラム2019概要集


文責:菊池 司

2019年11月 5日 (火)

複雑なパスワードをつくる

2019年10月26日 (土) 投稿者: メディア技術コース

助教の戀津です。

先日書いた「パスワードに名前をつける」の中で、複雑なパスワードを苗字部分にするというお話をしました。
今回はその「複雑なパスワード」をどうやって作ろうか、というお話です。

パスワードは、英単語等のような意味がなく、大文字小文字数字記号交じりでできるだけ長いものが好ましいです。
単体であれば最低8文字、これからはもっと長い必要が出てくるかもしれません。あまりに長いと入力にかかる時間が煩わしいところですが・・・。
前回は苗字部分にして名前部分を追加でつける分長くなるため、パスワード本体は6文字にしました。

さて、その前回出したパスワード『sL15n!』をどうやって作ったか、を解説します。
名前部分に寿司のネタというお題を使いましたが、実は『sL15n!』も寿司なんです。

私がよく使う方法ですが、元になるある文字列を考えて、それを少しずつ変形させてパスワードを作ります。
それを今回は寿司でやった、というわけです。具体的には次の手順で変化させました。

・まずはアルファベットに → sushi
・初めのsはそのまま → s
・uを切り分けて大きくする → Lと1
・sを大きくして角ばらせる → 5
・hの縦線を短くする → n
・iを上下ひっくり返す → !

文字での解説は難しいですね・・・。
一応ホワイトボードで絵?として書いてもみました。伝わるとよいのですが・・・。

20191021-203439

 

このようにして、元の単語から意味の読めない複雑なパスワードを作りました。
この方法のメリットとして、元の単語とどうやって変形したかを覚えればよいので(比較的)覚えやすいという点があります。
身近な単語をベースに変形させて複雑なパスワードを作るお話でした。参考になれば幸いです。

2019年10月26日 (土)

EC2019における発表

2019年10月22日 (火) 投稿者: メディア技術コース

技術コースの羽田です.

1ヶ月ほど前の9月20~22日にエンタテインメントコンピューティングという学会が九州で開催され,本研究室からも3件の発表を行ないました.羽田は残念ながら3日ある学会のちょうど真ん中の日が大学で仕事だったため,今年は学生のみの参加だったのですが,そこは何度も学会に参加しているだけあって,修士の学生を中心になんとか無事に発表もできたようです.
発表タイトルと参加した学生の一覧は以下の3つになります.

  • VR空間で全周から触覚刺激を提示する為の熱源の配置と検討: 伊藤 亘輝
  • 複合感覚によるリアルタイム味覚変容デバイスの開発: 白須 椋介
  • チューブ状の繊維を使用した色変更が可能な布:十亀 雄太

その中のひとつ本研究室の十亀雄太くんがベストデモ賞(PC推薦)を受賞しました.

Photo_20191021193201
この賞は,プログラム委員があらかじめ論文をベースに選択したいくつかのデモを体験し,その中で優秀だと思われる発表を委員の投票で決めるものです.つまり,この分野の専門家であるプログラム委員から価値があると認められた研究というわけです.台風17号の接近により,最終日の予定は短縮して開催され,表彰式はなかったようなのですが,無事に帰ってこれたようでよかったです.
[https://gyazo.com/3cb67deb65c56912d2eff0812556d207]

私は参加していなかったので,現場にいらした先生や学生から頂いた発表中の写真をいくつか載せておきます.

P_20190922_112810 Dsc_1943 P_20190922_114136 

(羽田久一)

2019年10月22日 (火)

パスワードに名前をつける

2019年10月 6日 (日) 投稿者: メディア技術コース

助教の戀津です。
先日の大淵先生の記事『コンピュータに名前をつける』を読んで思い出した話題があるので、タイトルを拝借しました。

皆さんもSNSなどを(しかも複数)利用している方が多いと思います。
それ以外にも色んなWebサービスなど、アカウント登録をして利用する場合パスワードの管理が大変ですね。
パスワード管理については色んな手法がありますが、今回は「使い回さない」ための方法についてお話します。

パスワードはあらゆる場面で必要になりますが、もちろん、12345678などの簡単なパスワードは厳禁です!
大文字小文字数字記号交じりが好ましいですが、あまり複雑だと人間は覚えていられないものです。

そのため、一つの複雑なパスワードをどのサービスでも利用するという方が多いと思いますが、これはどこか一か所で漏洩するとすべてのサービスが危険にさらされるためセキュリティ上好ましくありません。

そこで、「パスワードに名前をつける」です。
まずは苗字?部分として、ベースとなる充分に複雑なパスワードを一つ考えてしっかり記憶しておきます。
そしてお題を用意して、そのお題に従ってサービスごとに別の名前をつけます。
例として、今日は10/6なのでトロから連想し、お題を『寿司のネタ』・苗字部分を『sL15n!』にしようと思います。

そして、苗字・名前の日本式か、名前・苗字の欧米式か(あるいは混在)を決めておいて、苗字と名前を組み合わせて完成です。
sL15n!Otoro
sL15n!Hotate
・TsunamayosL15n!
大文字小文字数字記号交じりの強い苗字を一つ考えておくことで、充分な長さで強いパスワードが量産できますね。

あとは各サービス用に何という名前をつけたかを記憶すればOKで、それが難しくても
・大学メール 大トロ
・携帯メール ホタテ
・Twitter ツナマヨ
のようなメモをどこかに持っておけます。パスワードそのものを書いたリストは持っていると危険ですが、これだともし他人に見られても意味不明ですね。

不正アクセス技術も日々進化しているためこれが絶対の正解ではないですが、パスワードを使い回さないことで防御力をグッと一段上げることができます。
是非参考にしてみてください。

2019年10月 6日 (日)

おしゃべりAI~音声合成の潮流~(1)

2019年10月 4日 (金) 投稿者: メディア技術コース

こんにちは。最近はスマートフォンやスマートスピーカーなどで話し声を作り出して再生する「音声合成」技術の利用が広がっていますね。今回は最近の音声合成技術について、連載形式でお話します。

音声合成は、任意の文章(テキスト)を音声に変換することです。今日に実用化されている音声合成は、ゼロから音声の波形(音圧の時々刻々の変化)を作り出すのではなく、誰かの声の録音を材料として使って行います。2000年代初めまで主流だったのは、

  1. 音声波形を短く切ってつなぎ合わせるもの(波形接続)
  2. 一度パラメータに変換してからパラメータの系列を生成するもの(例えば隠れマルコフモデルを使った方法)

Blog_hmm002

/k a/の合成のようす

でした。後者は、上図のように、ある確率でいろんな音ののパラメータを発生(出力)する「状態」(図のマルのところ)の系列を仮定して、出したい音に対応したパラメータを出力させていきます。

近年は、いわいるAIの技術のひとつであるディープラーニング(深層学習)が活用されています。ここで、簡単にディープラーニングを用いたニューラルネットを説明します。ニューラルネットは、神経の活動を模した学習モデルです。Neuron

神経細胞(ニューロン)同士が互いに結合して構成されています。基本的なモデルでは、ひとつひとつに何本かの入力(図では頭から延びる枝)と枝分かれしている出力(顔の下から延びる枝)の経路が付いています。

 Activate

入力からは何らかの数値が入ってきます。この合計が小さいと出力がほとんど出ず(ここでは0)、ある値より大きいと「発火」して一気に大きな出力が(ここでは1)出ます。

Weighting

出力された値には、次のニューロンに届くまでに「重み」と呼ばれる係数が掛け算されます。例えば、1に重み2.1をかけると値は2.1になりますね。全ての枝で重みが掛け算された後で次のニューロンの入力に入り、そこでまた合計が大きい場合に次の発火が起こります。

Training_dnn

では、どうやってAIは「学習」されるのでしょうか。教師あり学習といわれる学習では、テキストから取り出した情報(発音やアクセントなど)と実際誰かが発声した音声(=正解の情報)を使います。このデータの組を使ってAIにテキスト情報を入力したときの仮の出力と、実際の音声のデータとの差を計算すると、誤差が求まります。この誤差が小さくなっていくようにニューロンの枝の「重み」を微調整していく作業がニューラルネットの「学習」です。

次回は上記を使った音声合成技術の広がりについてお話しします。

メディア技術コース 越智

2019年10月 4日 (金)

学会ってどんなとこ?

2019年9月11日 (水) 投稿者: メディア技術コース

Gakkai2019_2w

今は学会シーズンです。連続して3つの学会に行ったので、それぞれの特色を比較しつつ、学会ってどんな雰囲気なのかについて紹介します。

(1)国際会議IEVC2019

  1. 画像がテーマ
  2. インドネシアバリ島で行われた

サウンドの研究が専門の私はこの画像の学会で、画像と音を両方使った研究の発表を行いました。VRなどを目指した360度映像・画像で臨場感の高いバイノーラル録音を活用する研究プロジェクトです。学会発表には大きく分けて、口頭発表とポスター発表の二種類があります。私は今回ポスター発表を行いました。口頭発表は通常の座学形式の発表で、プレゼンテーション+会場からの質疑応答で構成されます、それに対し、ポスター発表とは、研究内容を印刷したA0サイズ程度の大きなポスターを壁に貼ってその前に立ち、見に来た学会参加者に対して直接説明するという形式です。一対多の口頭発表に比べてよりインタラクティブでありたくさんの意見を聞くことができます。今回は、画像やゲームなどに関わる研究者とそのコンテンツに付与する高臨場感がある音とはどういうものかについて活発に議論する機会を得ることができました。

ところで、IEVCは画像を扱う学会であることもあり、ポスター発表の発表者にも、全員の前で自分の発表の概要を1分で述べる時間(ファスト・フォワード)があります。例えばCGについての研究であれば、画像を載せたスライドを出して、聴衆の興味を引いてたくさんの人に聞きに来てもらうことができます。一人1分しかないため、発表者が列になって次々と入れ替わって話すという光景が見られます。

Ffws

さらに、余談ですが、お昼休憩には地元のインドネシア料理の食堂に行きました。写真のようなスープを注文しました。あっさり味でのスープと、ご飯と、激辛唐辛子ソース(左上)の組み合わせがとてもおいしかったです。たいていの料理にライムが添えてあったり、レモングラスというハーブがふんだんに使われていて、辛さの中にも爽やかな清涼感を感じることができます。この学会参加を通じてインドネシアの食文化の奥深さとすばらしさを体験することができました。

Soup

Restaurant006w

(2)JSSFD(日本吃音・流暢性障害学会)

  1. 医療系学会
  2. 当事者(患者)・家族参加型
  3. 今回は神奈川県

次は、がらっと変わって、国内の医療系学会です。筆者が助成金を受けて行っている研究プロジェクトに関わるテーマであり、特定の疾患を扱っている珍しい学会です。また、当事者と家族が参加しているという意味でも特色があり、患者にとっては自分たちの疾患の会に自分たちが参加せずに専門家だけで話し合われる、という従来の形の学会にはない画期的な交流が行われます。とくに、お昼にマイメッセージというプログラムがあり、経験談が語られて生の声が患者と専門家の間で共有されました。

Mymassagews

(3)ASJ(日本音響学会)

  1. 音がテーマ
  2. 学際的・文理融合型
  3. 今回は滋賀県

最後は、音響・音声・音楽など音を扱った学会についてです。音についてなら、言語を研究する人文系の専門家の話、音響教育、建築物での音の響きなどを扱う話、騒音の話、超音波の話など、なんでも含まれています。つまり、聞きたい音、消したい音、聞こえない音、色々な話題があるのです。たくさんの部屋に分かれて口頭発表やポスター発表が行われていて、色々聞いて回ることができます。質疑応答では、結構厳しく鋭い質問が飛んだりします。音を流す発表が多いので、いざ発表時に音が出ないということがないよう、発表者は入念に確認して発表に臨みます。

Asjws

学生の皆さん、このように学会には様々な独自の特色があります。発表の時はドキドキ緊張すると思いますが、是非チャレンジして学外の人と意見交換して自分の研究に磨きをかけてください。

 

メディア技術コース 越智

2019年9月11日 (水)

メディアの基礎としてのコンピュータ

2019年6月30日 (日) 投稿者: media_staff

 

技術コースの羽田です.

今日は1年生むけの講義科目,「システム基盤技術の基礎」についてのお話です..

この科目は1年生にむけて,コンピュータとインターネットを中心とした「システム基盤」についての基礎知識を学ぶという科目です.コンピュータサイエンスの基礎にあたる内容のうち,メディア学部らしいトピックに関連するようなものを抜き出して行っています.
現在は,前半のコンピュータの仕組みについての話がおわり,最後のトピックであるインターネットとその応用についての授業が行われています.

先週の授業では,インターネットの歴史について簡単に話をしました.
今の学生くらいの年齢の人たちには信じられないかもしれないのですが,四半世紀つまり25年ほど前には,インターネットは未だ「誰もがつかえる」ようなものではなかったのです.実のところ携帯電話もちょうど存在が知られるが手に入りにくいものだった頃ですね.私も大学院でコンピュータの研究をしていなければインターネットに触れることはなかったでしょう.多くの家でインターネットが使えるようになっていくのはこのあとしばらくたってからになります.

インターネットの歴史で一番誤解を生んでいる話といえば,「インターネットと核戦争」の話です.もともとインターネットの祖先にあたるARPANETというネットワークはアメリカ国防総省の高等研究計画局というところが資金を提供して,複数の大学や研究所で開発された技術です.
この「国防総省」という言葉と,ARPANETの始まった1969年(アポロ11号が月に行った年ですね)という年から「核戦争」という言葉が強く連想されたようです.しかしながらこの説は多くの当事者から否定されており,インターネット=核戦争を生き抜くためのネットワークである,というのは都市伝説にすぎないようです.
この国防省が主導してはじまったネットワーク接続のプログラムは有効性が知れるにつれ,多くの研究所や大学が加わるようになってきましたが,軍のネットワークに直接接続できない人たちも数多くいたようです.
そこでアメリカ国立科学財団(NSF)というアメリカの科学技術振興のための組織が資金提供をはじめ,CSNETやNSFNETと呼ばれるネットワークが整備されます.これらが元となって現在のインターネットは始まりました.日本のインターネットもこのNSFNETに1989年に接続されて世界と繋がるようになりました.
インターネットは今では世界中でなくてはならない社会基盤の一つとなりましたが,その歴史は浅いものです.
今後もますます発展するであろうインターネットとそのサービスはメディアにとっても欠かせないものとなっていくことでしょう.

(羽田久一)

2019年6月30日 (日)