雑感

ややこしい3次元座標系

2022年6月18日 (土) 投稿者: メディア技術コース

コンピュータ上で3次元を扱おうとする際に直面するハードルの一つが,3次元座標系です.

単純に「軸が3つある体系」,「2次元に比べ,軸がもう一つ増えている」など簡単に思うかも知れません.しかし,3次元座標系にはこの記述だけでは書き切れない複雑さが色々潜んでいます.あらゆる内容を全て書き下すと切りがないので,ここでは2つほど,困惑しがちな内容を挙げておきます.

 

(i) 3次元「回転」扱いの難しさ

3次元座標変換は,教科書的には4x4の行列で定義できるアフィン変換を用いて記述します.このアフィン変換を用いることで平行移動,回転,拡大縮小などが記述できます.その中で,最もややこしいのが回転変換です.一応,X,Y,Z軸に沿った回転角度の組み合わせで回転を記述するオイラー角という表記方法が最も直観的です.しかし,この表記方法には表記自体に曖昧性が存在します.また,回転順序によって結果が異なってきます.また,異なる表記でも同じ回転を表現したり,ジンバル・ロック現象と言った複雑な問題が起きます.こう言った問題がないように回転を記述する方法としては四元数というものがありますが,これの理論もかなり複雑なもので,容易に理解できるものではありません.

 

(ii) 異なる座標系間の「変換」

前述した回転の難しさはある意味よく知られている問題です.それに対して,こちらの内容はあまり広く知られていません.普段3次元座標系の必要なものを実装する際は,何かしら既存のライブラリを用いることが殆どです.しかし,ライブラリごとにこの3次元座標系の設定が異なっているのが悩みの種です.

3次元座標系における軸設定は3次元物体を記述するところ(モデル座標系)だけに用いられるのではなく,カメラにおける軸設定(カメラ座標系),描画ピクセルの並べ(スクリーン座標系)等における軸設定にも関わるものです.同じライブラリの中では,こういう変換に問題が起きないようになっている(はず)です.しかし,場合によっては軸設定の異なるライブラリの機能をそのまま使いたい場合がありますが,その変換の際に役立つデータの橋渡し方が用意されていない場合が多く,結局自前の試行錯誤で正しい変換のやり方を探すことが殆どです.なので,単純にあるライブラリAからライブラリBに繋げるのに,両者の変換を正しくさせるための変換を探すのに別途の時間を費やす必要があります.

 

今回は数式を極力用いず,具体例も挙げずに概略を説明したまでですが,今度からは実動するプログラムと数式と共にこの内容が説明できればなと思います.

2022年6月18日 (土)

モデリング研究に携わったきっかけ

2022年6月15日 (水) 投稿者: メディア技術コース

前回 (5月28日の投稿),自己紹介と今までやっていた研究の1つを紹介しましたが,今回は私の履歴をもう少し説明しつつ,現在の研究に至った経緯を説明したいと思います.

私は高校まで出身国である韓国で過ごしていて,学部過程から日本に渡ってきました.学部や修士までやってきたものは現在やっている研究とは関連性が薄いので,ここでは割愛させて頂きます.

修士過程を終えた2012年に,兵役のために韓国に帰国しました.韓国は兵役制度が実施されていて,一定年齢以上の男性は基本的に2年弱,兵士として義務を果たす必要があります.私はその代わり,大学や企業の研究所にて研究員として3年間勤める,代替服務で兵役を果たせました.勤務地はKAIST(Korea Advanced Institute of Science and Technology, 韓国科学技術研究院)という研究重心大学に付属されているAR(拡張現実間)の研究所でした.

そこで私が携わった研究は以下のようなものでした.
"An HMD-based Mixed Reality System for Avatar-Mediated Remote Collaboration with Bare-hand Interaction" 
Seung-Tak Noh, Hui-Shyong Yeo, and Woontack Woo,
In ICAT-EGVE 2015, Kyoto, Japan: The Eurographics Association, 2015, pp. 61-68, The Eurographics Association, 2015.
コンセプトを要約すれば,遠隔地にいる2人が,お互い相手をアバターの形で自身の空間に召喚させ,何かしら共同作業を行うとのコンセプト (動画 0:06~0:18) と,それを実現するためのシステム構築 (動画 2:50~) をまとめたものです.今となってはこのような概念は「メタバース」などの名前で括られ,一般にもよく知られている概念になってきたと思います.映画やコンセプト動画程度で現れていた概念だけのものであったので,それを先立て実現させてみたのに意義があったと言えます.

今度紹介した論文は一応,研究プロジェクトの一貫として作ったものです.なので,やはりあっちこっち満足の行かない部分が多かったです.その中でも,私として最も満足の行かなかったところは3次元モデルのアバター部分でした.基本的に,このプロジェクトで使うアバターは遠隔のユーザを表すものですが,そうするには顔,服装などのパーツを現実のユーザに似るようなものとして作り上げることが望ましいです.ですが,このような作業を3次元キャラクターモデルとして一貫性を保ちつつできるようにするのは案外簡単ではありませんでした.なので,当時のプロジェクトでは,3次元モデラーに依頼して作ってもらった3次元キャラクターものをそのまま利用した訳です.この辺りの問題を解決するには,その度にモデラーに依頼するような仕組みではなく,もっと技術的な解決策が必要と思い,CGのモデリングを研究することと決めた訳です.
また次の機会でKAISTにて行った他の研究や,博士課程以後行った研究も紹介できればなと思います.
よろしくお願いいたします.

続きを読む "モデリング研究に携わったきっかけ"

2022年6月15日 (水)

新任助教の盧です

2022年5月28日 (土) 投稿者: メディア技術コース

はじめまして,今年4月から助教として着任した盧承鐸(ノ スンタク)です.
現在,柿本先生と一緒にビジュアル・インフォマティックス研究室を運営しております.
コロナ過で皆さま前でお話する機会があまりないので,このブログ上で簡単に自己紹介及び研究内容の紹介をしようと思います.
私はコンピュータ・グラフィックス,その中でも特にモデリング分野を主に研究しています.
本来,コンピュータ・グラフィックスにおいて3次元モデルを作る作業には多大な時間と労力が必要です.
創作など存在しないものを作る意味では3次元モデルをゼロから作り上げる必要も生じてきますが,
3次元モデルが必要な多くの文脈では,既に何かしらの実物があり,それに相当する3次元モデルを作るのが殆どです.
今度はその意味で行ってきた過去の研究の内,代表的なものを1つ紹介します.
"SkelSeg: Segmentation and Rigging of Raw-Scanned 3D Volume with User-Specified Skeleton" 
Seung-Tak Noh, Kenichi Takahashi, Masahiko Adachi, Takeo Igarashi
Proceedings of Graphics Interface 2019: Kingston, Ontario, 28 - 31 May 2019
こちらの内容は,ぬいぐるみを3次元スキャンしてキャラクターアニメーションに用いる時に起こり得る問題を解決したものです.
伝統的な3次元スキャン手法では,対象を背景と区別する機能や,隣接パーツ同士を区別する機能が備えられていないため(動画 ~0:15),単純にぬいぐるみをスキャンしたら背景と隣接パーツが癒着された状態になり,アニメーションにすぐ活用できない状態のものしか得れません.普段,こういう問題を解決するには,3次元編集ソフトウェアを利用して背景を削除したり,癒着されているパーツを切り離したり不都合のおきている部分を綺麗に直してから,骨格を付与してアニメーションさせる流れになります.しかし,3次元編集ソフトウェアの操作は単純でない上,労力もかなりかかる作業が必要になります.
この研究では,スキャンする際の床情報を利用することで床部分を削除し,スキャン時に見えていなかった部分に発生し得る穴を自動的に塞ぎます(1:30~1:45).また,何れアニメーション用に付与される骨格情報を利用してパーツに起きている癒着問題も半自動的に解決します(動画1:45~2:05).これは,3次元編集ソフトウェアに慣れていないユーザでも,限られた視点における2次元的な操作(動画 0:55~1:25)はそこまで難しく感じないとの知見に基づいたものです.以上の機能を持ちまして,3次元編集ソフトウェアに慣れていない人でも簡単に作業できるように利便性を改善したものと言えます.
私が何故このようなモデリング分野に携わってきたかの経緯に関しての話や,技術的な面においても色々話がありますが,今回は自己紹介として初めての自己紹介の意味を込めてその内容は大分割愛しております.その内容については,また今度のブログ記事で紹介できればなと思っております.
これからどうぞよろしくお願いいたします.

2022年5月28日 (土)

20-20-20ルール

2022年5月27日 (金) 投稿者: メディア技術コース

メディア学部の盛川です。

皆さんは普段スマートフォンやPCの画面をどの程度連続で見ていますか?レポートや勉強をする場面でも、ゲームや動画を楽しむ場面でもよいですが、1時間2時間は普通に画面を見続けていたりしないでしょうか。

眼に近い位置の画面をずっと見続けるのことは、眼精疲労の原因になることはよく知られています。ではどのくらいの頻度で眼を離せばよいのか、ということについて一つのルールが提案されています。それが「20-20-20ルール」と呼ばれているものです。

このルールは、「20分おきに」、「20秒間休んで」、「20フィート(6 m)先を見る」ということを推奨しています。アメリカの眼科医の方が提案したものなので距離がフィート単位になっていますが、覚えやすいルールだと思います。

ここ数年のコロナ禍で在宅学習やテレワークが増え、不適切な労働環境で長時間の情報端末使用を行う機会が増えていることが危惧されています。そこで、普段から身体の健康を守るための意識や知識を身に着けていくことが大切になってきています。

日本人間工学会では、こうした働く環境の変化をうけて、「タブレット・スマートフォンなどを⽤いて在宅ワーク/在宅学習を⾏う際に実践したい7つの⼈間⼯学ヒント」という出版物の情報を公開しています。上に上げた20-20-20ルールも紹介されているので参考にしてください。

大学の授業も、100分という時間ずっとPCを見ていたりスライドの画面を見ていたりすることが多いかと思います。私が行っている授業では、20分毎というのは難しいですが、授業時間の半分の50分が経ったら少し休憩を入れるようにしています。できれば席を立って体を動かす、ということもやってみたいですが、大学の教室ではなかなか実現させるのは難しそうです。集中して勉強ができ、疲れも感じさせないといった授業を実現するには、まだまだ色々と工夫が必要だということを日々感じています。

2022年5月27日 (金)

瞳孔間隔

2022年5月26日 (木) 投稿者: メディア技術コース

メディア学部の盛川です。

突然ですが、皆さんは自分の「瞳孔間隔」がいくつか答えられますか?
瞳孔間隔とは簡単に言えば右目と左目の距離の事で、文字通り左右の瞳孔の中心間の長さになります。英語ではinterpupillary distance(IPD)と表記します。一般的な成人の瞳孔間隔の平均値は約63 mmといわれています。

瞳孔間隔の長さが必要になるのはどういった時でしょうか。まず思いつくのはメガネを作るときなどで、レンズの中心を決めるときに測るといった場面です。メガネを作ったことのある人は、「機械をのぞき込んで気球の絵を見ながら何かを測る」といった体験があるかもしれません。この時、眼の角膜や水晶体の状態とともに、瞳孔間隔も測っていたりします。

ではメガネを使わない人にとっては瞳孔間隔の数値を知っていることは役に立たないかというと、最近ではそうではなくなってきているかもしれません。どこで瞳孔間隔が影響するかというと、VRで用いるHMDを見るときに関係してきます。HMDも左右の眼でレンズを介して映像をみているため、メガネと同様、その人の瞳孔間隔にあわせてレンズ間隔を調整する必要があります。近年のHMDでは、このレンズ間隔を調整できるものが多くなっていますが、自分の眼に合わせて正しく調整することが、眼への負担や疲れを軽減させるために大変重要です。

今はまだHMDを使う場面はそう多くないですが、近い将来VR技術が発展し、普段からHMDを使って仕事をするという社会が来るかもしれません。そうした社会では、まるで自分の靴のサイズをみんなが知っているように、自分の瞳孔間隔も知っていて当たり前になっていることだって考えられるわけです。

瞳孔間隔の測り方については、ネットで検索すれば簡単に見つかります。研究などではもう少し厳密に測るための機器を使用したりもしますが、鏡と定規を使えばすぐに測ることができると思います。興味があれば、自分の瞳孔間隔について知っておくのもよいのではないでしょうか。

Ipd

2022年5月26日 (木)

勉強することの価値

2022年5月25日 (水) 投稿者: メディア技術コース

メディア学部の大淵です。

学校で勉強した数学が実生活で役に立たないという人に対して、そんなことありませんよ、という趣旨の記事を、これまでこちらこちらに書いてきました。そうやって一所懸命にアピールしているのですが、やはり数学がやり玉に挙げられるのは避けられないようで、最近もどこかの国会議員が「三角関数よりも金融経済を学ぶべきではないか」とツイートして、ちょっとした話題になっているようです。

音の研究をしている立場として三角関数を擁護したいのは勿論なのですが、そういう私でも、若い頃に勉強したんだけど使ってないなと思うものはいろいろあります。高校で習った古文や漢文とか、大学で習った哲学とかドイツ語などもほとんど使ってませんね。でも、だからといってそれらの科目を軽視してはいけないと自戒しています。

古文や漢文の勉強を更に続けていたら、それを活かす仕事に就けていたかもしれないという考え方もありますが、それより何より、日本や中国の古典を自由に読むことができれば、それだけでとても豊かな日常生活を送ることができたかもしれません。幸か不幸か、三角関数は仕事で役立つことも多いので、仕事に役立つアピールばかりしてしまいがちですが、学問の価値を測る基準は、それ以外にもあると思うのです。

メディア学部には、文系・理系・芸術系など様々な分野の科目が揃っています。それはもちろん、社会に出て働くときに役立つからでもあります。でも、日曜日に読書をしながらいろんなことを考えられるようになるだけでも、勉強したことのもとは十分に取れるのではないでしょうか。

2022年5月25日 (水)

仕事環境の机と椅子

2022年5月24日 (火) 投稿者: メディア技術コース

メディア学部の盛川です。

昨年4月に大学に来てから1年が経ち、そのあいだ研究室の準備もすすんできました。色々なものを研究室に用意しましたが、その中でも机と椅子にについては時間をかけて選定を行いました。

普段仕事をする上で最もよく使う道具は机と椅子であるといっても過言ではありません。私の専門とする人間工学の分野でも、昔から大きな関心を集めている対象でもあります。特に労働現場のデザインとして、安全衛生や健康の面でも重要な要素として考えれています。パソコンで仕事をすることが当たり前になり始めたころから、こうした安全や健康のための対策について盛んに啓蒙されていました。情報端末を使う労働環境管理のガイドラインは、情報機器端末のハードウェア、ソフトウェアの発展に伴い、何度かの改訂を経て、現在でも厚生労働省から「情報機器作業における労働衛生管理のためのガイドライン」として公開されています。

机や椅子の人間工学的なデザインについては、一昔前は「以下に長時間使用しても疲れないか」が重要視されていました。しかし近年ではその考え方も変わってきており、「短時間の休憩を適宜はさんで、できるだけ体を動かすように」するためのデザインが取り入れられてきています。私の研究室に導入した机も、その流行に乗って、立った姿勢でも作業できるような高さにも調整できるようなものを選んでみました。

Desk

普段自分で机や椅子を選んで購入する機会はあまりないかもしれませんが、もしそういった機会があれば、人間工学の考えも参考にしてみるのもよいかと思います。

2022年5月24日 (火)

今年も来ましたキッチンカー

2022年5月23日 (月) 投稿者: メディア技術コース

皆さん、こんにちは。

東京工科大学八王子キャンパスは大学の4学部と大学院、そして日本工学院八王子専門学校が設置されているため、非常にたくさんの学生数となっています。2020年、2021年は大学がオンライン授業であった期間があり、キャンパスの混雑はあまりなかったのですが、2022年度は対面授業でスタートできていることもあり、非常に多くの学生さんでキャンパスも活気づいています。

そうすると困ることの一つは昼食です。キャンパス全体の食堂もかなり整備されていますし、コンビニもあり、また、屋内外で食事ができるスペースやベンチなども多数用意されています。それでも短い昼休みに集中するので、食堂の混雑は大変なもののようです。「ようです」というのは、私自身は昼食を持参しているので最近は食堂に行く機会がないのです。しかし、昼休みのキャンパス内の様子を見るに、食堂の混雑は想像できます。

数年前から、特に混雑が厳しい時期(?)には昼食時に外部のキッチンカーが複数台キャンパスに乗り入れるようになっています。今年も4月から連日様々なキッチンカーが来ています。下の写真は4月に撮ったものです。たまたま、まだお昼になる前の様子で一台は準備中であり混雑はありませんが、このようなキッチンカーが2、3台、日替わりで来ています。

50

この記事はゴールデンウィーク前に書いていたのですが、公開が遅くなったので少し書き換えています。連休後の様子もお伝えすると、下のような感じです。これも、昼休みに入った直後くらいの様子なので、まだ列が長くありません。

51

52

梅雨に入るまでの期間は天気が良ければ外で食事をするのにとても良い季節だと思います。花粉症の人にはつらいかもしれませんが、梅雨と暑い夏の前のキャンパスを楽しんでもらえればと思います。

(メディア学部 寺澤卓也)

2022年5月23日 (月)

のぼりとくだり:日々の泡シリーズ #1

2022年5月 5日 (木) 投稿者: メディア技術コース

先日、とある駅のホームに向かう階段で見つけた掲示が面白かったので紹介いたします。

 

Img_0882_1000 Img_0881_1000

 

これらは電車の下り方面行きが階段を降りた先のホームから出発し、上り方面(東京方面)は階段を上がって別のホームに行きなさい、ということを意図しているのだと思いますが、それがちょうど階段を上がる、下がると同じ方向になっているので、2つのことを同時に示しているようになっているのです。これだとどちらの意味にとっても混乱は無いと思いますが(階段ののぼり、くだりをわざわざ書いて説明するのか?という疑問は湧きそうですが)反対側のホームの階段でも同じような掲示があるのだとするとそちらでは、階段を降りるのに「のぼり」?昇るのに「くだり」?という混乱を招いたりするのかも、とちょっと気になりますね(ならないか…)。

 

 

(これは、日常で見つけた些末なことを書く「日々の泡シリーズ」です。なんちゃって、続きがあるのか…)

 

 

 

太田高志

2022年5月 5日 (木)

ボーっとしてみよう (2)

2022年5月 3日 (火) 投稿者: メディア技術コース

メディア学部の大淵です。

昨日の記事では、スマホを見たりしないでボーっとしている時間が重要なんじゃないかという話をしました。今日は、その話を、最近はやりの人工知能の話に結び付けて考えてみたいと思います。

近年の人工知能ブームの中心となっているのがニューラルネットワークです。ニューラルネットワークとは、ニューロンと呼ばれる演算素子を大量に用意し、それらをシナプスと呼ばれる線で結んで信号をやりとりする仕組みのことです。その中でも、フィードフォワード型と呼ばれるタイプのものは、取り扱いが簡単なこともあり、早くから研究が進められてきました。

Neural

上の図の左側がフィードフォワード型です。上から入力信号が入ってきて、それを順番に下に流していって、最下層から出力が得られたら終わりです。それに対して、少し遅れて研究されるようになったのが、図の右側、リカレント型と呼ばれるニューラルネットワークです。リカレント型では、途中の層のニューロンから、上の層に戻っていく信号の線があったりして、情報の流れが複雑になっています。そして、こうした仕組みを取り入れるようになって、私が専門としている音声認識の分野などでも、人工知能の性能がどんどん向上していきました。

リカレント型のニューラルネットの特徴は、外部からの入力信号が止まっても、ネットワークが状態更新をしつづけるということです。これって何だか、人間がボーっとしているときに似ていると思いませんか? 図の青い矢印の入力が無くなっても、上から下へ、下から上へと情報が延々と流れ続けて、ネットワークの状態を更新していきます。でも、リカレント型のネットワークでも、外部入力に反応してそれで終わりだと、その強みを発揮できません。右の図で、一番上の層への入力が一番下の層に到達するまで2ステップかかりますが、それで学習をやめてしまったら、下から上への結合は何の役目も果たさないことになってしまいます。

こんなふうに、いつもスマホを見つづけていると、フィードフォワード型の結合の性能ばかりが良くなり、リカレント型の結合の性能が弱まってしまうのではないか、なんて言ったら、ちょっと疑似科学っぽいでしょうか? 私は脳科学者ではないので多少不正確なところはあるかもしれませんが、情報科学の観点からはそれほど外れたことは言っていないような気がしています。

そんなわけで、今日の結論は、旅先でも家でも、ちょっとスマホの電源を落として、ボーっとする時間を作ってみませんか、ということです。私もこの記事を書き終えたら、しばらくPCの電源を落として過ごそうと思います。

2022年5月 3日 (火)

より以前の記事一覧