Microsoft、PC 内蔵のスピーカー&マイクだけでジェスチャー検知する技術を完成 37
ストーリー by reo
何をしてるかお見通し 部門より
何をしてるかお見通し 部門より
taraiok 曰く、
Microsoft Research は、Washington 大学と協力して、潜水艦のソナーと同様の方法で、物体検出やジェスチャー認識を行う技術を開発した。この技術では同社のゲーム用のジェスチャーセンサーである Kinect は使用せず、PC に内蔵されたマイクとスピーカーだけで物体認識が可能だという (EXTREME TECH の記事、本家 /. 記事より) 。
このサウンドウェーブと呼ばれる新技術では、音質が距離によって変化するドップラー効果を使用する。具体的には、コンピュータの内蔵スピーカーから 18 〜 22 KHz の音波を出し、人物の手や体の動きで変化する音をマイクで拾い、その差分によってジェスチャーを検知する仕組み。
このシステムの利点はハードウェアの追加が不要なことだがその半面、ひと組のスピーカーとマイクだけで検知するので Kinect などのような精度の高い 3D センシングは出来ない。それでも手の上げ下げで画面スクロールしたり、左右に手をはたくだけで横スクロールなどを行うことは十分に可能だ。暗騒音の多い室内環境でも 90 〜 100 % の精度でジェスチャーを検知するとしている。
ハードウェアは得意 (スコア:4, すばらしい洞察)
マイクロソフトって、ハードウェアに関しては良い仕事しますね。
今回は解析ソフトがキモなんでしょうけど、まあハードウェア
絡みってことで。
Re:ハードウェアは得意 (スコア:5, すばらしい洞察)
これは完全にソフトの話でしょう。
> このシステムの利点はハードウェアの追加が不要なこと
なんだから。
入出力信号の解析に関するお話かと。
Re: (スコア:0)
MSの基礎研究部門はたまに良い仕事をしますよね。
混雑 (スコア:2, 興味深い)
この手のシステムが普及したりすると隣のマシンの出してる探査用音波と干渉して結局使えないとかならないんでしょうか?
また、偽の信号を流されて邪魔されたりとか。
#教えてエロい人!
凄いなあ (スコア:2)
防犯目的では昔からありますが、これはソフトと併せて人体のスケルトンを把握できるんでしょうか。
人体とそれ以外、もしくは操作者本人とそれ以外の人を区別できないとウーンな気も。
何より赤外線照射を敢えて捨てることにはどんな理由があるんだろう。
そんなにコスト変わる時代とも思えないけど。
Re:凄いなあ (スコア:1)
既存のハードウェアをそのまま流用出来るというのは大きいかもしれませんね。
iPhoneの音声認識機能のSiriはiPhone4S以降が必要ですが、それが既存の3Sや4で動かせるのと同じようなものかと?
#たとえがおかしいとは思いますが(苦笑)
Re: (スコア:0)
ジェスチャーの取り込み程度のお話で、認識の為の基礎技術の一つ。
という訳で、最低コストなら赤外線なんか使わないだろうし、場合に拠っては併用して更に高精度にって使い方もするでしょう。
kinectとは別の話ですよね。
別に赤外線を捨てるって意味でも無いでしょうし、そもそも赤外線センサー内蔵のPCって見たことが無いですし。
Sonyや富士通がタブレットでジェスチャーコントロールしている様なのが、カメラ無しの普通のノートPCにも入れられるかもって所でしょう。
謎の踊り (スコア:2)
これまでは、コンピュータの操作が上手いこといかない時には、
頭をかきむしったり、キーボードに八つ当たりとかしてきたけど、
これからは、コンソールの前で延々と謎の踊りを繰り返すことになるのか
胸が厚くなるな!
Re:謎の踊り (スコア:2)
パワーリスト着用で効果倍増.
# 肩の筋肉の方が効果がありそう
Re:謎の踊り (スコア:1)
soltioxはふしぎなおどりをおどった!
コンピュータはこんらんした!
コンピュータはこんらんしている…
コマンド?
# *** 戦闘終了後 ***
# soltioxはレベルがあがった!
# soltioxのむねが1あつくなった
# soltioxのむねが1あつくなった
# soltioxのむねが1あつくなった
Re: (スコア:0)
タイトルだけ見てバルマーの話かと思ってしまった。
MSネタだし。
Re: (スコア:0)
ないないノシ
#「了解。システムを終了します」「え?」
閲覧者の性別や容姿まで確認する広告会社があらわれるかも? (スコア:2)
PCだとマイクまでそろえない人もいるから、
やるとしたらスマフォかな。
不用意に音楽の流れ出すサイトが増えるかもかも。
Re: (スコア:0)
ノートパソコンだと、マイクどころかカメラまで付いているものもありますから、本気で閲覧者の性別&容姿判定できる可能性があります。
#Skypeにセキュリティホールがあったら、やりたい放題?
ブラインドサッカー (スコア:2)
上下左右取れるの? (スコア:1)
ステレオスピーカーとモノラルマイクを結ぶ平面に直交する方向はどうやって取るんだろう?
左右にパラで効く成分でわかりそうだけど、マイクがスピーカの中央辺りに配置されていると上か下かの特定はかなりきつい気が。
動画見た感じでは遠近一軸しかとってないように見える。
#音質が距離によって変化するドップラー効果って。ぴゅあおーでぃおを釣るネタ?
Re:上下左右取れるの? (スコア:2)
左右は、2つのスピーカーから出る音の位相を変えるとか、周波数を変えて
断続的に出すといった方法で取れそうですけど、上下はぱっと思いつかないですね。
現物合せでキャリブレーションを行えば、PCの形状とスピーカー、マイクの位置関係
から上下方向も検出できるかも、でも難しそう。
# モデリングは出来ないとあるけど、出来るようになったらすごい。というかなんか悪用できそうな
# 気も。
Re:上下左右取れるの? (スコア:2)
パソコンによって、マイクやスピーカの配置も違うし、
キャリブレーションはどうするんでしょうかね?
MSの認証とれた機器でのみサポートとか、
Kinectみたいに専用デバイスのリリースとかのような気もしますけど
Re:上下左右取れるの? (スコア:1)
最近のノートPC(主にWebカメラ内蔵)では、アレイマイク内蔵で、音声もステレオで取れますよ。
まあ、どちらにしても上下方向に関しては、キーボード面からの反射量の差で検出するとは思いますけど…
動画見た感じでは遠近一軸しかとってないように見える。
上下にスクロールしてませんでしたか?
Re: (スコア:0)
ドップラー効果を使ってことは、動いてるものだけを検知するの?
何が検知できるのか、よくわからない。誰かおしえてー
Re: (スコア:0)
スピーカーが最下点に位置してるから、上下じゃなく遠近を取ってるだけかもしれませんね。
ステレオで左右座標、左右座標が同一な遠近を画面上の上下としてるだけかも
竿の先端 (スコア:0)
Re: (スコア:0)
実際に計算してみたら、理論上は意外に単純でした。
単純化するために、手に音源を付け、マイクに向かって移動させたと仮定すると、20kHzの音源を0.1m/s(=10cm/s≒A4短辺を2秒で移動)で移動させると、5.8Hz上にシフトします。(ドップラー効果)
5.8Hzの差をFFT等で分析する場合、48kHzでサンプリングして、約8300サンプルあれば識別できます。(実際には16384ポイントかな?)
聴感上は区別付きにくいかも知れませんが、コンピュータなら識別可能な差になります。
また、音源&マイク固定で移動体を検出する場合、その移動速度の最大約2倍の周波数シフトが起きますので、より検出しやすくなります。
比較するなら潜水艦ソナーというより (スコア:0)
腹部超音波検査とかでしょうか。
赤ちゃんとか肝臓とか膵臓とか。
Re: (スコア:0)
潜水艦のソナーって超音波エコー(反射)を見てるだけ
だからドップラー効果関係ないんじゃないか?
対速度を測るドップラーレーダーもあることはあるけど。
Re: (スコア:0)
イルカやコウモリを思い出しましたよ
中年専用I/F? (スコア:0)
>コンピュータの内蔵スピーカーから 18 〜 22 KHz の音波を出し
若い人にはこのあたりの周波数は聞こえてしまうんじゃないかな?
Re:中年専用I/F? (スコア:2, 興味深い)
人間の可聴域は、通常20Hzから、個人差があるが15,000Hzないし20,000Hz程度 [wikipedia.org]ってことなので、仰る通り、聞こえてしまう可能性はあるんじゃないでしょうかね。
Re:中年専用I/F? (スコア:2)
パソコン本体から同周波数帯のノイズが出てそうな気もするんですが
その辺の干渉って如何なんでしょうかね。
コイルやインバーター等々ノイズ出すものは結構ありそうな気が。
Re:中年専用I/F? (スコア:1)
安物のTV内蔵スピーカーなんかだと15~6KHz以上はロクに出てないって聞いたけど。
液晶モニタ内蔵スピーカーとか、ビジネスノートPC内蔵スピーカーとか、そんなイイ音出せるの?
Re: (スコア:0)
どうせ聞こえねーよ、モスキートトーン
もうすぐ天命だから天の声以外は聞こえなくても構わねぇんだよ
犬の気持ちがわかる研究ってあったな (スコア:0)
PC「(ピーーーー)」
犬「ワンワン(うるせぇよ)」
人「静かにしろよ」
アクティブソナーですよねー (スコア:0)
応用して体型から人物を特定して「ボスがきた」ボタンの自動化ができるかもねー
Re: (スコア:0)
そんなことしなくても足音で判別したほうが早いかと・・・
(あと呼吸音や心音も?)
#いまの潜水艦のソナーって船のスクリュー音だけで相手を識別できてたはず
Re: (スコア:0)
スクリュー音どころか、原子炉を自然対流冷却したときのフローノイズも識別してるといううわさが。
映画に使われそう (スコア:0)
ハッキングしてPCから高周波を出してそのPCのある室内の状況を確認するとか。
スパイやハッカーとかが喜んで使いそうな技術だ。
マイクが2つあれば、もっと正確な情報を得られそう。
立てこもり現場とかでも使えそうだが、それなら単にPCじゃなく防犯カメラをハッキングすればいいだけだし。
ここまで情報参謀なし (スコア:0)
http://dic.pixiv.net/a/%E3%82%B5%E3%82%A6%E3%83%B3%E3%83%89%E3%82%A6%E... [pixiv.net]