|
自從微軟發(fā)布Kinect以來,體感設備的3D手勢識別一直就是熱潮。那么什么是3D手勢識別呢?簡單來說,這項技術就是利用各類傳感器對手部/手持工具的形態(tài)、位移等進行持續(xù)采集,每隔一段時間完成一次建模,形成一個模型信息的序列幀,再將這些信息序列轉(zhuǎn)換為對應的指令,用來控制實現(xiàn)某些操作。隨著各項技術的成熟和傳感器的發(fā)展,手勢識別已經(jīng)進入可用性階段,各類產(chǎn)品和解決方案也開始涌現(xiàn),其中,應用最為廣泛的是游戲設備中利用攝像頭的計算機視覺識別。但其他方案,如紅外識別、電場識別、雷達識別以及超聲波識別也是潛在的競爭方案,而且這些方案相對攝像頭的計算機視覺識別來說,更有可能成為未來的主要技術。 科研人員創(chuàng)業(yè)最大的弊端就是過度關注某個技術的細節(jié)不能自拔,總想以高大上的技術強迫用戶接受,甚至膜拜。假如我們換個角度思考,若你作為用戶拿出錢包出去消費,難道就是為了買這種無聊的技術膜拜嗎?因此每當看到一些熱點技術,我們應該首先關注的便是這種技術的應用場景,然后再從原理上分析有幾種可以實現(xiàn)的方案,其中哪個方案更容易適應市場并且能被用戶快速接受。事實上,自然進化過程中我們就形成了以語音和手勢為主的交互方式,但是自計算機誕生以來,我們卻發(fā)明了鍵盤和鼠標,并且一直作為人機交互的主要載體。顯然這不符合我們?nèi)粘I畹牧晳T,而且交流的效率也不高。因為鍵盤和鼠標還都屬于文本交互模式,這種文本模式更適合我們學習和記憶,別忘了我們知識傳承的主要載體就是書籍。語音識別和視頻識別之所以如此火爆,也是因為帶來幻想是對鍵盤、鼠標的替代,是一種交互模式的顛覆。 最困難的商業(yè)模式就是挖掘人類最本質(zhì)的需求和最簡單的應用。當然,3D手勢識別不是為了顛覆人機交互的模式,而是可以引發(fā)更多的變革,例如全新的游戲操控方式,全新的家電控制方式,全新的汽車操控方式;用手指進行空中繪畫,用手指在空中演奏音樂,用手指傳遞信息數(shù)據(jù);還有就像我們在《鋼鐵俠》里看到的那樣,設計師、建筑師等可以直接對3D模型進行設計、拆解和分析。正因為如此,3D手勢識別擁有特別廣闊的想象空間,可以延伸出無數(shù)的產(chǎn)品,所以這個領域的爭奪也將會十分激烈。 接下來,我們來分析一下幾種手勢識別的技術方案。 先看最常用的方案,基于攝像頭的視頻手勢識別和紅外手勢識別最大的問題就是光線的影響,也就是這兩種方式無法做到全天候應用,紅外顯然更怕戶外的強光,而攝像頭更怕夜晚的弱光。另外視頻手勢識別的功耗和成本顯然都是太高了,至少目前來看還很難普及應用。這個領域中最火熱的自然是Leap Motion,根據(jù)其宣傳,攝像頭最大頻率是每秒鐘290幀,即每秒鐘建立290個手部的3D模型,還可以追蹤到傳感器上方25 mm~ 600 mm范圍內(nèi),150度視角中精確到0.01毫米的動作。顯然這種方案的成本也是非常昂貴的,微軟的Kinect也要借助多個攝像頭包括紅外才能做到我們所能體驗的效果。 電場識別的主要問題則是距離太近,比如MYO臂環(huán),要佩戴在任何一條胳膊的肘關節(jié)上方,探測用戶的肌肉產(chǎn)生的電活動。臂帶上的感應器捕捉到用戶手臂肌肉運動時產(chǎn)生的生物電變化,從而判斷佩戴者的意圖,再將電腦處理的結果通過藍牙發(fā)送至受控設備。 超聲和雷達顯然具有更好的環(huán)境適應性,這兩個方案也是筆者最為看好的兩種技術。雷達的技術方案相比超聲來說,可辨別手勢的精度更高,但是筆者并不喜歡這這個方案,這是為什么呢?因為雷達基本采用300M-300G Hz的頻段(13G-150G Hz是主流),而手勢識別的一般要到10G Hz以上。事實上,這些頻段我們都可以稱為微波。微波大家應該熟悉,想想我們家里用的微波爐。微波的屬性,也就是說雷達所在的頻段有一些特性,比如遇到金屬會反射,所以電梯里不加中繼就沒有手機信號。當然這些倒都無妨,其關鍵的是微波遇到生物組織會被吸收并且轉(zhuǎn)為熱量,想想家中的微波爐的快速加熱作用,這里就不言而喻了。而迄今為止,有哪些實驗證明了微波頻段對人體沒有傷害呢?專家說了也沒發(fā)現(xiàn)對人體有害的證據(jù),你信嗎?反正我是信了,專家嘛總要給個面子。目前,我們身邊已經(jīng)有了手機、WiFi,還好功率小些,影響不是太大,若周邊所有的設備都再加個10G-80G Hz的手勢識別裝置,我是拒絕的。 那么超聲就沒有危害嗎?當然也有,超聲本來就是一種聲音,只是我們聽不到,即便我們聽到的聲音,若聲壓超過了130分貝也會對我們造成傷害。世界上任何一種技術都具有兩面性,既可以造福我們提供便利,也可以傷害我們,比如核能技術。但相對其他方案來說,超聲器件生產(chǎn)制造中更容易控制功率,即便過量了也很難引起我們基因?qū)用娴膫?,而且這種技術在手勢識別中的距離范圍比較大,從近場到遠場幾乎都可以做到,關鍵的是,這種技術真的是很廉價可靠。 下面,我們把上面的幾種技術方案匯總一下,做個表格便是一目了然了,具體請看如下: 下面具體再看下超聲手勢識別的技術細節(jié),該技術方案除了利用我們熟悉的超聲測距來偵測物體(倒車雷達其實就是超聲測距),還利用了多普勒效應來偵測手指的運動和手勢。我們都知道多普勒現(xiàn)象,即聲音頻率的改變與聲源及聽者之間的距離有關,比如警笛呼嘯而過時的那種聲音的變化。超聲手勢識別就是用壓電器件做超聲發(fā)射源(中心頻率大于20K Hz),而接收的頻率則會隨著手指或身體的位置的變化而變化。通過測量這一頻率的變化,然后通過算法進行頻率和相位方面的計算,就能準確定位和識別手勢的內(nèi)容。通常來說,超聲的頻率越高,識別的精度也就會越高,但是識別的距離卻會變小。 歸結來說,超聲手勢識別應該是當前最有可能普及的一項技術方案,當然這個技術方案也存在一些缺陷和不足,比如識別精度無法媲美雷達方案。但技術是不斷迭代的,而且我們都知道無法指望單憑某一技術就滿足用戶的所有場景。我們生活中所碰到的任何物品,幾乎都是多種技術結合的產(chǎn)物,而未來3D手勢識別最好的技術方案,應該是聲光電一體的解決方案,猶如人體結構的多種感官共同作用。 |
|
|