賦予機(jī)器感知三維世界的眼睛
時(shí)間:2022-03-18 16:36:01 | 來(lái)源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-03-18 16:36:01 來(lái)源:行業(yè)動(dòng)態(tài)
人類(lèi)擁有與生俱來(lái)的3D環(huán)境感知和理解能力,這是因?yàn)槲覀冇脙芍谎劬?lái)捕捉圖像,通過(guò)大腦處理形成立體視覺(jué),從而辨認(rèn)物體的形狀方位、他人的動(dòng)作,輕松自然地跟這個(gè)三維世界交互。
能否讓機(jī)器也能感知三維世界呢?或許很多人會(huì)想到給機(jī)器添加一顆攝像頭。但普通RGB攝像頭拍攝的現(xiàn)實(shí)世界的影像,僅能采集場(chǎng)景中的色彩信息,無(wú)法采集物體和攝像頭之間的距離和方位。也就是說(shuō),無(wú)論場(chǎng)景中的三維結(jié)構(gòu)有多么豐富,對(duì)機(jī)器來(lái)說(shuō)都是一個(gè)平面,一個(gè)二維世界。
3D視覺(jué)技術(shù),就是賦予機(jī)器感知三維世界的信息和能力,并給我們帶來(lái)顛覆性的價(jià)值。試想一下,將汽車(chē)立體模型通過(guò)增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)投射出來(lái),客戶可360度觀看,還能開(kāi)車(chē)門(mén),由此直觀地提出意見(jiàn),而不是一張張翻看照片;或者派無(wú)人機(jī)探索森林或洞穴,一邊前行一邊繪制周邊場(chǎng)景的三維地形,而不是我們拿著一張平面地圖親自探險(xiǎn)
事實(shí)上,3D視覺(jué)技術(shù)目前已經(jīng)在工業(yè)界取得成功,但在消費(fèi)領(lǐng)域,受限于3D感知硬件的成本和體積、計(jì)算能力等困擾,很多場(chǎng)景并未激活。除了掃地機(jī)器人等個(gè)別終端外,我們的智能手機(jī)等移動(dòng)設(shè)備,還處在二維世界里。但近幾年,3D視覺(jué)技術(shù)終于開(kāi)始走向個(gè)人終端,機(jī)器認(rèn)知世界的新大門(mén)正在打開(kāi)。