国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 電子商務(wù) > 圖森互聯(lián)CTO侯曉迪:用5行代碼征服一個(gè)領(lǐng)域

圖森互聯(lián)CTO侯曉迪:用5行代碼征服一個(gè)領(lǐng)域

時(shí)間:2023-01-31 14:08:02 | 來(lái)源:電子商務(wù)

時(shí)間:2023-01-31 14:08:02 來(lái)源:電子商務(wù)

最近自動(dòng)駕駛新聞?lì)l頻,如沃爾沃Uber聯(lián)手自動(dòng)駕駛,福特、Uber爭(zhēng)相發(fā)布無(wú)人駕駛商用時(shí)間線,comma.ai開源,tesla首例自動(dòng)駕駛致死車禍......由此我們也能看到自動(dòng)駕駛的熱度,看起來(lái)像未來(lái)商務(wù),但我們是否清楚這份技術(shù)離我們到底有多遠(yuǎn)?

近日,圖森互聯(lián)正式宣布與北奔研究院、北京理工大學(xué)達(dá)成戰(zhàn)略合作伙伴關(guān)系,三方將以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ)在自動(dòng)駕駛領(lǐng)域展開合作,屬國(guó)內(nèi)首例科技企業(yè)、車企、高校聯(lián)合研發(fā)針對(duì)重型汽車特別是軍用重型汽車自動(dòng)駕駛技術(shù)。圖森互聯(lián)負(fù)責(zé)研發(fā)基于計(jì)算機(jī)視覺和深度學(xué)習(xí)算法,提供自動(dòng)駕駛解決方案。

InfoQ有幸采訪到圖森互聯(lián)CTO,聯(lián)合創(chuàng)始人侯曉迪。并且這個(gè)采訪周末前還在溝通問(wèn)題提要,周末后便收到了回復(fù),看到答案第一感覺就是非常嚴(yán)謹(jǐn),也能從小處看到個(gè)人的高效作風(fēng)。

侯曉迪,2003年進(jìn)入上海交大,并于大三發(fā)表了高引用論文;加州理工計(jì)算與神經(jīng)系統(tǒng)博士,計(jì)算機(jī)視覺和認(rèn)知科學(xué)領(lǐng)域?qū)<?。?chuàng)立了基于頻域的視覺注意機(jī)制理論。是近10年來(lái)在視覺注意機(jī)制最有影響力的研究。是計(jì)算機(jī)視覺領(lǐng)域全球華人博士中學(xué)術(shù)文章被引用最多的作者,學(xué)術(shù)論文Saliency detection: A spectral residual approach(發(fā)表于CVPR)、Image signature: Highlighting sparse salient regions(發(fā)表于IEEE transactions on pattern analysis and machine intelligence )在學(xué)術(shù)領(lǐng)域具有重要影響。

InfoQ:您在大三發(fā)表的論文使您成為華人年輕AI學(xué)者里單篇論文引用數(shù)最高的人,據(jù)說(shuō)甚至超過(guò)很多名校教授,您如何做到的?能說(shuō)說(shuō)這里的故事嗎?

侯曉迪:Paper第一次投就中,最大原因必須是運(yùn)氣好!學(xué)術(shù)會(huì)議的審稿的隨機(jī)性太高,哪怕CVPR這樣的頂級(jí)會(huì)議也是如此。審稿人一言不合就把paper據(jù)掉的血淚故事聽過(guò)太多(當(dāng)然,也親身體驗(yàn)過(guò))。

文章之所以高引,最大的原因是簡(jiǎn)單且有效。整個(gè)算法只有5行代碼,大概是CVPR史上最短的代碼實(shí)現(xiàn)了。我的5行代碼直接寫在了paper里,花一分鐘抄下來(lái)就能獲得很不錯(cuò)的效果(截止2012年,算法的準(zhǔn)確率在公開benchmark上top 3),大家自然喜歡用。

至于說(shuō)要想本科發(fā)頂會(huì)論文,拼的就是投入——全身心的極端的投入。從06年開始直到08年畢業(yè),我一直過(guò)著這樣的生活:吃住在實(shí)驗(yàn)室;翹掉除體育之外的全部文化課;沒有節(jié)假日,日均工作時(shí)間大于16小時(shí);每天無(wú)論是自己吃飯走路還是和實(shí)驗(yàn)室同學(xué)討論,我的世界就只有“視覺的計(jì)算原理”這一件事。

InfoQ:在加州理工讀完博士后,是什么原因誘使您選擇創(chuàng)業(yè)呢?

侯曉迪:對(duì)我而言,創(chuàng)業(yè)是早在讀PhD之初就已經(jīng)決定了的。我希望能夠用更先進(jìn)的生產(chǎn)關(guān)系,試著沖破玻璃天花板,解決一些學(xué)術(shù)圈本身解決不了的問(wèn)題。

在外人看來(lái),Caltech是個(gè)標(biāo)準(zhǔn)的faculty的搖籃。但其實(shí),沐浴在加州的資本陽(yáng)光下,在校內(nèi)跨領(lǐng)域跨學(xué)科合作浪潮的鼓動(dòng)下,我校畢業(yè)生的創(chuàng)業(yè)比例卻高得嚇人。比如我所在的Computation & Neural Systems系,上下三屆20位同學(xué)中就有4個(gè)人選擇畢業(yè)后直接創(chuàng)業(yè)。

InfoQ:請(qǐng)問(wèn)基于圖片的嵌入式原生廣告投放服務(wù)落地難點(diǎn)在哪里?對(duì)于圖像識(shí)別SaaS的未來(lái)技術(shù)趨勢(shì),您有何看法?

侯曉迪:實(shí)驗(yàn)室層次的“work”,和實(shí)驗(yàn)室產(chǎn)品層次的“work”有很大差別。在媒體的渲染下,大家都以為deep learning是個(gè)已經(jīng)解決的問(wèn)題。但其實(shí), deep learning解決得好且非常容易上手的,絕大部分都與ImageNet classification problem類似(分類清晰,訓(xùn)練數(shù)據(jù)量大,對(duì)整張圖片給唯一標(biāo)簽)。在實(shí)際中,我們經(jīng)常會(huì)遇到訓(xùn)練數(shù)據(jù)不夠,訓(xùn)練和測(cè)試數(shù)據(jù)差別太大,類別不均衡,類間差異太小,一張圖對(duì)應(yīng)多標(biāo)簽,圖片中物體較小……這些差異在外行看來(lái)似乎無(wú)足輕重,但是都會(huì)對(duì)deep learning的分類結(jié)果產(chǎn)生重大影響。這就導(dǎo)致了——產(chǎn)品經(jīng)理每次提出來(lái)的一個(gè)新問(wèn)題,都還需要算法工程師做各種量身定制,才能讓deep learning跑出還不錯(cuò)的結(jié)果。

在這個(gè)方面,我們的終極目標(biāo)是讓產(chǎn)品經(jīng)理拖拖鼠標(biāo),就能部署圖森的深度學(xué)習(xí)系統(tǒng)。所以圖森的SaaS平臺(tái)看起來(lái)平淡無(wú)奇,但其實(shí)里面包含了大量的算法自適應(yīng)黑科技。

InfoQ:圖森車型識(shí)別準(zhǔn)確度達(dá)到多少,是否考慮過(guò)開源的框架和開源的數(shù)據(jù)集?

侯曉迪:車型識(shí)別準(zhǔn)確率,在我們自己的數(shù)據(jù)上大概是97%。

圖森一直積極參與開源。我司首席科學(xué)家王乃巖同學(xué)就是MXNet(目前最先進(jìn)、速度最快的深度學(xué)習(xí)開源框架)的核心成員之一。我們長(zhǎng)期與MXNet合作,提交了大量的開源代碼,是MXNet最大的貢獻(xiàn)單位。

InfoQ:請(qǐng)問(wèn)有l(wèi)idar和無(wú)lidar優(yōu)缺點(diǎn)是什么?他們的可靠性差別有多大 ?圖森是如何選擇的?

侯曉迪:信息量非負(fù),多加任何傳感器,肯定不會(huì)幫倒忙。哪怕該信息已經(jīng)可以通過(guò)其他渠道獲得,加入后也可以起到交叉校驗(yàn)、降低噪音等功能。

通過(guò)發(fā)射激光,LiDAR可以很準(zhǔn)確地測(cè)出光朝著某個(gè)方向前進(jìn),走多遠(yuǎn)會(huì)碰到障礙物。這個(gè)信息雖然很有用,但也不過(guò)是自動(dòng)駕駛千里長(zhǎng)征的第一步。光靠分析點(diǎn)的距離,我們并不能直接讀出一坨點(diǎn)云對(duì)應(yīng)的是什么物體,物體如何運(yùn)動(dòng);更無(wú)法猜出汽車牌照、車道線標(biāo)記、交通標(biāo)志內(nèi)容這些無(wú)法反映在3D點(diǎn)云上的信息。而且,一旦遇到下雨下雪或者重度霧霾這種會(huì)干擾激光的場(chǎng)景,LiDAR都會(huì)罷工。

LiDAR的好處是,可以一步跨越3D測(cè)距這個(gè)非常難的問(wèn)題,從一個(gè)比較容易的起點(diǎn)開始做自動(dòng)駕駛。

我司沒有用LiDAR,主要的考慮是成本。今天32線LiDAR的市價(jià)是8萬(wàn)美元,在三年后,LiDAR的成本會(huì)不會(huì)是自動(dòng)駕駛普及的最大攔路虎?這個(gè)問(wèn)題現(xiàn)在當(dāng)然沒人知道,圖森選擇的道路是,寧可從比較難的起點(diǎn)多花些功夫,做我們擅長(zhǎng)做的事(不借助LiDAR,直接基于機(jī)器視覺研發(fā)算法),也不要讓我們的商業(yè)化之路受制于我們無(wú)法控制的事情。

InfoQ:最近tesla出現(xiàn)的識(shí)別失敗導(dǎo)致的車禍?zhǔn)鹿士梢员苊鈫?或者誤識(shí)別的概率多大,以tesla最近的車禍場(chǎng)景為例?針對(duì)輔助駕駛/無(wú)人駕駛有哪些算法上的改進(jìn)?(是否有paper或者專利?)

侯曉迪:首先,Mobileye的EyeQ3本身只是一個(gè)輔助駕駛系統(tǒng)。但是市場(chǎng)接受TESLA的概念的時(shí)候,是作為自動(dòng)駕駛來(lái)炒作的。這相當(dāng)于TESLA提前消費(fèi)了大眾對(duì)自動(dòng)駕駛這項(xiàng)技術(shù)的信任。這是很糟糕的事情。

其次,小概率事件不意味著它絕對(duì)不會(huì)發(fā)生,所以哪怕是一百年后,我相信自動(dòng)駕駛的車禍?zhǔn)鹿室膊粫?huì)100%完全避免。所以我在這里只談?wù)劕F(xiàn)行系統(tǒng)的問(wèn)題。

當(dāng)前的模式識(shí)別學(xué)術(shù)界(以及衍生自學(xué)術(shù)界的工業(yè)界)過(guò)度地以“正確率”作為單一的優(yōu)化目標(biāo)。一方面大家都知道,算法正確率越高,進(jìn)一步攀升的難度也就越大;另一方面,卻很少有人關(guān)注“如果識(shí)別錯(cuò)了怎么辦”這一問(wèn)題。通用的做法是錯(cuò)一次就扣一分,不管你是沒看到一輛近在眼前的大卡車,還是把路旁的兔子識(shí)別成了狗。

在圖森,我們一直非常強(qiáng)調(diào)的一項(xiàng)技術(shù)積累是self-consciousness of AI——即,我們的算法不但需要進(jìn)行各種識(shí)別,還需要對(duì)“自己是否識(shí)別對(duì)了”進(jìn)行預(yù)估。從而進(jìn)一步提升系統(tǒng)可靠性。

我們申請(qǐng)了一些專利,也有paper發(fā)表。

InfoQ:您對(duì)最近開源的comma.ai的有何看法?

侯曉迪:comma.ai是典型的深度學(xué)習(xí)福音派。這種思路一般稱作end-to-end learning,認(rèn)為只要把大量輸入(攝像頭拍攝畫面)輸出(油門角度、方向盤力度)數(shù)據(jù)扔給深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,就能教會(huì)機(jī)器如何駕駛。所有的算法的問(wèn)題,最終都可以轉(zhuǎn)化為訓(xùn)練數(shù)據(jù)的問(wèn)題,并乘著大數(shù)據(jù)的東風(fēng)迎刃而解。

這個(gè)想法聽起來(lái)很棒。但實(shí)際操作起來(lái)卻隱患重重。當(dāng)系統(tǒng)碰到訓(xùn)練集里沒有的突發(fā)情況時(shí),誰(shuí)也無(wú)法保證會(huì)發(fā)生什么。其實(shí)end-to-end的問(wèn)題并不是第一天才發(fā)現(xiàn),業(yè)界很多人都嘗試過(guò),并匯報(bào)了類似結(jié)果。比如今年GTC 16上,NVidia也介紹了他家的end-to-end driving system,一個(gè)最大的特點(diǎn)是,如果一切在預(yù)料中,汽車可以很神奇地保持行進(jìn)路線;但只要稍微偏離,錯(cuò)誤變會(huì)積累,偏差越來(lái)越大。換言之,系統(tǒng)不具備把自己從未知的意料之外的狀態(tài)中修正回來(lái)的能力。

相比來(lái)說(shuō),我司并不反對(duì)deep learning,但是我們堅(jiān)持認(rèn)為不能簡(jiǎn)單粗暴地把deep learning等價(jià)于machine learning,因?yàn)檫@種“未知的意料之外”是無(wú)論積累多少訓(xùn)練數(shù)據(jù)都還是會(huì)存在的。接著我剛才講的self-consciousness of AI,我們需要讓算法發(fā)現(xiàn)自己的錯(cuò)誤,并將自我糾錯(cuò)以先驗(yàn)的形式加入到系統(tǒng)中來(lái)。想做到這一步,還時(shí)需要回過(guò)頭來(lái)借助許多傳統(tǒng)的,非deep的machine learning方法。

另外,comma.ai已經(jīng)公布的代碼和數(shù)據(jù)都很業(yè)余,充其量是研究生課程《自動(dòng)駕駛》的期末課程作業(yè),跟工業(yè)級(jí)算法系統(tǒng)完全沒有可比性(可能也正因此,comma.ai才舍得將其開源吧)。

InfoQ:對(duì)于智能駕駛,您覺得是應(yīng)該以改進(jìn)算法為主還是以積累駕駛數(shù)據(jù)訓(xùn)練優(yōu)化為主?對(duì)于在中國(guó),普及實(shí)現(xiàn)自動(dòng)駕駛主要難點(diǎn)有哪些?是否存在“中國(guó)特色”?

侯曉迪:改進(jìn)算法和積累駕駛數(shù)據(jù)訓(xùn)練優(yōu)化是一對(duì)相輔相成的過(guò)程,缺一不可。我認(rèn)為一個(gè)健康的商業(yè)模式一定會(huì)同時(shí)促進(jìn)這兩者。

在中國(guó)做自動(dòng)駕駛,一個(gè)難點(diǎn)在于很多公開的學(xué)術(shù)圈數(shù)據(jù)集都是國(guó)外采集的(德國(guó)最多)。另一個(gè)難點(diǎn)是由于政策原因?qū)е聹y(cè)繪數(shù)據(jù)的不完整。這兩點(diǎn)會(huì)對(duì)沒人手也沒錢的學(xué)術(shù)工作者和超早期創(chuàng)業(yè)團(tuán)隊(duì)增加一些麻煩。我也確實(shí)見過(guò)有幾家國(guó)內(nèi)公司,為了給自己強(qiáng)行造壁壘,每次在談到Mobileye的時(shí)候,都拿中國(guó)馬路上常見的超載大貨車說(shuō)事兒。但說(shuō)實(shí)話,只要Mobileye想把有中國(guó)特色的大貨車納入到他們的平臺(tái)里,從采數(shù)據(jù)到訓(xùn)練/遷移模型,分分鐘就能做好,根本不會(huì)有什么戰(zhàn)略壁壘。

算法的遷移和泛化相比整套系統(tǒng),只是非常小的一部分工作量。更何況到了產(chǎn)品層,各家肯定都是自己在準(zhǔn)備數(shù)據(jù)。所以自動(dòng)駕駛各家比拼到最后,還是得硬碰硬。

關(guān)鍵詞:征服,領(lǐng)域

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉