文/周雄飛
如何讓自動(dòng)駕駛算法,實(shí)現(xiàn)人類大腦的工作效率?
這一課題,一直都是自動(dòng)駕駛行業(yè)探索的重要領(lǐng)域。因?yàn)榫湍壳皝?lái)看,大多數(shù)的自動(dòng)駕駛算法模型,以及引得全行業(yè)追逐的端到端模型,都是基于海量數(shù)據(jù)訓(xùn)練和調(diào)優(yōu)實(shí)現(xiàn)的,由此在業(yè)內(nèi)看來(lái),現(xiàn)階段自動(dòng)駕駛行業(yè),是處于數(shù)據(jù)驅(qū)動(dòng)的時(shí)代。
但與此同時(shí),數(shù)據(jù)驅(qū)動(dòng)也存在著諸多的問(wèn)題。就比如隨著對(duì)端到端技術(shù)的研究和應(yīng)用走向更加深入,對(duì)于數(shù)據(jù)質(zhì)量的要求變得越來(lái)越高,以及還存在泛化性能不足和效率不高等問(wèn)題,更為重要的是,在應(yīng)對(duì)一些Corner cases時(shí)不如人類大腦的反應(yīng)速度。
在這樣的行業(yè)背景下,以Nullmax為代表的一些自動(dòng)駕駛企業(yè)們也提出了創(chuàng)新性的思考。
這兩天,Nullmax舉辦了主題為“AI無(wú)止境,智變新開(kāi)端”的技術(shù)發(fā)布會(huì),正式推出了最新的自動(dòng)駕駛技術(shù)——Nullmax Intelligence(以下簡(jiǎn)稱NI),是一套基于端到端技術(shù)架構(gòu)的技術(shù),包含多模態(tài)大模型和安全類腦的神經(jīng)網(wǎng)絡(luò)。
基于多模態(tài)大模型,NI可實(shí)現(xiàn)對(duì)聲音、文本和手勢(shì)等眾多信息輸入的支持,輸出端則支持包括文本、運(yùn)動(dòng)軌跡等可視化結(jié)果信息;此外,NI還引入了規(guī)模對(duì)應(yīng)斑馬魚(yú)的神經(jīng)網(wǎng)絡(luò),換句話說(shuō)就是把類腦的神經(jīng)網(wǎng)絡(luò)引入自動(dòng)駕駛架構(gòu),讓腦科學(xué)與自動(dòng)駕駛實(shí)現(xiàn)結(jié)合。
湊巧的是,作為特斯拉掌門(mén)人的埃隆·馬斯克,通過(guò)布局腦機(jī)接口公司Neuralink,也算同時(shí)布局自動(dòng)駕駛和腦科學(xué)兩大領(lǐng)域的企業(yè)家,只不過(guò)目前這兩項(xiàng)業(yè)務(wù)并沒(méi)有完全融合起來(lái),這意味著Nullmax或許比馬斯克更進(jìn)一步。
如今,Nullmax發(fā)布Nullmax Intelligence,在業(yè)內(nèi)看來(lái)Nullmax試圖解決以上這些行業(yè)問(wèn)題的同時(shí),也為整個(gè)自動(dòng)駕駛行業(yè)向智能驅(qū)動(dòng)進(jìn)化帶來(lái)了新的啟發(fā)。
01、讓自動(dòng)駕駛行業(yè)向智能驅(qū)動(dòng)進(jìn)化
“自動(dòng)駕駛技術(shù),需要更聰明和更擬人。”
在發(fā)布會(huì)上,Nullmax創(chuàng)始人兼CEO徐雷說(shuō)出了他對(duì)自動(dòng)駕駛技術(shù)的看法,為了做到這一目標(biāo),他在NI架構(gòu)中引入了多模態(tài)大模型和安全類腦的概念。
先來(lái)看多模態(tài)大模型,區(qū)別于只支持輸入視頻信號(hào)的大模型,NI基于參數(shù)量達(dá)到十億級(jí)別的多模態(tài)大模型,可支持視頻、聲音、文本以及手勢(shì)等多種信號(hào)的輸入。
翻譯一下,NI除了能識(shí)別攝像頭采集的諸多視頻信號(hào)之外,還能“聽(tīng)懂”和“看懂”環(huán)境中出現(xiàn)的聲音和文本信息,以及交警的手勢(shì)信息等等,以便做到“眼觀六路,耳聽(tīng)八方”的目標(biāo)。
輸入端輸入這些信息后,NI端到端架構(gòu)的輸出端就會(huì)輸出包括人機(jī)交互畫(huà)面(HMI)、場(chǎng)景描述和運(yùn)動(dòng)軌跡等可視化結(jié)果。
對(duì)于為何會(huì)輸出這么多可視化結(jié)果的原因,徐雷向飛說(shuō)智行解釋為“要讓端到端模型具備可解釋性,讓其不再是一個(gè)‘黑箱’”。
一直以來(lái),端到端架構(gòu)“黑箱”問(wèn)題一直困擾著自動(dòng)駕駛行業(yè),對(duì)此也有英國(guó)自動(dòng)駕駛企業(yè)Wayve,國(guó)內(nèi)自動(dòng)駕駛企業(yè)毫末智行等企業(yè),試圖引入LLM大語(yǔ)言模型和VLM視覺(jué)語(yǔ)言模型來(lái)解決這一問(wèn)題。
但就在之后的實(shí)踐中,行業(yè)也發(fā)現(xiàn)LLM存在一定幻覺(jué)的問(wèn)題。就比如毫末智行CEO顧維灝認(rèn)為,LLM存在較為嚴(yán)重的幻覺(jué),來(lái)指導(dǎo)自動(dòng)駕駛算法有較大的風(fēng)險(xiǎn)。
或許Nullmax看到了這一風(fēng)險(xiǎn),由此在基于LLM給出場(chǎng)景描述的同時(shí),NI還會(huì)輸出人機(jī)交互畫(huà)面(HMI)和車輛運(yùn)動(dòng)軌跡等可視化結(jié)果,以便達(dá)到交叉驗(yàn)證和干涉調(diào)整的目的,從而打破端到端“黑箱”問(wèn)題。
如果以上過(guò)程屬于NI輸出結(jié)果后的一級(jí)仲裁,那么Nullmax還在此基礎(chǔ)上加入了“安全類腦”架構(gòu)和一級(jí)仲裁結(jié)果并行的二級(jí)仲裁。
所謂“安全類腦”,按照徐雷對(duì)飛說(shuō)智行的解釋,參考了斑馬魚(yú)腦部神經(jīng)網(wǎng)絡(luò),搭建了一個(gè)參數(shù)量為十萬(wàn)量級(jí)的神經(jīng)網(wǎng)絡(luò),以便讓自動(dòng)駕駛算法具備“趨利避害”的生物本能,能夠根據(jù)環(huán)境情況作出反應(yīng),從而實(shí)現(xiàn)更高程度的安全、智能、自由。
其實(shí),把類腦神經(jīng)網(wǎng)絡(luò)引入自動(dòng)駕駛算法中,除了Nullmax之外,在學(xué)術(shù)界也有嘗試。
2020年,奧地利科技學(xué)院(IST Austria)、維也納工業(yè)大學(xué)(TU Wien)和麻省理工學(xué)院(MIT)三所高校,由于受到線蟲(chóng)等小型動(dòng)物大腦的啟發(fā),把類腦神經(jīng)元引入至自動(dòng)駕駛算法中,從而讓其控制車輛。
在該項(xiàng)目負(fù)責(zé)人Radu Grosu教授看來(lái),由于少量神經(jīng)元的參與,自動(dòng)駕駛網(wǎng)絡(luò)不再是深度學(xué)習(xí)的“黑箱”,研究者可以知道每個(gè)網(wǎng)絡(luò)運(yùn)行的情況,這項(xiàng)研究也刊登在當(dāng)年的《自然-機(jī)器智能》期刊中。這應(yīng)該也是徐雷認(rèn)為NI端到端架構(gòu)不再是“黑箱”的原因所在。
雖然Radu Grosu等人的研究面世早于Nullmax,但從產(chǎn)業(yè)落地和量產(chǎn)交付方面,后者走在了自動(dòng)駕駛行業(yè)的前端。按照徐雷透露,NI架構(gòu)預(yù)計(jì)會(huì)在明年初上車落地,由此自動(dòng)駕駛行業(yè)有望進(jìn)入智能驅(qū)動(dòng)的時(shí)代。
但對(duì)于Nullmax來(lái)說(shuō),野心不止于此。
02、不止于ADAS,還有運(yùn)貨和具身智能
高開(kāi)放性和高適用性,是Nullmax智能駕駛方案最明顯的標(biāo)簽。
按照Nullmax此次發(fā)布的方案來(lái)看,主要分為以下三種:
(1)僅搭載1顆攝像頭的1V方案,基于一顆來(lái)自TI的2 TOPS算力芯片,可實(shí)現(xiàn)基礎(chǔ)的L2級(jí)別輔助駕駛;
(2)搭載5-6顆攝像頭,基于8 TOPS的算力芯片,實(shí)現(xiàn)包括高速NOA、記憶泊車等智能輔助駕駛能力,且在泊車過(guò)程中可檢測(cè)障礙物。
(3)搭載11顆攝像頭,實(shí)現(xiàn)L2+高階智駕的能力。
基于這低中高三大方案,可以看到Nullmax的智駕方案,可以實(shí)現(xiàn)適配不同硬件和算力的配置,同時(shí)根據(jù)徐雷的介紹,他們的智駕方案還可以適配不同車企旗下的不同車型產(chǎn)品,從而滿足不同車企客戶需求的目的。
按照Nullmax的計(jì)劃,未來(lái)基于智能驅(qū)動(dòng)的智駕方案,可以實(shí)現(xiàn)以小于100 TOPS的稀疏算力,實(shí)現(xiàn)全場(chǎng)景NOA;也能實(shí)現(xiàn)對(duì)2 TOPS-2000 TOPS算力區(qū)間方案的全覆蓋。
Nullmax能實(shí)現(xiàn)這些,得益于他們對(duì)于軟件平臺(tái)化的布局。簡(jiǎn)單說(shuō),通過(guò)多模態(tài)輸入token化、多模態(tài)模型推理和自動(dòng)駕駛功能集成這三個(gè)環(huán)節(jié)進(jìn)行抽象,再加上自研中間件MaxOS平臺(tái),從而可以讓整體算法適配不同車型的傳感器搭載和不同算力的芯片,且易于部署。
除了開(kāi)放性和適用性之外,智駕方案的成本是否具有優(yōu)勢(shì),也已成為行業(yè)和車企們重點(diǎn)關(guān)注的方面。
按照Nullmax官方的介紹,他們的智駕方案成本已低至千元級(jí)級(jí)別,具備行業(yè)優(yōu)勢(shì)。一方面的原因是因?yàn)椴捎昧思円曈X(jué)、真無(wú)圖的技術(shù)路線,不依賴高精地圖、輕地圖、低精地圖、眾包地圖等資源,從而降低了成本。
另一方面,Nullmax也降低了算法訓(xùn)練的成本和提高了訓(xùn)練的效率,這是基于他們構(gòu)建的數(shù)據(jù)和算法平臺(tái)——基石架構(gòu)。除了利用真實(shí)路測(cè)數(shù)據(jù)之外,基于這一架構(gòu),還能通過(guò)AIGC方式生成高質(zhì)量虛擬數(shù)據(jù),推動(dòng)算法的迭代。
相比于真實(shí)數(shù)據(jù),虛擬數(shù)據(jù)在成本方面可大幅降低,與此同時(shí)還提升了算法仿真訓(xùn)練的效率。
依靠以上這樣高開(kāi)放性和高適配性、以及高性價(jià)比的智駕方案能力,Nullmax目前已收獲眾多合作伙伴,包括奇瑞、上汽、比亞迪、長(zhǎng)城和福特等頭部車企,以及德賽西威、黑芝麻等上下游生態(tài)伙伴。
在提出智能驅(qū)動(dòng)的背景下,除了乘用車ADAS之外,Nullmax還想把版圖擴(kuò)展到更多的領(lǐng)域。
按照他們的展望,在推動(dòng)全場(chǎng)景的載人和運(yùn)貨應(yīng)用,實(shí)現(xiàn)真正有價(jià)值的大范圍無(wú)人駕駛的同時(shí),還能復(fù)用成套的AI技術(shù)能力,開(kāi)拓更廣闊的具身智能應(yīng)用。
這也意味著,Nullmax此次推出Nullmax Intelligence的同時(shí),也邁出了奔向未來(lái)的一大步。
參考資料:
1、Mathias Lechner, Ramin Hasani, Alexander Amini.Neural circuit policies enabling auditable autonomy[C].Nature Machine Intelligence volume 2, pages642–652 (2020).
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。