加利福尼亞大學圣地亞哥分校(UCSD)和南加利福尼亞大學(USC)的研究人員最近推出了一種名為 CyberDemo 的新型人工智能框架,旨在通過視覺觀察進行機器人模仿學習。
傳統(tǒng)的模仿學習方法通常需要大量高質量的示范數(shù)據(jù)來教導機器人完成復雜任務,特別是對于需要高度靈巧的任務來說。然而,CyberDemo 通過利用模擬人類示范來完成真實世界的機器人操縱任務,從而減少了對物理硬件的需求,使得遠程和并行數(shù)據(jù)收集成為可能。此外,通過模擬器專屬的數(shù)據(jù)增強技術,CyberDemo 顯著增強了任務性能,生成的數(shù)據(jù)集比在真實世界環(huán)境中收集的數(shù)據(jù)集大得多。
CyberDemo 的方法從在模擬環(huán)境中使用低成本設備進行遠程操作收集人類示范開始。隨后,通過廣泛的增強方法對數(shù)據(jù)進行豐富處理,包括各種視覺和物理條件,以提高訓練策略對真實世界變化的魯棒性。該框架采用課程學習策略進行策略訓練,首先使用增強數(shù)據(jù)集,然后逐漸引入真實世界示范以對策略進行微調。與使用真實世界示范數(shù)據(jù)微調的預訓練策略相比,這種方法確保了平穩(wěn)的從模擬到現(xiàn)實的過渡,解決了光照、物體幾何和初始姿勢變化等問題,而無需額外的示范。
在各種操縱任務中,CyberDemo 的性能令人印象深刻。相比傳統(tǒng)方法,CyberDemo 在任務成功率上取得了顯著提高。尤其值得注意的是,在涉及未見過的物體時,CyberDemo 的泛化能力特別突出,在旋轉新物體的成功率達到42.5%,這是傳統(tǒng)方法表現(xiàn)的顯著飛躍。對比基線包括先進的視覺預訓練模型如 PVR、MVP 和 R3M,CyberDemo 的成功之處突顯了其效率和穩(wěn)健性,以及其能夠勝過在真實世界示范數(shù)據(jù)集上微調的模型。
CyberDemo 的創(chuàng)新方法通過利用增強的模擬數(shù)據(jù)挑戰(zhàn)了解決實際問題必須依賴真實示范數(shù)據(jù)的傳統(tǒng)觀念。通過 CyberDemo 的性能所展示的經(jīng)驗數(shù)據(jù),突顯了通過數(shù)據(jù)增強增強的模擬數(shù)據(jù)在機器人操縱任務的價值方面能夠超越真實世界數(shù)據(jù)。雖然為每個任務設計模擬環(huán)境需要額外的工作,但減少了數(shù)據(jù)收集的人為干預,并避免了復雜的獎勵設計過程,為機器人操縱領域帶來了一種可擴展且高效的解決方案。
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。