研究人員推新AI框架CyberDemo:通過視覺觀察讓機器人模仿學習

2024年03月07日 16:49:47 來源：站長之家

　　加利福尼亞大學圣地亞哥分校(UCSD)和南加利福尼亞大學(USC)的研究人員最近推出了一種名為 CyberDemo 的新型人工智能框架，旨在通過視覺觀察進行機器人模仿學習。

　　傳統(tǒng)的模仿學習方法通常需要大量高質量的示范數(shù)據(jù)來教導機器人完成復雜任務，特別是對于需要高度靈巧的任務來說。然而，CyberDemo 通過利用模擬人類示范來完成真實世界的機器人操縱任務，從而減少了對物理硬件的需求，使得遠程和并行數(shù)據(jù)收集成為可能。此外，通過模擬器專屬的數(shù)據(jù)增強技術，CyberDemo 顯著增強了任務性能，生成的數(shù)據(jù)集比在真實世界環(huán)境中收集的數(shù)據(jù)集大得多。

　　CyberDemo 的方法從在模擬環(huán)境中使用低成本設備進行遠程操作收集人類示范開始。隨后，通過廣泛的增強方法對數(shù)據(jù)進行豐富處理，包括各種視覺和物理條件，以提高訓練策略對真實世界變化的魯棒性。該框架采用課程學習策略進行策略訓練，首先使用增強數(shù)據(jù)集，然后逐漸引入真實世界示范以對策略進行微調。與使用真實世界示范數(shù)據(jù)微調的預訓練策略相比，這種方法確保了平穩(wěn)的從模擬到現(xiàn)實的過渡，解決了光照、物體幾何和初始姿勢變化等問題，而無需額外的示范。

　　在各種操縱任務中，CyberDemo 的性能令人印象深刻。相比傳統(tǒng)方法，CyberDemo 在任務成功率上取得了顯著提高。尤其值得注意的是，在涉及未見過的物體時，CyberDemo 的泛化能力特別突出，在旋轉新物體的成功率達到42.5%，這是傳統(tǒng)方法表現(xiàn)的顯著飛躍。對比基線包括先進的視覺預訓練模型如 PVR、MVP 和 R3M，CyberDemo 的成功之處突顯了其效率和穩(wěn)健性，以及其能夠勝過在真實世界示范數(shù)據(jù)集上微調的模型。

　　CyberDemo 的創(chuàng)新方法通過利用增強的模擬數(shù)據(jù)挑戰(zhàn)了解決實際問題必須依賴真實示范數(shù)據(jù)的傳統(tǒng)觀念。通過 CyberDemo 的性能所展示的經(jīng)驗數(shù)據(jù)，突顯了通過數(shù)據(jù)增強增強的模擬數(shù)據(jù)在機器人操縱任務的價值方面能夠超越真實世界數(shù)據(jù)。雖然為每個任務設計模擬環(huán)境需要額外的工作，但減少了數(shù)據(jù)收集的人為干預，并避免了復雜的獎勵設計過程，為機器人操縱領域帶來了一種可擴展且高效的解決方案。

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信