Cutie是一種用于自動識別和追蹤視頻中特定物體的技術。它具有高級的對象理解能力,可以識別整個物體的形狀和特性,而不僅僅是像素級的信息。同時,它還能夠精確地將目標物體從背景物體中分離出來。
無論在復雜場景中還是在有多個物體和復雜背景的視頻中,Cutie都可以準確地進行對象分割。雖然功能強大,但它的運行速度也相當快,適用于需要實時處理的應用場景。
Cutie的工作原理如下:首先,在視頻的第一幀中,Cutie會找到并記住你想跟蹤的物體的位置和形狀。然后,它會存儲物體的詳細像素信息,就像給物體拍了一張身份證照片。
當視頻繼續(xù)播放時,Cutie會使用之前記住的信息快速找到物體,并用存儲的詳細信息來精確確認物體的位置和形狀。Cutie同時使用粗略特征和詳細信息,所以它能在視頻中快速而準確地找到并跟蹤物體。這樣,無論物體如何移動或變化,Cutie都能準確地追蹤它,這在安全監(jiān)控、自動駕駛車輛或醫(yī)學研究等領域非常有用。
Cutie主要采用了對象級別的內存讀取能力。與傳統(tǒng)的像素級內存讀取方法不同,Cutie使用一種自上而下的對象級內存讀取方式,這可以提高在復雜數(shù)據(jù)集上的性能。Cutie使用對象變換器與底層像素特征進行交互,這些對象變換器作為目標對象的高級摘要,而高分辨率的特征圖用于精確的分割。
此外,Cutie還引入了前景-背景掩碼注意力機制,使得部分對象查詢只關注前景,其余部分只關注背景,從而更清晰地分離前景對象和背景的語義。除了像素內存外,Cutie還引入了一個緊湊的對象內存,用于總結目標對象的特征,從而實現(xiàn)了目標對象的有效長期表示。
在實際評估中,使用MOSE標準測試,Cutie的性能比XMem方法提高了8.7分。與DeAOT方法相比,Cutie獲得了4.2分的高分,并且處理速度比DeAOT快三倍。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。