今年 8 月,Meta 公司推出了其多模態(tài)人工智能翻譯模型 SeamlessM4T,該模型支持近 100 種語言的文本和 36 種語言的語音,F(xiàn)在該模型更新了“v2”架構(gòu),Meta 將其稱之為“Seamless Communication(無縫溝通)”模型,能夠讓對(duì)話翻譯更加自然和富有表現(xiàn)力。
兩個(gè)新功能中的第一個(gè)是“SeamlessExpressive”,顧名思義,該功能可以將你的語氣轉(zhuǎn)移到翻譯后的語音中,包括音調(diào)、音量、情感色彩(興奮、悲傷或低語)、語速和停頓?紤]到目前翻譯后的語音一般聽起來都很機(jī)械,這一突破還是非常值得期待的,無論是在我們的日常生活中還是在內(nèi)容制作中,都有很大的幫助。目前其支持的語言包括英語、西班牙語、德語、法語、意大利語和中文,不過在IT之家撰寫本文時(shí),演示頁面缺少意大利語和中文。
第二個(gè)功能是“SeamlessStreaming”,可以在說話者仍在講話時(shí)開始翻譯,從而讓其他人更快地聽到翻譯。雖然仍有不到兩秒鐘的短暫延遲,但至少不必等到對(duì)方說完一個(gè)句子。據(jù) Meta 公司稱,最大的挑戰(zhàn)在于不同語言有不同的句子結(jié)構(gòu),因此他們必須開發(fā)一個(gè)專門的算法來研究部分音頻輸入,以決定是否有足夠的上下文開始生成翻譯輸出,或者是否繼續(xù)傾聽。
目前 Meta 還沒有透露公眾何時(shí)能夠使用這些新功能,但可以期待未來 Meta 將它們集成到其智能眼鏡中,使其更加實(shí)用。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。