據(jù)來自 Cartesia 的最新消息,他們今天發(fā)布了 Sonic,這是他們在構(gòu)建實(shí)時(shí)多模態(tài)智能時(shí)代的第一步。Sonic 是一個(gè)極速的生成語音模型和 API,擁有令人驚嘆的低延遲(僅為135毫秒模型延遲),栩栩如生的聲音效果,目前只支持英文。
Sonic 采用了全新的狀態(tài)空間模型架構(gòu),有效地建模高分辨率數(shù)據(jù),例如音頻和視頻。在語音方面,經(jīng)過參數(shù)匹配和優(yōu)化的 Sonic 模型在與廣泛使用的 Transformer 相同的數(shù)據(jù)集上訓(xùn)練,顯著提高了音頻質(zhì)量,包括降低20% 的困惑度、降低2倍的單詞錯(cuò)誤率以及提高1分的 NISQA 質(zhì)量。
此外,Sonic 具有更低的延遲、更快的推理速度以及更高的吞吐量,為用戶帶來更出色的體驗(yàn)。Cartesia 還提供了 Web Playground 和低延遲 API,用戶可以立即開始體驗(yàn) Sonic 的強(qiáng)大功能。
創(chuàng)始人在斯坦福大學(xué)攻讀博士學(xué)位期間開創(chuàng)了狀態(tài)空間模型,為 Sonic 的研發(fā)奠定了基礎(chǔ)。這種模型是第一個(gè)次線性架構(gòu),可以在語言和音頻等重要模態(tài)上匹配 Transformer,同時(shí)釋放潛在的無限上下文、恒定的狀態(tài)大小和高吞吐量的推理。
Cartesia 表示,他們很期待與社區(qū)一起探討替代架構(gòu),并將很快分享更多信息。如果您也對使智能更快、更便宜、更易獲取感興趣,歡迎通過郵箱 join@cartesia.ai 聯(lián)系他們。
在這個(gè)快速發(fā)展的多模態(tài)智能時(shí)代,Cartesia 的 Sonic 將引領(lǐng)行業(yè),為用戶帶來全新的體驗(yàn)和可能性。立即體驗(yàn) Sonic,探索實(shí)時(shí)多模態(tài)智能的未來!
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。