諾基亞攜手阿聯(lián)酋運營商e&,展示全球首個固網(wǎng)游戲端到端網(wǎng)絡(luò)切片方案零下25℃制熱26℃!海爾水暖通黑科技亮相冰雪大世界三星沒放棄曲面屏開發(fā)!最新專利曝光暗示有望回歸三大運營商11月成績單:用戶數(shù)據(jù)增幅放緩打造下一個英偉達,孫正義的2026芯片計劃曝光瞭望2025全球6G技術(shù)發(fā)展趨勢AI時代云安全新范式,暢捷通智能守護小微企業(yè)安全上云百川智能發(fā)布全鏈路領(lǐng)域增強金融大模型 Baichuan4-Finance年末家電消費觀察:品質(zhì)生活類產(chǎn)品熱賣,將持續(xù)迎來剛需式普及?GPT-5研發(fā)受阻:OpenAI 新一代模型難見突破性進展新一代語言模型ModernBERT發(fā)布,RAG等任務(wù)處理速度快四倍、成本低新研究顯示:Anthropic 的 Claude AI 在合作能力上領(lǐng)先于 OpenAI 和谷歌模型谷歌向投資者保證人工智能本月將迎來“驚人”表現(xiàn)多模態(tài)大模型引爆應(yīng)用場景 階躍星辰完成數(shù)億美元融資星動紀元發(fā)布端到端原生機器人大模型ERA-42 實現(xiàn)機器人復(fù)雜場景操作免費模式強攻下,快手、抖音用“短劇VIP”反擊?低碳存儲助力算力產(chǎn)業(yè) 富士膠片首次亮相IDC大會行業(yè)唯一!海爾熱聲熱泵技術(shù)獲全國顛覆性技術(shù)創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗
  • 首頁 > 云計算頻道 > 大模型

    Soul App語音生成大模型上線,支持擬真人、多語言實時對話互動

    2024年06月18日 11:08:33   來源:中文科技資訊

      和喜歡的虛擬人實時通話是一種什么樣的體驗?

      近日,社交平臺Soul App(以下簡稱“Soul”)語音生成大模型上線,同時自研語音大模型“伶?zhèn)?rdquo;正式升級,現(xiàn)階段,Soul語音大模型“伶?zhèn)?rdquo;包括了語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等,可支持真實音色生成、語音DIY、多語言切換、多情感擬真人實時對話等能力。目前,“伶?zhèn)?rdquo;已應(yīng)用于Soul “AI茍蛋”、站內(nèi)狼人游戲“狼人魅影”AI語音實時互動、獨立新產(chǎn)品“異世界回響”等場景。

      Soul上線于2016年,依托技術(shù)和產(chǎn)品模式創(chuàng)新,平臺持續(xù)推出受用戶歡迎的社交玩法和多元社交場景,例如,多對多語音實時互動場景“群聊派對”、一對一互動場景“語音匹配”等,幫助用戶基于興趣相遇同好,提升關(guān)系發(fā)現(xiàn)的質(zhì)量和效率,沉淀深度社交網(wǎng)絡(luò)。

      一直以來,聲音都是傳遞信息和情感的重要媒介,也最能在溝通中賦予“情緒溫度”和“陪伴感”。在Soul,用戶積極通過語音實時互動,表達自我、分享交流,收獲新關(guān)系,“語音社交”也成為平臺頗具代表性的標簽之一。

      與此同時,作為率先將AI引入社交關(guān)系的平臺,Soul不斷思考如何將AI應(yīng)用于社交具體場景,進一步實現(xiàn)交互效率、交互質(zhì)量、交互體驗、交互對象等多方面的提升和拓展。2020年,Soul系統(tǒng)啟動AIGC的技術(shù)研發(fā)工作,并在智能對話、圖像生成、語音技術(shù)、虛擬人等方面擁有前沿的技術(shù)積累。

      其中,在語音探索方面,Soul基于平臺沉淀豐富且多風(fēng)格的高質(zhì)量公域語音數(shù)據(jù),推出自研語音大模型“伶?zhèn)?rdquo;,在深度融入站內(nèi)“AI茍蛋”等場景提供多模態(tài)互動體驗外,還推出了系列趣味社交玩法和活動。

      如Soul于2023年上線了“Soul次元歌手”活動,幫助每個人打造自己的AI歌手分身,讓很多熱愛音樂但不一定會唱歌的人,也能實現(xiàn)“唱歌自由”;“懶人KTV”活動則在音色克隆的基礎(chǔ)上,創(chuàng)新性實現(xiàn)多人UGC“AI合唱”;谝魳纺P蛡性化的創(chuàng)作能力,平臺的“AI幫你出靈魂專輯“活動,使用戶自由輸入任意作曲的主題關(guān)鍵詞,即可一鍵完成詞曲創(chuàng)作。

      此次,新升級的“伶?zhèn)?rdquo;在訓(xùn)練數(shù)據(jù)規(guī)模和模型架構(gòu)上均實現(xiàn)了拓展和創(chuàng)新,實現(xiàn)了更真實自然、更多樣性和更細顆粒度的控制效果以及流式超低延遲的生成。特別是上線的語音生成大模型在多風(fēng)格多情感可控、超自然人聲生成、多語言切換等方面表現(xiàn)出色。

      具體來說,在多情感可控上,“伶?zhèn)?rdquo;能夠?qū)崿F(xiàn)對情緒的深度理解和模擬,在語音生成和對話中表現(xiàn)出不同情感;在聲音顆粒度上,支持包括吸氣、喘氣、笑聲、結(jié)巴/重復(fù)、咳嗽 、嘆氣、哭聲等一系列副語言語音合成,聲音效果更真實生動。

      值得一提的是,基于新升級的“伶?zhèn)?rdquo;,Soul站內(nèi)應(yīng)用場景中多模態(tài)互動體驗顯著提升,例如狼人游戲“狼人魅影”中AI可實現(xiàn)實時發(fā)言,流暢完成刀人、悍跳等玩法交互。

      此外,獨立新產(chǎn)品“異世界回響”,提供多種場景、風(fēng)格的虛擬人角色,每個虛擬角色具備形象、聲音、人設(shè)對話能力,用戶可與虛擬角色進行沉浸式即時交流。新上線的“語音通話”功能,在“伶?zhèn)?rdquo;支持下,能夠讓用戶體驗與虛擬人實時語音通話效果,延遲時間少于行業(yè)平均水平,更快響應(yīng)用戶互動需求,提供即時的AI交流和陪伴。

      根據(jù)Soul發(fā)布的《2024 Z世代AIGC態(tài)度報告》,三分之一的年輕人表示愿意和AI成為朋友,人機互動已然成為年輕人中的社交新趨勢。大模型應(yīng)用深入人機互動場景,發(fā)力語音、視覺等多維度,無疑將進一步提升用戶社交體驗。

      當(dāng)下,大模型競賽的焦點正從模型參數(shù)延伸至具體應(yīng)用場景。Soul App CTO陶明在接受媒體采訪時表示,“新一輪AI發(fā)展中,關(guān)注場景和交互體驗將會是必然的趨勢。”

      基于對社交場景的深刻理解,Soul將圍繞用戶的實際使用場景和核心社交需求,不斷提升技術(shù)能力,從AI推薦關(guān)系到AI輔助對話,從降低表達門檻到提升互動體驗,推進AIGC技術(shù)與社交場景的深度融合,實現(xiàn)AI原生社交場景創(chuàng)新。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    [No. S026]
    分享到微信

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。