亮相2024 GITEX海灣信息技術(shù)博覽會 Soul App多模態(tài)大模型實現(xiàn)超擬人互動體驗

2024年10月18日 14:26:19 來源：Citnews中文科技資訊

　　通過理解自身的行為方式、記憶、偏好等內(nèi)容，復(fù)刻一個專屬于自己的虛擬化身，實現(xiàn)打破次元壁的互動，結(jié)識好友，獲得陪伴......如今，科幻電影中描繪的場景正走向現(xiàn)實。

　　2024年10月14日-18日， GITEX GLOBAL海灣信息技術(shù)博覽會在迪拜舉辦。在這個全球范圍頗具影響力的科技盛會上，新型社交平臺Soul App攜最新自研的多模態(tài)大模型參展，該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性。在活動現(xiàn)場，觀眾可以通過數(shù)字裝置，即時生成3D虛擬數(shù)字分身，通過實時動作捕捉與還原，體驗自然、流暢、沉浸式的多模態(tài)互動。

　　Soul App CTO 陶明表示，“在受全球關(guān)注的科技大會上，我們期待與來自國內(nèi)外的創(chuàng)新企業(yè)、科技公司共同交流，展現(xiàn)中國企業(yè)在社交領(lǐng)域的最新應(yīng)用實踐和數(shù)字娛樂的創(chuàng)新方案，共同探索社交發(fā)展的新可能。”

　　3D數(shù)字孿生，虛擬與現(xiàn)實的創(chuàng)新交互

　　GITEX GLOBAL至今已舉辦至第44屆，自誕生以來，始終聚焦于以技術(shù)為驅(qū)動的創(chuàng)新，吸引了來自大型科技企業(yè)、全球政府、創(chuàng)新初創(chuàng)公司、專業(yè)投資者等的廣泛關(guān)注和參與。目前，GITEX GLOBAL已發(fā)展成為中東地區(qū)規(guī)模最大、最成功的計算機通訊及消費性電子產(chǎn)品展，同時也是全球三大IT展之一。

　　自ChatGPT橫空出世，標志著人工智能發(fā)展至新階段，在世界進入全面擁抱人工智能的新時代的當下，今年，GITEX GLOBAL 2024規(guī)模再次升級，橫跨兩個大型場館 —— 迪拜世界貿(mào)易中心和迪拜港，有全球超過6700家科技巨頭和創(chuàng)新公司參展，展示AI領(lǐng)域最具突破性的科技發(fā)展、智能互聯(lián)新發(fā)現(xiàn)、以及來自數(shù)字娛樂、社交、教育、健康等各大領(lǐng)域的應(yīng)用落地標桿案例，匯聚最前沿的尖端技術(shù)思潮，引領(lǐng)行業(yè)變革的新風(fēng)向。

　　作為國內(nèi)較早將AI引入社交關(guān)系的互聯(lián)網(wǎng)平臺代表之一，Soul 攜最新自研的多模態(tài)大模型參展GITEX GLOBAL 2024，展示AI技術(shù)積累以及在社交場景的最新落地實踐。此次也是Soul首次亮相國際大型展會，大會上，現(xiàn)場觀眾可以重點體驗到Soul集成3D虛擬人能力的多模態(tài)AI交互方案。

　　為了降低用戶社交壓力，Soul自2016年上線之初便不支持用戶上傳真實頭像，年輕人通過平臺提供的捏臉系統(tǒng)，自主創(chuàng)造個性化虛擬形象，在不強調(diào)顏值、地理位置等物理因素的情況下，自在表達，分享熱愛，相遇同好。

　　2022年，Soul集成AI、渲染和圖像處理等技術(shù)，推出自研的NAWA引擎，為用戶創(chuàng)建個性化的3D社交形象和場景提供技術(shù)加持�；谠撘�，用戶可以自主創(chuàng)作生動的虛擬形象，塑造網(wǎng)絡(luò)世界的化身，并能靈活地配合聲音、文字等各種信息，展現(xiàn)每個人鮮明的個性，精準傳遞情緒溫度，在各種虛實融合的場景中與他人自在交流、互動，感受全新的社交體驗。

　　集合過往的技術(shù)儲備以及大模型研發(fā)進展的突破，現(xiàn)階段，Soul 3D虛擬人能力全面升級，形成了成熟的集成3D虛擬人能力的多模態(tài)AI交互方案——即集合文字、語音、動作交互的多模態(tài)大模型方向，實現(xiàn)更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。

　　在大會現(xiàn)場，參與體驗的用戶可以實現(xiàn)高相似度的3D虛擬人的AI建模，通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù)，于幾秒鐘內(nèi)，快速在3D世界精細化還原真實人臉的特征，打造專屬的虛擬化身。

　　同時，基于實時的人體動作識別、數(shù)字還原以及多模態(tài)對話交互能力，現(xiàn)場可以實現(xiàn)3D虛擬人與真人的沉浸式互動。

　　多模態(tài)端到端大模型，超擬人的情感體驗

　　事實上，包括語言、對話、3D虛擬人等維度在內(nèi)，Soul聚焦于多模態(tài)大模型方向持續(xù)深耕。

　　在推出智能推薦引擎“靈犀”、以AI算法助力社交關(guān)系的發(fā)現(xiàn)沉淀環(huán)節(jié)后，2020年，Soul正式啟動對AIGC的技術(shù)研發(fā)工作，系統(tǒng)推進在智能對話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作，并推動AI能力在社交場景的快速落地。

　　目前，Soul已先后上線了自研語言大模型Soul X，以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月，Soul還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型，具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點，能夠直接理解豐富的聲音世界，支持超擬人化的多風(fēng)格語言，實現(xiàn)更接近生活日常的交互對話和“類真人”的情感陪伴體驗。

　　2024年，Soul AI大模型能力整體升級為了多模態(tài)端到端大模型，支持文字對話、語音通話、多語種、多模態(tài)理解、真實擬人等特性。

　　多模態(tài)端到端大模型的推出標志著Soul對人機交互體驗的創(chuàng)新突破，同時，從文字、語音到視覺的模態(tài)升級，也意味著交互方式的顛覆式改變。

　　例如，Soul已基于自研AI能力推出了“數(shù)字分身”功能，用戶可以直接授權(quán)平臺基于聊天記錄、發(fā)帖內(nèi)容，或者以自定義方式，設(shè)置數(shù)字分身的形象和特征，在表征層(形象、聲音、文字風(fēng)格)，身份層(社交關(guān)系、長期記憶、人設(shè)信息)和認知層(決策、觀點、偏好)，使數(shù)字分身達到最大程度復(fù)刻真人的效果。而“數(shù)字分身”不僅能實現(xiàn)更個性化、更千人千面的智能回復(fù)推薦，幫助用戶進行社交破冰，還能在助力人設(shè)搭建和認知決策中，提升社交溝通效率。

　　接下來，通過最新集成的3D虛擬人能力和多模態(tài)端到端大模型的AI交互方案，Soul用戶自主打造的3D虛擬人，可以作為數(shù)字世界的多模態(tài)全能助手，在平臺群聊派對、瞬間廣場等豐富社交場景中全面賦能用戶的關(guān)系發(fā)現(xiàn)、建立、沉淀環(huán)節(jié)，拓展新關(guān)系的同時，提供高質(zhì)量、趣味性、沉浸式的人機交互體驗，反饋真實、自然的情感陪伴。

　　Soul App CTO陶明表示，“作為天然的流量聚集地和交互入口，社交被視為AI率先落地的最佳場景之一。我們將圍繞用戶的實際社交需求和具體社交場景，持續(xù)加大對AI技術(shù)的投入，給用戶帶來長期的可持續(xù)的價值。預(yù)計今年年底，Soul多模態(tài)端到端大模型將再次升級，推出全雙工視頻通話能力，讓用戶可以真正便捷、自然的體驗到包括文字、語音、視覺在內(nèi)的多模態(tài)創(chuàng)新交互。”

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. S026]
分享到微信