下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領先:本田、日產、三菱合并也沒戲消委會吹風機品質檢測結果揭曉 徠芬獨占鰲頭 共話新質營銷力,2024梅花數據峰會圓滿落幕索尼影像專業(yè)服務 PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產,后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領航智駕功能開啟內測雷神預告2025年首次出席CES 將發(fā)布三款不同技術原理智能眼鏡realme真我全球首發(fā)聯發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設計預售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設備在海外,要再造一個京東物流?消息稱蘋果正為AirPods開發(fā)多項健康功能,包括心率監(jiān)測和溫度感應一加 Ace 5系列將搭載全新游戲助手:大幅提升游戲體驗東芝全部業(yè)務實現盈利,退市裁員重組后終于賺錢
  • 首頁 > 云計算頻道 > 大模型

    音視頻新紀元:AIGC如何顛覆傳統(tǒng)?

    2023年09月20日 11:04:55   來源:微信公眾號科技新知

      本文來自于微信公眾號 科技新知(ID:kejixinzhi),作者丨樟稻編輯丨伊頁。

      AIGC改寫音視頻規(guī)則。

      在過去的三年中,我們見證了人類日常生活和工作方式的顛覆性變革。從短視頻、互動直播到在線教育和云上會議,音視頻技術不僅滲透到各個角落,而且已經深入地影響了各行各業(yè)的運作方式。

      得益于此,音視頻領域正向著超高清、低延時和強互動的方向飛速進化。這恰恰與騰訊“全真互聯”理念方向不謀而合——即借助各種終端和交互方式,實現對真實世界的深入感知、緊密連接,并與其進行有效交互,旨在創(chuàng)造一個數字與現實相融合的全新模式。

      不難看出,音視頻行業(yè)正在為全真互聯時代的到來做著充分的技術準備。

      AIGC恰恰成為這一進程中的核心驅動力。近兩年,AI大模型在生成式AI和互動式AI的應用上呈現出爆炸性增長,特別是在音視頻領域。隨著這種增長,用戶對于音視頻的體驗期望也隨之升高,這無疑促進了技術的快速進步。

      2023年9月7日,騰訊舉辦了全球數字生態(tài)大會。騰訊云副總裁李郁韜分享道:“隨著AI大模型的加速應用,越來越多企業(yè)在數字化轉型過程中對音視頻通信技術產生極大需求,音視頻行業(yè)呈現出智能化、全球化、數實融合的發(fā)展趨勢。”

      為了積極響應這一趨勢,騰訊云音視頻正全力以赴推動音視頻融合AI技術的創(chuàng)新突破,深入挖掘行業(yè)大模型應用的潛能,并與合作伙伴緊密聯手,共同確保音視頻技術加速智能蝶變。

      01

      音視頻進入AIGC時代

      1872年的某一天,斯坦福與其友人科恩為了賽馬奔跑是否四蹄同時懸空展開了激烈的討論。為了解開這一謎題,斯坦福找到了一位科學家通過連續(xù)攝影技術進行驗證,并由此創(chuàng)造了人類歷史上第一個“視頻”。

      此后,1877年,愛迪生在其“圓筒留聲機”上錄制了《瑪麗有只小羊羔》的幾秒鐘歌詞,標志著人類歷史上的第一條音頻記錄。從此,人類步入了音視頻的新紀元。

      在音視頻技術初創(chuàng)時期,受限于膠片和磁帶的存儲能力,這樣的方式既不經久又不便攜。但到了20世紀70-80年代,隨著數字化錄音和攝像技術逐步完善,音樂和電影產業(yè)都開始擁抱這一新技術,這引領了一場音視頻技術的創(chuàng)新潮流。

      隨后90年代的個人計算機出現,21世紀的3G/4G,乃至5G和通信技術發(fā)展,都使音視頻技術得到了空前的推動。

      特別是5G的快速商業(yè)化和疫情期間線上線下結合的生活模式,中國的音視頻行業(yè)正向更廣泛的產業(yè)化趨勢發(fā)展,為各種場景提供內容展示、互動通信和實時音視頻的綜合解決方案。

      基于此,沙利文對中國音視頻行業(yè)的分析顯示,看向未來,這一行業(yè)將主要集中在實時渲染、智能協(xié)作、企業(yè)媒體應用等新的應用領域。預計這將為行業(yè)帶來新的數字化音視頻應用的增長潛力。據估算,到2026年,中國音視頻行業(yè)的市場規(guī)模將達到2,321.4億元。

      觀察上述音視頻技術的連續(xù)進化,基本可以斷言,音視頻的進一步發(fā)展與創(chuàng)新,將緊密依賴于音視頻技術的前沿突破。

      眼下呼聲最高的是人工智能技術。實際上,從早期開始,音視頻行業(yè)便逐漸融合了AI技術,這不只是提升了內容制作的效率,更引領了一系列創(chuàng)新的互動體驗與玩法。

      以視頻剪輯為例,與傳統(tǒng)的人工剪輯相比,通過算法和學習,AI能夠為視頻素材實現“智能增強”。這種“智能增強”是利用AI技術對視頻圖像進行降噪、色彩優(yōu)化和細節(jié)改進,從而提升觀眾的觀看體驗。

      在這個方面,騰訊云媒體處理 MPS有著獨特的技術優(yōu)勢, 從轉碼方面來看,騰訊云音視頻是最早一批嘗試 AI 智能編碼的團隊。極速高清轉碼通過深度學習的方法,對視頻的場景進行智能分類,之后會根據場景分類實時識別結果,結合視頻源碼率、幀率、分辨率、紋理和運動變化幅度等情況,以及綜合機器負載和畫質效果等維度,選擇最優(yōu)編碼參數,做到實時動態(tài)的選擇最合適的編碼參數,在不影響畫質的情況下達到最優(yōu)的壓縮效果。

      同時針對源視頻質量不佳的場景,騰訊云媒體處理還支持音視頻修復增強等相關能力,通過對視頻進行自適應質量分析、多退化數據生成方案和多幀特征對齊融合的算法模型,大幅提升視頻清晰度和色彩豐富度,致力于為用戶打造超高清、沉浸式的音視頻體驗。

      除此之外,騰訊云媒體處理還提供的智能識別、智能分析、智能質檢、智能審核等相關處理能力,能夠借助 AI 算法對視頻內容進行分析,并自動提取出視頻標簽、分類、語音、文字、等信息,自動檢測視頻內容客觀質量及內容安全特征,相較于傳統(tǒng)媒資管理及運營方式來說,能夠極大提升媒體運營管理效率,在保證內容質量及安全的前提下對內容進行更好的推薦及分發(fā)。

      可以說,AI在音視頻領域已經是一個長久并持續(xù)受到關注的話題。然而,最近AIGC——也就是AI生成內容,再次引起了公眾的廣泛關注。AIGC利用人工智能技術自動生成各種內容,代表了一種新的內容創(chuàng)作方式。

      在內容類型上,AIGC涵蓋了文本、音頻、圖像、視頻、代碼以及多模態(tài)等多種內容形式。據紅杉資本去年9月的估計,AIGC的實際應用推進順序為:文本和代碼領先,其次是圖像,然后是視頻、3D和游戲。

      但技術進步的步伐通常令人震驚。在短短幾個月時間里,除了文字應用,圖像和視頻等應用已經取得了驚人的成果。譬如,通過生成式AI技術創(chuàng)建數字人視頻、使用多種AI模型來創(chuàng)作和編輯圖片、視頻等等,這種應用已經變得日益普及,并獲得了眾多投資者的關注。

      業(yè)界專家預測,AIGC可能會成為音視頻行業(yè)的關鍵技術。通過對音視頻數據的智能分析和加工,它有望實現更高的效率和優(yōu)化用戶體驗,隨著AIGC技術的不斷完善,音視頻領域有望迎來一次深刻的革命。

      02

      騰訊云音視頻的智能演繹法

      觀察技術演進的歷程,明顯可見每一次技術創(chuàng)新都伴隨著產業(yè)的投資潛力。那些能夠預見未來的企業(yè)往往能從中獲得豐厚的回報,而那些遲來的企業(yè)往往只能被時代的浪潮所推動。

      騰訊云音視頻,作為音視頻技術行業(yè)的佼佼者,在今年IDC發(fā)布的《中國視頻云市場跟蹤》報告中,連續(xù)五年穩(wěn)坐市場份額的首位,這不僅展示了其在行業(yè)中的卓越實力,同時也彰顯了騰訊云音視頻對技術趨勢的敏銳洞察和掌控力。

      在AIGC時代,騰訊云音視頻通過對大模型和行業(yè)模型的深入理解與應用,正帶領音視頻產品走向更高層次的智能化,為多個行業(yè)場景提供強大的音視頻技術支持。

      作為擁有音視頻領域最全產品解決方案的服務商,騰訊云音視頻在本次騰訊數字生態(tài)大會對旗下產品進行了全面的智能化升級,包括即時通信IM、騰訊云聯絡中心TCCC、騰訊云媒體處理MPS以及騰訊云音視頻終端開發(fā)套件等,這些更新將為用戶提供了更加智能化的音視頻體驗。

      先看即時通信IM,其設計初衷是幫助企業(yè)的APP或網站輕松集成聊天、會話、群組以及關系鏈管理功能。這種通信方式在社交、直播、客服和電商等多種場景中都已被廣泛應用。眼下,新一代的大語言模型,憑借其卓越的對話交流功能,與即時通信場景形成了天然的融合,為IM與AI的結合創(chuàng)造了無盡的可能性。

      騰訊云即時通信IM作為全球領先的通信云服務,也看到了AI在即時通信場景的巨大潛力,快速發(fā)布了相關AI能力調用接口,推出了Chatbot聊天機器人和人工客服插件。這些插件能幫助企業(yè)輕松實現機器人初步的寒暄、FAQ問答以及后續(xù)的人工客服轉接。而且,騰訊云IM還提供了即開即用的客服工作臺,使得企業(yè)可以無需開發(fā)就直接使用,進而在其網站、APP、公眾號以及小程序等各種平臺上快速集成客服功能。

      此外,開發(fā)者還可以基于騰訊云IM所提供的通信基礎設施,靈活地調用業(yè)界領先的大模型功能,從而依托AI的強大能力來實現場景創(chuàng)新,提高效率。

      另一個更新是兼容IM的騰訊云聯絡中心TCCC,作為一個協(xié)助各企業(yè)迅速構建整合了電話、在線交流和音視頻通話的全面通訊客戶接觸平臺。通過引入AI大模型的卓越計算力,該產品提高了智能客服的整體效能:直接響應率由15%躍升至35%,而準確性也由5%上升到了15%。這種技術進步直接導致了人工運營的成本降低,節(jié)省了超過90%的人力資源投入。

      更為重要的是,TCCC不僅提供基于騰訊獨家研發(fā)的混元大模型,為企業(yè)快速部署高效的大模型智能方案,還允許企業(yè)接入自主研發(fā),針對特定業(yè)務需求的大模型機器人,以滿足個性化的需求。

      而在超高清和沉浸式體驗方面,騰訊云媒體處理MPS也在此次大會發(fā)布了面向智能化的進一步升級。結合當前的AI大模型,騰訊云媒體處理MPS對視頻和音頻增強方面都進行了提升,旨在為用戶帶來最佳的音視頻體驗。

      為了給直播場景帶來更有趣味的AI互動體驗,騰訊云媒體處理MPS深度融合了云渲染與AIGC,為企業(yè)提供更加便捷的云端渲染互動及AIGC的相關能力,比如,現在可以基于AIGC支持直播間生成禮物和彈幕特效,這無疑為直播互動添加了更多新的玩法。

      騰訊云視立方終端開發(fā)套件此次也面向全行業(yè)推出TUICallKit和TUIRoomKit兩款音視頻低代碼TUIKits方案,升級后的智能開發(fā)套件能幫助企縮減高達90%的開發(fā)時間。同時,騰訊云視立方終端開發(fā)套件還集成了互動直播、短視頻制作、視頻播放、美顏特效等多種終端能力于一體,開發(fā)者僅需一次集成SDK即可實現所有音視頻終端能力,更加便捷與智能。

      03

      AI之觸:技術溫度,人性紐帶

      在科技領域,技術本身往往顯得冷冰冰、蒼白無力,但當它與真實的應用案例相結合,充分發(fā)揮其潛在價值時,便具有了強大的說服力和影響力。

      在日前舉辦的蒙牛全球合作伙伴答謝會上,蒙牛健康營養(yǎng)師「蒙蒙」作為行業(yè)內首個可交互AI「智能營養(yǎng)健康專家」,將基于蒙!竁OW 健康 +」小程序為消費者帶來多場景、多功能的健康服務,實現更立體、更有溫度的情感交互體驗。

      在蒙!竁OW 健康 +」小程序上,騰訊云音視頻基于自身在通信CPaaS領域的多年積淀,通過即時通信IM與云聯絡中心TCCC聯合打造的 IM 客服插件,采用業(yè)界領先的即時通信IM+在線客服+用戶自建AI模型模式,充分整合營養(yǎng)健康領域模型MENGNIU.GPT與騰訊云音視頻優(yōu)質的IM+在線客服的組合能力,助力蒙牛打造智能營養(yǎng)健康服務體系,以場景式健康顧問更好地連接消費者。也讓人工智能技術與行業(yè)場景實現深度融合,推動乳制品行業(yè)數字化創(chuàng)新。

      除了在消費領域提供音視頻服務外,騰訊云音視頻已經為醫(yī)療、金融、教育、娛樂、工業(yè)等諸多領域提供了超低延時、超高清、沉浸式的音視頻解決方案。

      以醫(yī)療領域為例,以往該行業(yè)存在一些客觀的核心痛點。

      譬如,問診的資源分配問題,一個顯著的現象:醫(yī)療資源的供應與需求之間存在巨大鴻溝。特別是在一些邊緣和下沉地區(qū),優(yōu)質的醫(yī)療資源幾乎成了稀缺商品。同時,大型或知名的醫(yī)院經常面臨患者過多的困境,這對于突發(fā)疾病的患者來說可能是致命的,因為長時間的路途和等待可能導致病情進一步加重。

      此外,會診的效率亦是挑戰(zhàn),跨區(qū)域的會診除了物理距離導致的時間成本之外,還存在與會診相關的其他難題。比如,多位醫(yī)學專家想要同步進行現場會診,如何進行日程匹配和有效排期就成為了一大考驗。

      這些挑戰(zhàn)需要行業(yè)的共同努力和創(chuàng)新思維來解決,以期為所有患者和醫(yī)療工作者提供更為優(yōu)質和高效的服務體驗。針對這些,騰訊云音視頻解決方案為醫(yī)療行業(yè)的數字化升級注入新的活力。

      在醫(yī)患問診的場景下,多家互聯網醫(yī)院正借助騰訊推出的先進技術工具——騰訊云視立方終端開發(fā)套件TUICallkit,迅速實現了線上問診服務的開展。這種技術應用為患者提供了安全、便捷的醫(yī)療咨詢方式。

      與此同時,針對多科室會診中經常面臨的異地溝通問題,全國眾多頂級三甲醫(yī)院已經開始采納騰訊云視立方終端開發(fā)套件TUIRoomkit。通過此套件,醫(yī)院能夠更加便捷地實現多科室、異地之間的專家會診,大大提高醫(yī)療團隊的協(xié)同效率。

      基于終端開發(fā)套件及底層實時音視頻TRTC超低延遲網絡的完美配合,讓每一次醫(yī)療問診都真實展現在眼前,細到患者的每一根血管都可以放大檢查,讓從前高質量稀缺的醫(yī)療資源也流動進了邊遠基層地帶,享受科技發(fā)展帶來的溫暖和善意。

      騰訊云音視頻,通過AI展現了技術的魅力,更進一步體現了技術與人性之間的緊密聯系,讓人感受到技術背后的溫度。

      04

      寫在最后

      從QQ的初代時光起,騰訊已經在網絡及音視頻通信領域深耕了20多年。至今,其覆蓋了國內音視頻領域中的90%客戶,其視頻云解決方案的市場份額更是無可爭議地領跑于行業(yè)之首。

      而現在,隨著AIGC技術的不斷迭代,騰訊云音視頻正在進一步擴展其產品和服務系列,目標是滿足廣大用戶更為豐富的應用需求。未來,騰訊云音視頻矢志于為客戶打造低延遲、清晰度極高的音視頻體驗,旨在推動一個真正互聯互通的未來,并助力實體經濟持續(xù)創(chuàng)新和蓬勃成長。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。