•   如果想要度量國產(chǎn)大模型大小廠商的實力,WAIC(世界人工智能大會)是一個不錯的切口。

      眾所周知,2023年是國產(chǎn)大模型元年,在去年的 WAIC 之后,騰訊發(fā)布混元大模型,字節(jié)跳動上線豆包 APP,而后通過豆包大模型正式開啟對外服務,年輕的月之暗面、MiniMax 等創(chuàng)業(yè)公司形成了「五小虎」的格局,這讓今年的 WAIC 有了更強的指向性:大模型選手們都已走向臺前,給了 AI 行業(yè)更多的機會和答案。

      相比去年,今年最大的變化就是,國內(nèi)參與的互聯(lián)網(wǎng)科技公司更多了。

      除了老面孔騰訊、阿里、百度和螞蟻之外,今年的互聯(lián)網(wǎng)新面孔,包括 B 站和最近通過視頻大模型可靈走紅網(wǎng)絡的快手,也包括「五小虎」中的智譜AI和百川智能,甚至還有號稱要改變「五小虎」為「六小強」的階躍星辰。

      當然,沒有出現(xiàn)的重要公司也不少,比如在大模型領域飛速進化的字節(jié)跳動和月之暗面等。

      往年 WAIC 上廠商們比的是有無大模型,如今比的是大模型落地能力。所以,從時間的發(fā)展周期上來說,WAIC 已經(jīng)有了國產(chǎn)大模型度量衡的意味,一系列國產(chǎn)大模型產(chǎn)品和落地應用進行公開展示,未來更加可期。

      7月的 WAIC 結束后,國產(chǎn)大模型廠商將會密集發(fā)布一系列多模態(tài)大模型,行業(yè)進化的速度將進一步加快,比如 MiniMax 就在 WAIC 上透露,將在下個月發(fā)布 AI 視頻生成產(chǎn)品。

      1

      騰訊猛提速,阿里拼落地

      阿里一直是 WAIC 的重要一員。曾幾何時,大模型尚未成為行業(yè)發(fā)展的共識,馬斯克和馬云就曾在 WAIC 上對人工智能的話題產(chǎn)生分歧。馬云認為,人類無法創(chuàng)造出比自己聰明的生物;而馬斯克對這一論斷明確表示反對。

      而今年 WAIC 上,負責傳遞阿里聲音的人是阿里云創(chuàng)始人王堅。

      王堅認為,在算法和數(shù)據(jù)等條件下,人工智能對大公司會友好一點,但是友好并不意味著寬容,一定會有新的大公司出現(xiàn),也一定會讓現(xiàn)在的大公司浴火重生。而大小企業(yè)的差別在于,大企業(yè)會覺得 AI 是工具的革命,小企業(yè)一定會覺得這是革命的工具,「大企業(yè)也要意識到這是革命的工具,那這個變化就來了!

      阿里如今是中國大模型背后的重要推手,最廣為人知的標簽,就是投資了5家大模型公司,把月之暗面、MiniMax、智譜 AI 、百川智能和零一萬物這5個獨角獸通通納入版圖之中。

      而今年的 WAIC 上,阿里也成了現(xiàn)場火爆的體驗打卡點。

      阿里不光展示了國內(nèi)用戶規(guī)模第一的智能編碼助手「通義靈碼」,更是通過「通義十二時辰——體驗 AI 助手陪伴的一天」,全方位通義千問大模型背后的對話、效率、智能體、視覺四大核心能力,讓用戶感知 AI 助手在生活、學習和工作中的實際作用。

      此外,釘釘和支付寶也是阿里 AI 能力落地上的重要一面。釘釘通過「未來生產(chǎn)力」論壇,展示了釘釘在智能組織構建,以及 AI 在實際生產(chǎn)工作場景中的創(chuàng)新應用案例;支付寶的 AI 能力則通過支付寶智能助理、AI 金融助理和 AI 就醫(yī)助理觸達用戶的生活場景。

      相比阿里在 WAIC 場館內(nèi)的互動感,騰訊展示的更多則是場外發(fā)聲和產(chǎn)品進化。

      自5月30日騰訊正式上線混元大模型 APP 元寶以來,騰訊在大模型的推廣和進化速度一直在提升。尤其是最近騰訊云與智慧產(chǎn)業(yè)事業(yè)群 CEO 湯道生的采訪中談到,騰訊對大模型并不是不著急,他跟馬化騰在針對大模型技術變革的企業(yè)微信群聊中,經(jīng)常討論最新前沿并跟進業(yè)務進展。

      「我們從技術長期布局投入,轉(zhuǎn)到產(chǎn)品的市場去進攻!箿郎J為,騰訊也不算在大模型上慢了一步,不是什么都唯快不破,過去半年騰訊在大模型上的新產(chǎn)品、新版本發(fā)布的頻率越來越高,是因為騰訊的風格一貫是持續(xù)打磨產(chǎn)品,不斷改善體驗,隨著市場慢慢成型,用戶需求更明確、清晰,騰訊也會加快步伐。

      事實上,元寶 APP 發(fā)布不到一個月,就已經(jīng)更新了五六版。

      根據(jù)騰訊混元大模型負責人劉煜宏最新透露,到目前為止,騰訊內(nèi)部有接近700個業(yè)務接入混元,包括騰訊會議、文檔,微信讀書的 AI 助手等,基本上騰訊所有的(業(yè)務)都用,內(nèi)部調(diào)用量大概將近3億次。

      相比較湯道生的態(tài)度,劉煜宏承認,去年混元大模型發(fā)布節(jié)奏慢,一部分原因是因為投了很多資源先服務好內(nèi)部的「客戶」,因為騰訊做事情,「對外開放前一定要先在內(nèi)部打磨好,自己的狗糧自己先消化」。

      更重要的一點是,劉煜宏談及了騰訊在大模型上的思考變化。騰訊最初做混元大模型的邏輯,并沒有想要做 toC 的產(chǎn)品,而是把基礎模型打磨好,服務內(nèi)部需求,后來不斷調(diào)整方向,推出「混元模型助手」到后來的獨立 APP,就是因為「不探索原生 AI 大模型應用,不知道怎么跟業(yè)務更好合作」。

      是否 toC 這個大模型的邏輯起點,也是騰訊和字節(jié)最大的不同。字節(jié)的大模型能力最先就是通過豆包 APP 進行探索,最后用豆包成為大模型的名字開啟對外服務。如今,混元大模型和豆包大模型走到了應用層競爭的同樣邏輯,最大的變量就是騰訊的追趕速度。

      2

      中廠的焦慮

      今年的 WAIC上,相比騰訊、阿里這樣的大廠用大模型服務內(nèi)部業(yè)務生態(tài),Minimax、智譜 AI 這些大模型創(chuàng)業(yè)公司算是第一次登場,他們更焦慮于如何站穩(wěn)腳跟后茁壯成長。

      比如,展臺緊靠阿里的階躍星辰,就在 WAIC上發(fā)布了三個大模型,其中包括 Step-2:萬億參數(shù)的 MoE 模型,目前還需要申請才能體驗;Step-1.5V:千億參數(shù)多模態(tài)模型,除了圖片理解能力提升外,也支持視頻理解;Step-1X:圖像生成模型,DiT 架構,600M、2B、8B 三種不同的參數(shù)量,對中國文化和元素進行了優(yōu)化。

      階躍星辰的創(chuàng)辦人是微軟前全球副總裁姜大昕,正在進行一輪估值20億美元的新融資,據(jù)傳阿里也將參與階躍星辰的這次融資。階躍星辰入場雖晚,但極力想擠入「大模型五小虎」的戰(zhàn)隊中,在營銷上試圖把格局改變?yōu)椤噶姟埂?/p>

      但卷模型還有出路嗎?

      正如百度創(chuàng)始人李彥宏在 WAIC 上所說,去年的百模大戰(zhàn)造成了社會資源的巨大浪費,尤其是算力浪費,但同時也使得中國追趕世界上最先進基礎模型的能力得到了建立。李彥宏呼吁行業(yè)不要卷模型,要去卷應用,「沒有應用,光有一個基礎模型,不管是開源還是閉源都一文不值」。

      應用走在模型前面這一點上,快手可能是階躍星辰的范例。

      快手也是今年 WAIC 上的新面孔,也將在 WAIC 上發(fā)布快手大模型和新產(chǎn)品,但其著力點更具有落地屬性,重點是通過大模型打開商業(yè)化的空間,以及通過視頻生成技術給短視頻行業(yè)注入新生機。目前,快手大模型家族包括1750億參數(shù)規(guī)模的通用大語言模型「快意」、文生圖大模型產(chǎn)品「可圖」和視頻生成大模型「可靈」。

      此前《快手可靈,把壓力給到了抖音剪映》已經(jīng)提及,通過海外社交媒體的病毒式傳播,在文生視頻領域上,快手「可靈」比肩 Sora ,成為國產(chǎn)大模型中最先「交卷」的一家,雖然目前國內(nèi)市場尚無對手,但更多的競爭對手正在趕來的路上。

      而就在6月底,快手「可靈」更進一步,在文生視頻的基礎上,拓展到了圖生視頻領域,用戶只需要上傳圖片,就可以使可靈對圖像進行理解,賦予其5秒鮮活的生命力。同時,可靈還推出了視頻續(xù)寫功能,用戶可以在已生成視頻的基礎上延續(xù)生成內(nèi)容,能夠最長生產(chǎn)約3分鐘的連貫視頻。

    圖片

      近期在微博等社交媒體上,已經(jīng)流行起來通過快手可靈大模型進行視頻創(chuàng)作,尤其是甄嬛吃漢堡、還珠格格喝可樂等一系列惡搞《甄嬛傳》《西游記》《還珠格格》等經(jīng)典作品的短視頻,都是通過可靈制作的。截至目前,快手可靈注冊申請用戶數(shù)已經(jīng)超過了54萬。

      但遺憾的是,快手大模型產(chǎn)品在 C 端市場引發(fā)的熱度,沒有反應到資本市場中,從6月6日可靈發(fā)布測試至今,快手的股價一直處于緩慢下跌趨勢中,跌幅達到15%。

      3

      人形機器人是 AI 終極形態(tài)?

      人形機器人已經(jīng)成為 AI 從數(shù)字世界落地到現(xiàn)實物理世界的香餑餑。

      今年 WAIC 上展出了45款智能機器人,其中有25款是人形機器人。尤其是大模型的加持下,有了大模型能力的人形機器人,相當于擁有了自主決策和分解任務能力的大腦。

      特斯拉一直是 WAIC 的常客,而除了 Cybertruck 汽車和 FSD(全自動駕駛),今年特斯拉拿出來的最吸引人的產(chǎn)品就是二代人形機器人 Optimus。

      2021年8月,特斯拉發(fā)布了 Optimus 第一款智能機器人,搭載了特斯拉自主研發(fā)的神經(jīng)網(wǎng)絡和計算機視覺技術。2023年12月,特斯拉公開了二代 Optimus(擎天柱)機器人,相比一代更靈活,能用手拿雞蛋,識別物體,還能走路。

      人形機器人的難度在于量產(chǎn)通用,特斯拉預計明年開始限量生產(chǎn),將有超過1000個 Optimus 在特斯拉工廠幫助人類完成生產(chǎn)任務。馬斯克預計,人形機器人將成為工業(yè)主力,數(shù)量有望超越人類,預計達到100-200億。

      特斯拉面對的挑戰(zhàn)很大,因為其目標是年產(chǎn)10億臺,占據(jù)市場10% 以上份額。要實現(xiàn)這一目標必然要讓機器人的成本降低,控制在1萬美元左右,售價預計2萬美元,這將為特斯拉帶來25-30萬億的市場。

      而最能跟特斯拉二代人形機器人 Optimus 產(chǎn)生對標的,是杭州的宇樹科技在今年5月發(fā)布的第二款通用人形機器人G1,其標準版售價9.9萬元,這個價格遠低于特斯拉的 Optimus,這凸顯出國內(nèi)人形機器人的「降本」優(yōu)勢。

      在宇樹科技5個月前最新一輪融資中,投資方包括美團、源碼資本等。更重要的是,在機器人展示中,G1機器人可以模擬人手的精準操控能力,不光能實現(xiàn)搬運重物等常規(guī)操作,還能實現(xiàn)汽水瓶開啟、焊接等精細化工作。

      相比于特斯拉人形機器人的團隊,宇樹科技的團隊更加年輕,創(chuàng)始人王興興是一位90后的年輕創(chuàng)造者。而特斯拉則是當初從 OpenAI 挖來的深度學習專家安德烈·卡帕斯,統(tǒng)領特斯拉的自動駕駛工程師團隊和人形機器人的開發(fā)。

      馬斯克和王興興瞄準的都是通用人形機器人,這是一個百億美元級別的市場。馬斯克認為,擎天柱機器人是將特斯拉轉(zhuǎn)變?yōu)閮r值10萬億美元企業(yè)的關鍵,甚至人形機器人的潛力比特斯拉的電動汽車業(yè)務更重要。

      而英偉達最新的財報也顯示,其未來發(fā)展的戰(zhàn)略三大方向,其中之一就是 AI 應用,確立以智能汽車、人形機器人、工業(yè)數(shù)字化和醫(yī)學 AI 為未來增長曲線。

      但通用人形機器人還有很長的進化成熟之路。此前王興興在采訪中表示,目前大家做的事情很簡單,就是把 AI 技術拿過來給機器人用,「目前 AI 跟機器人結合的技術臨界點還沒到,可能整個技術方案還沒跑通」。

      究其根本,挑戰(zhàn)就在于如何用大模型讓人形機器人的行動系統(tǒng)智能化,也就是讓機器人的大腦足夠成熟,確?煽啃院蜏蚀_度。而一旦人工智能真正邁入通用人工智能階段,人形機器人成為 AI 應用的終極形態(tài)之一的夢想才會成真,人機共生的時代才會到來。

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費品展覽會(IFA2024)隆重舉辦。憑借在核心技術、產(chǎn)品設計及應用方面的創(chuàng)新變革,全球領先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強大影響力。

    新聞

    敢闖技術無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術和新品亮相,以敢為精神勇闖技術無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導,由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。