中科聞歌發(fā)布“智川”企業(yè)智能體平臺1.0、“優(yōu)雅”音視頻大模型平臺1.5,領(lǐng)先技術(shù)加速AI普惠落地這個周末,在最懂開發(fā)者的城市邂逅最懂開發(fā)者的算力平臺DDN推出 Infinia 2.0對象存儲 加速AI數(shù)據(jù)處理速度全部免費!百度文心智能體平臺已全面接入DeepSeek模型燈塔云系統(tǒng):開啟勞務(wù)派遣管理4.0時代超2671萬名消費者申請手機(jī)等數(shù)碼產(chǎn)品購新補貼 用國補買手機(jī)上京東皇家馬德里對陣赫羅納:不乏進(jìn)球與高水平競技的足球現(xiàn)場OpenAI宣布面向多個國家推出AI代理 Operator扣子Coze宣布獨家支持 DeepSeek Function Calling 工具調(diào)用能力小紅書將接入DeepSeek AI 搜索產(chǎn)品“點點” 內(nèi)測深度思考功能騰訊元寶「混元+DeepSeek」雙模聚合 推出「圖像理解」技能蘋果死磕廉價牌Clone公司推出首款“類人機(jī)器人”Protoclone 擁有肌肉和骨骼結(jié)構(gòu)微軟為OpenAI即將推出的 GPT-4.5和 GPT-5模型積極準(zhǔn)備服務(wù)器容量國際星閃聯(lián)盟會議在京召開,為星閃2.0標(biāo)準(zhǔn)完成打下基礎(chǔ)Telstra攜手愛立信進(jìn)行亞太首個5G-A高性能可編程網(wǎng)絡(luò)部署阿里通義萬相宣布即將開源視頻生成模型WanX2.1DeepSeek賦能Vixtel飛思達(dá)CloudFox可觀測性平臺,打破可觀測性工程的實施壁壘《和平精英》手游宣布正式接入DeepSeekREDMI K80至尊版曝光:電池超7000mAh 紅米史上最大
  • 首頁 > 產(chǎn)經(jīng)新聞頻道 > 業(yè)界新聞

    官宣!阿里巴巴確定與蘋果合作,為中國iPhone提供AI

    2025年02月14日 09:32:33   來源:​AIGC開放社區(qū)公眾號

      今天凌晨,路透社消息,阿里巴巴確定與蘋果合作,為中國iPhone提供AI服務(wù)。

      同時,阿里巴巴集團(tuán)董事會主席蔡崇信,在迪拜舉行的世界政府峰會上,也親口確定了該消息。阿里巴巴股票大漲8%,創(chuàng)三年以來新高。

      蔡崇信表示,由于監(jiān)管等問題,蘋果需要尋找一個中國本土的科技企業(yè)進(jìn)行合作,為其手機(jī)提供服務(wù)。蘋果一直非常謹(jǐn)慎、嚴(yán)格,他們與中國的多家科技公司進(jìn)行了談判,最終選擇了我們。

      此前,蘋果曾找過百度以及爆火的DeepSeek,但由于技術(shù)等原因最終放棄轉(zhuǎn)向阿里巴巴。

      阿里巴巴作為國內(nèi)最大互聯(lián)網(wǎng)公司之一,在云計算、大數(shù)據(jù)、AI等領(lǐng)域有著深厚的積累和技術(shù)優(yōu)勢。其自研的Qwen系列多模態(tài)大模型,是全球下載和使用量最高的開源模型之一,在電商、翻譯、智能客服、物流、語音助手、監(jiān)控等場景中表現(xiàn)非常出色。

      在智能語音交互方面,阿里巴巴發(fā)布的Qwen2-Audio語音模型對中文語義理解的深度優(yōu)化和準(zhǔn)確率,可以強化蘋果的Siri助手,能實現(xiàn)更精準(zhǔn)、更智能的語音交互。用戶可以通過簡單的語音指令,讓Siri完成查詢信息、購物下單、設(shè)備控制等復(fù)雜操作。

      Qwen2-Audio使用了阿里自研的大模型Qwen-7B作為語言模型,能根據(jù)輸入的音頻和文本數(shù)據(jù)生成相應(yīng)的文本輸出。主要與音頻模塊協(xié)同工作,實現(xiàn)對音頻信息的理解和處理。

      當(dāng)音頻編碼器對輸入的音頻信號進(jìn)行特征提取后,這些特征會與之前的文本序列一起輸入到大語言模型中,會對這些信息進(jìn)行綜合分析,理解音頻中所包含的語言內(nèi)容和語義信息。

      例如,如果輸入的音頻是一段對話,大語言模型會嘗試?yán)斫鈱υ挼闹黝}、參與者的意圖以及情感傾向等。

      在生成文本輸出時,大語言模型會根據(jù)對輸入信息的理解,通過其所學(xué)到的語言知識和模式,生成準(zhǔn)確的文本回復(fù)。

      此外,Qwen2-Audio采用了16kHz的采樣頻率,并將原始波形轉(zhuǎn)化為128通道的mel譜圖,通過25ms窗口大小和10ms跳幀,確保了音頻特征的時間分辨率與頻譜信息的完整性。

      在手機(jī)交互方面,阿里巴巴前不久發(fā)布的視覺多模態(tài)大模型Qwen2.5-VL,可以作為一個視覺 Agent來自動化操作電腦、手機(jī)。例如,根據(jù)你的行程日期,自動幫你預(yù)訂飛機(jī)票。

      此外,Qwen2.5-VL還能理解超過1小時的長視頻,并且能定位特定時間點發(fā)生的事件。例如,在安防領(lǐng)域,能快速定位到有人闖入、火災(zāi)發(fā)生等關(guān)鍵事件的視頻片段,可極大節(jié)省審閱視頻的時間。

      同時Qwen2.5-VL也增強了其通用圖像識別能力,大幅擴(kuò)大了可識別的圖像類別量級。不僅包括植物、動物、著名山川的地標(biāo),還包括影視作品中的IP以及各種各樣的商品。

      精準(zhǔn)的視覺定位,Qwen2.5-VL 采用矩形框和點的多樣化方式對通用物體定位,可以實現(xiàn)層級化定位和規(guī)范的 JSON 格式輸出。這也為復(fù)雜場景中的視覺 Agent 進(jìn)行理解和推理任務(wù)提供了強大基礎(chǔ)。

      超長的視頻理解能力,Qwen2.5-VL 升級了視頻理解能力,通過動態(tài)幀率(FPS)訓(xùn)練和絕對時間編碼技術(shù),能理解超長視頻,定位秒級事件,還能在長視頻中搜索具體事件、總結(jié)不同時段要點,幫用戶快速提取關(guān)鍵信息。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。