今天凌晨,路透社消息,阿里巴巴確定與蘋果合作,為中國iPhone提供AI服務(wù)。
同時,阿里巴巴集團(tuán)董事會主席蔡崇信,在迪拜舉行的世界政府峰會上,也親口確定了該消息。阿里巴巴股票大漲8%,創(chuàng)三年以來新高。
蔡崇信表示,由于監(jiān)管等問題,蘋果需要尋找一個中國本土的科技企業(yè)進(jìn)行合作,為其手機(jī)提供服務(wù)。蘋果一直非常謹(jǐn)慎、嚴(yán)格,他們與中國的多家科技公司進(jìn)行了談判,最終選擇了我們。
此前,蘋果曾找過百度以及爆火的DeepSeek,但由于技術(shù)等原因最終放棄轉(zhuǎn)向阿里巴巴。
阿里巴巴作為國內(nèi)最大互聯(lián)網(wǎng)公司之一,在云計算、大數(shù)據(jù)、AI等領(lǐng)域有著深厚的積累和技術(shù)優(yōu)勢。其自研的Qwen系列多模態(tài)大模型,是全球下載和使用量最高的開源模型之一,在電商、翻譯、智能客服、物流、語音助手、監(jiān)控等場景中表現(xiàn)非常出色。
在智能語音交互方面,阿里巴巴發(fā)布的Qwen2-Audio語音模型對中文語義理解的深度優(yōu)化和準(zhǔn)確率,可以強化蘋果的Siri助手,能實現(xiàn)更精準(zhǔn)、更智能的語音交互。用戶可以通過簡單的語音指令,讓Siri完成查詢信息、購物下單、設(shè)備控制等復(fù)雜操作。
Qwen2-Audio使用了阿里自研的大模型Qwen-7B作為語言模型,能根據(jù)輸入的音頻和文本數(shù)據(jù)生成相應(yīng)的文本輸出。主要與音頻模塊協(xié)同工作,實現(xiàn)對音頻信息的理解和處理。
當(dāng)音頻編碼器對輸入的音頻信號進(jìn)行特征提取后,這些特征會與之前的文本序列一起輸入到大語言模型中,會對這些信息進(jìn)行綜合分析,理解音頻中所包含的語言內(nèi)容和語義信息。
例如,如果輸入的音頻是一段對話,大語言模型會嘗試?yán)斫鈱υ挼闹黝}、參與者的意圖以及情感傾向等。
在生成文本輸出時,大語言模型會根據(jù)對輸入信息的理解,通過其所學(xué)到的語言知識和模式,生成準(zhǔn)確的文本回復(fù)。
此外,Qwen2-Audio采用了16kHz的采樣頻率,并將原始波形轉(zhuǎn)化為128通道的mel譜圖,通過25ms窗口大小和10ms跳幀,確保了音頻特征的時間分辨率與頻譜信息的完整性。
在手機(jī)交互方面,阿里巴巴前不久發(fā)布的視覺多模態(tài)大模型Qwen2.5-VL,可以作為一個視覺 Agent來自動化操作電腦、手機(jī)。例如,根據(jù)你的行程日期,自動幫你預(yù)訂飛機(jī)票。
此外,Qwen2.5-VL還能理解超過1小時的長視頻,并且能定位特定時間點發(fā)生的事件。例如,在安防領(lǐng)域,能快速定位到有人闖入、火災(zāi)發(fā)生等關(guān)鍵事件的視頻片段,可極大節(jié)省審閱視頻的時間。
同時Qwen2.5-VL也增強了其通用圖像識別能力,大幅擴(kuò)大了可識別的圖像類別量級。不僅包括植物、動物、著名山川的地標(biāo),還包括影視作品中的IP以及各種各樣的商品。
精準(zhǔn)的視覺定位,Qwen2.5-VL 采用矩形框和點的多樣化方式對通用物體定位,可以實現(xiàn)層級化定位和規(guī)范的 JSON 格式輸出。這也為復(fù)雜場景中的視覺 Agent 進(jìn)行理解和推理任務(wù)提供了強大基礎(chǔ)。
超長的視頻理解能力,Qwen2.5-VL 升級了視頻理解能力,通過動態(tài)幀率(FPS)訓(xùn)練和絕對時間編碼技術(shù),能理解超長視頻,定位秒級事件,還能在長視頻中搜索具體事件、總結(jié)不同時段要點,幫用戶快速提取關(guān)鍵信息。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。