2011年10月4日,蘋果Siri伴隨iPhone 4s一同推出。
發(fā)布會上,蘋果將 Siri 宣傳為“謙遜的私人助理,只需提出要求即可幫助你完成工作”,而眾多媒體也不吝贊美之詞。
The Verge提到:“Siri 的瘋狂之處在于,它的工作效果——至少在大多數(shù)時候——比你想象的要好。”
CNN表示:“Siri有點像我夢想中隨叫隨到的無薪實習生。”
“Siri 可以節(jié)省時間、減少摸索和分散注意力,并深刻改變‘手機’的定義。” 《紐約時報》稱。
當時人們的眼中,Siri無疑是具備一定革命性的,盡管它還不是那么*,會犯一些機器都會犯的錯,但卻有了人工智能的雛形,盡管蘋果沒有用“人工智能(Artificial Intelligence)”來形容它,但蘋果高管Phil Schiller在發(fā)布Siri的時候,心里大概還是會閃過1999年《機器管家》電影里的某個片段。
但是蘋果卻在這之后和AI分道揚鑣,漸行漸遠。在今年6月的WWDC上,蘋果只字未提AI,只是用了機器學習來指代這兩個字母,而曾經(jīng)蘋果引起為傲的Siri,卻被一筆帶過,只是把語音喚醒詞簡化成“Siri”,并加入了連續(xù)回應功能,相較于其他互聯(lián)網(wǎng)公司在語音助手上的大刀闊斧式的更新,Siri更像是小心翼翼地擠出了一點牙膏,頗有些敷衍了事的感覺。
瑞士信貸(Credit Suisse)的資深分析師香農(nóng)-克羅斯(Shannon Cross)在5月的蘋果財報會議上,直截了當?shù)卦儐朇EO庫克,問他對人工智能是否有話要說。
庫克依舊是那個四平八穩(wěn)的回答風格:“蘋果在整合生態(tài)系統(tǒng)中的人工智能和機器學習方面取得了巨大進步,多年來我們一直將其融入到產(chǎn)品和功能中,你可以在跌倒檢測、碰撞檢測和心電圖等方面看到這一點。因此,我們認為人工智能是一項巨大的技術(shù),蘋果將繼續(xù)深思熟慮地將其應用到產(chǎn)品中。”
但蘋果確實拿不出更多關(guān)于AI方面的成果,在元宇宙的熱潮逐漸褪去的今年,蘋果卻發(fā)布了頭顯Vision Pro,售價3萬多的它,顯然不如Chat-GPT那樣接地氣,也讓更多人心生懷疑,他們心中都有同一個問題:
當微軟、谷歌、Meta用AI打造新的帝國時,蘋果到底在干什么?
數(shù)字助手誕生
你可能以為蘋果對AI不怎么感冒,但它卻是最早把AI放到宣傳里的公司之一。
喬布斯離開蘋果之后,CEO約翰·斯卡利(John Sculley)接過了整個公司的重擔,1987年,他出版了自己的著作《奧德賽:從百事可樂到蘋果》,書中的最后一章,斯卡利與艾倫·凱(Alan Kay,當時的蘋果研究員)在多次討論后提出了一個設(shè)想,即所謂的知識導航儀(Knowledge Navigator),甚至還為它畫了一個粗略的草圖,屏幕上有兩個操縱桿,人們可以握住操縱桿在知識的海洋中徜徉。
同年10月,學術(shù)計算機領(lǐng)域的主要高等教育會議 Educom正式召開,斯卡利受邀做了主題演講,《奧德賽》中的知識導航儀從鉛字變成了一段生動的視頻,在假想的2007年,一位伯克利大學教授準備講座、查看電子郵件、在網(wǎng)上做研究、與巴西的同事視頻通話、為父親購買生日蛋糕……
這一切不是通過鍵鼠,而是依靠屏幕里一位打著領(lǐng)結(jié)的數(shù)字私人管家,伴隨著喬治·安東·本達 (Georg Anton Benda)的C大調(diào)羽管鍵琴協(xié)奏曲,在連續(xù)而又自然的一段段對話當中,完成了工作和生活中的瑣碎事情。
知識導航儀在當時引起不小的轟動,既有為蘋果未來愿景發(fā)出嘆服的聲音,也有著指責蘋果不切實際的聲音,1987年,個人電腦方興未艾,圖形化操作系統(tǒng)還沒普及,就向著虛擬助理了,未免有些太超前了。
事實證明,有些超前的想法并非妄想,Siri、Cortana、Alexa、Bixby 和 Google Assistant在2011年之后先后涌現(xiàn),二十多年前的知識導航儀,成為了這些語音助手的曾曾曾祖父。
隨著斯卡利辭任CEO,喬布斯回歸蘋果,知識導航儀的概念被束之高閣,但蘋果并沒有徹底放棄對AI的追逐,但無奈于設(shè)備性能的羸弱,沒辦法實現(xiàn)設(shè)想里的種種功能。
不過,當時對于語音助手的探索其實已經(jīng)卓有成效,90年代作為處理器迭代最快的時期,得以讓軟件公司能夠開發(fā)全面的語音識別系統(tǒng),如 Dragon在1997 年發(fā)布的Dragon NaturallySpeaking,這是世界上*個每分鐘理解 100 個單詞的連續(xù)語音識別系統(tǒng),用戶不用在兩個單詞之間刻意停頓,實現(xiàn)了流暢的整句識別。
到了2001年時,先進的語音識別軟件已經(jīng)可以做到80%的識別準確率,谷歌甚至開始將這部分技術(shù)帶到了實際應用種,谷歌語音搜索收集了大約2300億個用戶搜索的單詞,最終將它們用于預測搜索內(nèi)容,并推進了語音處理技術(shù)后續(xù)的發(fā)展。
2003年,美國國防部高級研究計劃局DARPA開始對人工智能進行研究,他們希望有一個數(shù)字助手來處理每天收到的大量數(shù)據(jù),他們與有技術(shù)積累的SRI International合作,開展了迄今*的人工智能項目之一CALO,其意為“士兵的仆人”。
而這個項目的*意義不在于它提供了多么尖端的武器,而是在五年的研究后,SRI International分拆出的一家名為Siri的初創(chuàng)公司,沒錯,這就是蘋果Siri語音助手最初的起點。
Siri在2010年初在 App Store 免費推出同名應用,雖然沒有達到知識導航儀的水平,但它功能可以用豐富來形容,通過連接到互聯(lián)網(wǎng),Siri不僅可以通過 TaxiMagic 預訂出租車,從 StubHub了解音樂會時間,也能通過爛番茄查看電影評論,從Yelp獲取餐廳評分等等,不少人覺得Siri已經(jīng)接近千禧年時電影中的人工智能原型了。
原本Siri還計劃在安卓和黑莓平臺上推出對應的語音助手,不過剛推出沒多久,蘋果CEO喬布斯大手一揮,這么好的應用,就永遠留在iOS系統(tǒng)里,在當年4月就宣布了對Siri的收購,次年10月,蘋果正式推出了內(nèi)置Siri測試版的iPhone 4S,自此,Siri這四個字母與蘋果和iPhone牢牢綁定在了一起。
喬布斯在2010年的D8大會上接受采訪時,并不覺得Siri是一個用語音助手包裝起來的搜索引擎,而是一家人工智能公司,他心里非常清楚,收購Siri不是簡單地為iPhone上加一個語音搜索那么簡單,而是希望蘋果不再局限于單一硬件,提前布局AI時代。
Siri吹響了語音助手的號角,擁有先發(fā)優(yōu)勢的它沒過多久就有了競爭對手:2012 年,三星在 Galaxy S3上推出了S Voice(后續(xù)被Bixby取代);同年,谷歌推出了Android版的 Google Now(后續(xù)被 Google Assistant 取代);2014 年,微軟推出了 Windows Phone 版的 Cortana;同年,亞馬遜在 Echo 智能音箱上推出了 Alexa。
從手機到智能音箱,與機器的對話變成日常生活中的稀松平常的一環(huán)。
神經(jīng)引擎革命
說蘋果不重視人工智能更是扯淡,因為蘋果是最早把AI硬件塞進手機里的廠商之一。
2017年,蘋果發(fā)布了iPhone 8/8 Plus和iPhone X,與它們一同推出的還有內(nèi)置“神經(jīng)引擎(Neural Engine)”的A11芯片。
按照蘋果的說法,神經(jīng)引擎是專門用于處理“特定機器學習算法”的處理核心,它為 iPhone 上的Face ID、Animoji 和AR應用等提供支持,可以做到 “每秒執(zhí)行高達 6000 億次操作”,從而加快部分任務的處理速度。
蘋果沒有使用人工智能的字眼,但神經(jīng)引擎處處透露出人工智能的意味,《連線》雜志與蘋果副總裁 Tim Millet 關(guān)于 A 系列芯片的訪談中提到,在 iPhone X 發(fā)布的數(shù)年前,蘋果的一些工程師就提出了利用機器學習算法讓 iPhone 的攝像頭變得更智能的想法。
此后每年蘋果推出的A系列芯片,不只有CPU和GPU的提升,A12、A13、A14、A15、A16……神經(jīng)引擎從最初每秒6000億次進化到了每秒17萬億計算,性能已經(jīng)超越了2000年的每秒計算12.3萬億次的美國超算ASCI White,曾經(jīng)106噸的龐然大物,濃縮在手機芯片的一角上,讓人感概于摩爾定律之強大。
而神經(jīng)引擎也讓隔壁換用蘋果自研M系列芯片的Mac產(chǎn)品沾上了光,M1就有了媲美A14的神經(jīng)核心,而最新的M2 Ultra的神經(jīng)引擎更是擁有每秒31.6萬億次的*算力。
可能有人會好奇,如此強大的AI性能,都為蘋果用戶都帶來了哪些革命性的改變呢?
答案藏在了iOS、iPadOS以及macOS各種不起眼但卻實用的功能里。
用戶在iPad上使用 Apple Pencil 時,筆記軟件會區(qū)分筆尖按壓與手掌誤觸;電池軟件會監(jiān)測日常使用習慣,優(yōu)化充電功率和時間,保護電池壽命;相機應用會在按下快門后,瞬間拍攝多張照片,通過合成來得出觀感更好的照片……
包括在今年6月的WWDC上,也有一堆功能實質(zhì)利用上了神經(jīng)引擎,例如Vision Pro上視頻通話中利用面捕實時生成的3D人臉,AirPods的根據(jù)環(huán)境和個人習慣調(diào)整的個性化音量,iOS 17中更好的鍵盤自動更正輸入單詞等等。
這些功能都有一個共性,它們通;诒镜囟窃贫,充分調(diào)動設(shè)備本身的算力,而蘋果在近幾年營銷演示中也特意回避所謂的人工智能(AI),而是把 iPhone、Apple Watch 和 iPad系統(tǒng)的種種改進歸功于機器學習(ML)。
蘋果的神經(jīng)引擎也如Siri一樣,掀起一場新技術(shù)普及的浪潮,在2017年5月曝出蘋果要內(nèi)置AI計算單元后,華為在當年9月就給麒麟970加上了NPU(神經(jīng)網(wǎng)絡(luò)單元),高通則是等到了2019年的驍龍855才內(nèi)置NPU,聯(lián)發(fā)科則是在自己的Helio P60芯片上引入了APU的概念,谷歌在自研的Tensor上同樣搭載了edge TPU。
AI概念因內(nèi)置神經(jīng)引擎得以普及,普通消費者或許今天都還不清楚它能干什么,但它確確實實在看不見的角落里發(fā)揮著自己的作用。
下一顆自研芯片備選?
2017年之后的蘋果CEO庫克,明明握著和AI相關(guān)的兩把大劍——Siri和神經(jīng)引擎,但在2022年至2023年的這場AI浪潮里,卻沒能像微軟納德拉和英偉達黃仁勛那樣笑出聲來。
誰來背這口鍋?
Siri作為最早面向消費者的語音助手,本應有一個翻天覆地的變化,如同iPhone 4s到iPhone 14那樣的升級,但十多年過去后,大家發(fā)現(xiàn)它卻和最初一樣,談不上好用。
有媒體評論道,每個使用 Siri 的人都有自己的挫敗感,他們驚訝的不是Siri的智能,而是它的愚蠢,即使是簡單而明確的指令,也有可能出錯,蘋果前營銷主管席勒口中“謙遜的個人助理”仍然保持自己謙遜的態(tài)度:移動設(shè)備上不如Google Assistant,在智能音箱上被亞馬遜的 Alexa完敗。
事實上,蘋果對Siri并沒有一個完整的發(fā)展計劃,最初的喬布斯野心勃勃,他的目標更接近于當初的死對頭斯卡利所提出的知識導航儀,即一個能處理復雜任務的助手,但在庫克繼任后,Siri的目標明顯更加保守了,更像是一個幫你切換各種應用的小工具,且大部分時候只能在蘋果自帶應用里反復橫跳,一言不合就打開搜索引擎。
而神經(jīng)引擎面臨的情況就更復雜了,對于蘋果能夠內(nèi)置具備AI功能的神經(jīng)引擎,當時的人們都懷揣著一個未來的夢想,認為iPhone能夠完成以往不能完成的任務,即使沒了互聯(lián)網(wǎng),手機也能依靠本地計算來使用AI功能。
但事實情況并非如此,神經(jīng)引擎本身不具備完全的計算能力,需要與CPU、GPU以及ISP等核心協(xié)調(diào)才能發(fā)揮作用,且算力有限,在大部分場景中,手機依舊需要連接到網(wǎng)絡(luò)才能使用各種宣稱中的功能,而Siri更是完全依托于服務器的數(shù)據(jù)。
Siri和神經(jīng)引擎,一軟件一硬件,本來應當是蘋果應對AI時代的利器,結(jié)果在生成式AI的對比下,反倒成了短板,庫克避而不談并不是出于對AI的隱患,而是真的沒啥好談的。
當蘋果昂首闊步發(fā)布Vision Pro時,先進的人機交互驚艷了任何一個視頻觀眾,它的目的是在虛擬世界里打通生活與工作,與之相反的是,許多人渴望的不是一個華麗界面的終端產(chǎn)品,而是出現(xiàn)像鋼鐵俠電影中賈維斯那樣的人工智能,沒有太多生成式AI技術(shù)的蘋果顯然做不到這一點。
庫克避而不談的事實就是,大家已經(jīng)對蘋果小打小鬧式的AI創(chuàng)新厭倦了,他們不關(guān)心某項新功能所帶來的一點便利,而是想要通過在蘋果產(chǎn)品里集成GPT,獲得一個更加智能的Siri。
蘋果當然意識到了這一點,彭博社的最新爆料里提到,蘋果已經(jīng)建立了自己的大型語言模型,其基于谷歌的 Jax 機器學習框架構(gòu)建,運行在 Google Cloud 上,一部分工程師稱其稱為“Apple GPT”,消息一發(fā)布,蘋果當日的股價就上漲了 2.3%,達到了歷史新高,從早前的跌勢中反彈。
即使到了這個時候,蘋果依舊保持著相對謹慎的態(tài)度,彭博社提到,Apple GPT只是去年蘋果內(nèi)部一個小團隊的產(chǎn)品,本質(zhì)上是對Bard、ChatGPT 和 Bing AI的簡單復制,并不包含任何新穎的功能或技術(shù),且具有不適合大眾消費使用的精簡設(shè)計。
不過,一旦開始決心去訓練更大的模型,蘋果馬上就會面臨比生成式AI技術(shù)更困難的問題——缺芯,準確來說,是缺GPU。
為了支撐OpenAI訓練出ChatGPT,微軟專門為OpenAI打造了由數(shù)萬個A100 GPU組成的AI超算,60多個數(shù)據(jù)中心和幾十萬張GPU日夜不停歇,只為了支持ChatGPT工作。
TrendForce研究認為,以A100的算力為基礎(chǔ),GPT-3.5大模型需要高達2萬個GPU,未來商業(yè)化后可能需要超過3萬個。
以蘋果產(chǎn)品的用戶基數(shù),一旦集成在系統(tǒng)中,那需要的可能是數(shù)以十萬計的英偉達GPU,這么大的需求缺口,即使掏空英偉達,也很難一口氣拿出這么多芯片,況且如今用于AI訓練的GPU本身就極為緊俏,短時間內(nèi)難以搭建媲美微軟和谷歌那樣的超算與數(shù)據(jù)中心。
而GPU的價格更是棘手,蘋果即使再財大氣粗,掏錢買幾萬張A100或H100的GPU還是會感到肉疼的,縱使千億美金的家底也禁不起隨便揮霍。
那么擺在蘋果面前的選擇似乎只剩下了一個,就是學谷歌和微軟,推出類似TPU和代號雅典娜那樣用于AI計算的芯片,至少能取代一部分英偉達GPU,降低訓練大模型的成本。
從這個角度來看,蘋果相比谷歌和微軟又有了不少優(yōu)勢,作為硬件廠商的它,已經(jīng)有A系列和M系列等自研芯片的經(jīng)驗,再加上代工廠臺積電的鼎力支持,外界的壓力依舊存在,但理論上遇到的阻力卻會小上不少。
喬布斯在離任蘋果CEO前,主導了對Siri的收購,這曾是蘋果諸多未來美好愿景中的一個,而近兩年中人工智能的異軍突起,又讓人想起了2011年時的種種盛況,只是這次,蘋果并未站在聚光燈之下。
當各家的GPU各顯神通之際,蘋果會用A4和M1這樣的芯片再次完成一場革命嗎?
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。