AI的問題,用AI來解決。
在過去的十年里,人工智能(AI)技術(shù)已經(jīng)從理論研究和小規(guī)模應(yīng)用邁向全球性的技術(shù)革命,徹底改變了我們生活和工作的方式。無論是智能手機上的語音助手,還是復(fù)雜的數(shù)據(jù)分析和自動化生產(chǎn)線,AI 的影響無處不在,其帶來的效率提升和成本降低正推動著一場前所未有的生產(chǎn)力革命。
為了搶占 AI 生產(chǎn)力的先機,不少品牌都快馬加鞭拿出了自己的 AI 硬件:有的手機品牌利用 AI 技術(shù)消除拍攝照片時的運動拖影,有的用 AI 去除圖片中不想要的元素,有的企業(yè)更是搶先一步發(fā)布所謂的「AI PC」標(biāo)準(zhǔn)。
這么一對比,低調(diào)行事、默默耕耘的 NVIDIA 似乎有些不合群。為了改變這一「酒香巷更深」的局面,NVIDIA 近年來也在努力增加自己在 AI 領(lǐng)域的曝光機會,想辦法讓更多的用戶意識到 NVIDIA 在游戲顯卡之外的領(lǐng)先技術(shù)——2024 年 4 月 24 日,NVIDIA 在深圳舉辦了名為 RTX For AI 的線下交流會,讓大家能親身體會 NVIDIA 是如何「撐起 AI 半壁江山」的。
盡管 NVIDIA 不是第一個提出 AI 這一概念的企業(yè),但從產(chǎn)品和技術(shù)的角度看,包括 AI 在內(nèi)的眾多計算機歷史性節(jié)點,背后都或多或少有著 NVIDIA 的支持:2008 年,NVIDIA發(fā)布了 GeForce 8800 GTX 顯卡。
很顯然這張顯卡的性能放在現(xiàn)在早已不值一提,但這張顯卡上,NVIDIA 提出了「CUDA」(統(tǒng)一計算架構(gòu))這一概念。CUDA 的出現(xiàn)讓 GPU 不僅可以用來處理圖形運算,還可以用來執(zhí)行、加速基于 CUDA 的通用計算,讓電腦成為真正的「通用工具」。
除了 CUDA 外,NVIDIA 在 2018 年還進一步對 GPU 的算力進行「細(xì)化」,引入了RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計算成為可能——Tensor Core 通過高效執(zhí)行大規(guī)模矩陣運算,顯著加快了 AI 模型的訓(xùn)練和執(zhí)行速度。深受 NVIDIA 用戶喜愛、可以顯著提高游戲 FPS 的 DLSS,就基于 Tensor Core 來實現(xiàn),可以說是廣大游戲玩家最早接觸到的「真 AI」用例了。
算力是一切 AI 的基礎(chǔ)
在 AI 時代出現(xiàn)之前, NVIDIA 就開始想辦法用 Tensor Core 實現(xiàn) AI 功能,加速了 AI 時代的到來;那么和 6 年前的自己相比,現(xiàn)在的 NVIDIA 在 AI 領(lǐng)域又實現(xiàn)了怎樣的技術(shù)飛躍呢?
根據(jù) NVIDIA 的介紹,現(xiàn)階段 RTX AI 已經(jīng)對 10 種不同的 AI 場景實現(xiàn)覆蓋,分別為:AI 繪畫、AI 平面設(shè)計、AI 視頻編輯、AI 3D 創(chuàng)作、AI 視頻體驗、AI 會議、AI 文檔助手、AI 應(yīng)用開發(fā)、AI 游戲和 AI 游戲開發(fā)。
盡管這十大場景各有不同,但他們對電腦卻有著一個共同的需求:算力。而出色的算力,恰恰就是 RTX 硬件的最廣為人知的特性。
毫無疑問,和 6 年前剛剛發(fā)布 RTX 顯卡、引入 Tensor Core 時相比,性能是 NVIDIA 在 AI 領(lǐng)域最容易看到的提升。以最常見的文生圖(T2I)用例為例,有試過在自己電腦上部署 StableDiffusion 等模型的朋友應(yīng)該知道,當(dāng)前絕大多數(shù)模型或多或少存在「命中率低」的問題,導(dǎo)致用戶需要用同一組關(guān)鍵詞反復(fù)生成圖像,用類似手游「抽卡」的方式來生成自己想要的圖片。
針對這種「抽卡」的場景,NVIDIA就在分享會上展示了其旗艦消費級顯卡 RTX 4090D 的強大性能:基于 TensorRT 的加速功能,RTX 4090D 最快可以實現(xiàn) 120fps 的 StableDiffusion 圖像生成。
精細(xì)控制是 AI 生產(chǎn)力的標(biāo)志
不知道大家有沒有發(fā)現(xiàn)一個細(xì)節(jié),在剛剛提到的十大場景中,NVIDIA 把 AI 繪畫和 AI 平面設(shè)計區(qū)分開了。這并不是 NVIDIA 想用更多的用例撐場面,而是因為 AI 繪畫與 AI 平面設(shè)計其實標(biāo)志著 AI 技術(shù)的兩個不同的階段:
以文生圖為代表的 AI 繪畫,由于命中率較低,用戶需要不斷生成大量圖片來「抽卡」,才有可能得到自己想要的成品。而這種「不可控性」意味著這些 AIGC 作品的用途非常有限:要么用于娛樂,要么用來給設(shè)計師找靈感,或者充當(dāng)訓(xùn)練 AI 的物料。
但真正用于「生產(chǎn)力」的 AIGC 卻容不得這種「不確定性」,畢竟誰也不想用 AIGC 向客戶展示時裝上身效果時,AI 在衣服上生成三只手;或者設(shè)計師用 AI 向客戶講解室內(nèi)裝潢風(fēng)格時 AI 把屋頂復(fù)式豪宅畫成地下室。
換句話說,能否實現(xiàn)對 AIGC 的精細(xì)控制,會是區(qū)分「娛樂 AI」與「生產(chǎn)力 AI」的最大區(qū)別。
我們知道,「娛樂 AI」主要用于提升用戶體驗和互動性。例如,在視頻游戲、社交媒體和在線娛樂等領(lǐng)域,AI 被用來推薦內(nèi)容、生成音樂、模擬對話等。這類 AI 的核心目標(biāo)是增強娛樂性和參與度,而不那么側(cè)重于輸出的嚴(yán)格性和可預(yù)測性。這類 AI 生成的藝術(shù)作品或音樂不需要符合嚴(yán)格的商業(yè)應(yīng)用標(biāo)準(zhǔn),其創(chuàng)造性和新穎性更為重要。
相比之下,「生產(chǎn)力 AI」則應(yīng)用在更為嚴(yán)格和要求高的商業(yè)及工業(yè)環(huán)境中,如制造業(yè)、醫(yī)療、金融分析等。在這些領(lǐng)域中,AI 的任務(wù)是提高效率、減少成本和錯誤率,以及提供可靠的決策支持。比如利用 AI 在醫(yī)療診斷中用于分析影像和識別疾病模式,這要求極高的準(zhǔn)確性和可靠性。在這些應(yīng)用中,精細(xì)控制不僅關(guān)乎 AI 系統(tǒng)的效能,更關(guān)乎其決策質(zhì)量對人類生活的直接影響。
在分享會上,NVIDIA 也演示了一個「生產(chǎn)力 AI」應(yīng)有的樣子——即致 AI。作為一款面向建筑設(shè)計領(lǐng)域的 AI 應(yīng)用,即致 AI 提供了多種適用于不同建筑風(fēng)格、場景的預(yù)訓(xùn)練 AI 模型,同時基于 RTX 硬件的強大性能,即致 AI 能以近乎零時延的速度對設(shè)計師的導(dǎo)入草圖或繪制的線條進行 AI 生成,用近乎實時的方式為客戶講解建筑外部設(shè)計內(nèi)部裝修風(fēng)格。
AI 遇到的問題,應(yīng)由 AI 來解決
當(dāng)然了,剛剛提到的用例只不過是 NVIDIA RTX 在 AI 領(lǐng)域應(yīng)用的一小部分。從偏向娛樂性質(zhì)的文生圖、DLSS 3.5,到改變游戲交互方式的 NVIDIA ACE、聲音克隆,再到改變創(chuàng)作模式的 AI 視頻剪輯、改變工作模式的 Chat with RTX,無論是游戲還是工作,AI 技術(shù)早已滲透到我們生活的方方面面。
在分享視頻創(chuàng)作過程中 AIGC 的具體應(yīng)用時,著名視頻特效團隊「特效小哥 Studio」也提到了一個非常有趣的觀點——用 AI 來解決 AI 遇到的問題。據(jù)他們分享,在重建 AIGC 圖片的景深時,他們沒有選擇用傳統(tǒng)的人工標(biāo)記深度圖,而是直接把圖片丟給 AI,讓 AI 繪制 AIGC 的深度圖,并將結(jié)果輸出給另一個 AI 模型。
這種「用魔法打敗魔法」的解決方案,在我看來不僅僅是 AIGC 行業(yè)化,正規(guī)化的標(biāo)志,同時也是未來 AI 的發(fā)展方向之一。
首先,AI 模型的訓(xùn)練需要大量的計算資源,由于高質(zhì)量數(shù)據(jù)的獲取往往成本高昂且不易實現(xiàn),使用合成數(shù)據(jù)生成技術(shù)如生成對抗網(wǎng)絡(luò)(GANs)可以創(chuàng)造大量逼真的訓(xùn)練數(shù)據(jù),這對于提升 AI 系統(tǒng)的訓(xùn)練效率和效果非常有幫助。此技術(shù)不僅可以用于生成圖像數(shù)據(jù),也能擴展到文本、音頻甚至是虛擬環(huán)境的生成,極大地豐富了數(shù)據(jù)來源,為AI訓(xùn)練提供了更多可能。
其次,AI 模型的解釋性也是一個重要的技術(shù)挑戰(zhàn),因為許多高效的模型如深度神經(jīng)網(wǎng)絡(luò)往往像黑盒一樣,難以理解其內(nèi)部的決策邏輯。通過發(fā)展解釋性 AI 技術(shù),可以使模型的決策過程更加透明,增加用戶的信任,同時也方便開發(fā)者找到并改進模型的不足。
從長遠(yuǎn)的角度看,解決這些技術(shù)性挑戰(zhàn)不僅需要更先進的算法和模型設(shè)計,還需要在數(shù)據(jù)處理、模型訓(xùn)練和實際應(yīng)用之間找到一個平衡點,這將是推動 AI 技術(shù)未來發(fā)展的關(guān)鍵。我們期待 AI 能帶來更多便捷,同時也期待它幫助我們以全新的方式解決老問題。
而當(dāng) AI 真正徹底解放人類生產(chǎn)力后,擁有無盡想象力的創(chuàng)作者與 AI,一定能讓更多天馬行空的創(chuàng)意成為現(xiàn)實。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。