程序員創(chuàng)造的AI,最先替代的是程序員。
“大模型的編碼能力,現(xiàn)在已經(jīng)具備高階程序員(月薪幾萬元)的水平了。”阿里云云原生應用平臺負責人、通義靈碼負責人丁宇對光錐智能說道。
事實上,AI代碼工具并不是新生事物,早在上一波人工智能浪潮中就已經(jīng)開始落地應用。
但此前,“AI代碼產(chǎn)品原本只是輔助工具,現(xiàn)如今可執(zhí)行復雜項目、長上下文本編輯,及獨立做簡單代碼任務等。”商湯科技旗下AI代碼產(chǎn)品小浣熊家族的技術(shù)負責人張濤對光錐智能說道。
從輔助到獨立寫代碼,AI代碼已經(jīng)進化為一個工程級“協(xié)同”編碼工具。
基于此,不僅有越來越多的企業(yè)開始通過AI代碼工具來實現(xiàn)程序開發(fā)的降本增效,2025年之后,AI甚至有可能將取代中級程序員。
Meta創(chuàng)始人扎克伯格日前表示:“2025年,AI將達到中級軟件工程師的編程水平。”Meta將在2025年開始實現(xiàn)中級軟件工程師工作自動化,最終會將其應用程序所有編程工作外包給AI。
這并不是危言聳聽,當前AI生成的代碼在企業(yè)中的滲透率已經(jīng)達到了一個驚人的水平。
如谷歌有超過25%的新代碼是由人工智能生成;科大訊飛內(nèi)部AI生成代碼采納率已從2023年10月份的30%,至2024年6月份漲到了52%,單元測試行覆蓋率從30%提到50%。
AI編碼賽道之所以成為大模型應用最火熱的賽道之一,是因為“AI Coding(人工智能編程)是大模型應用落地中最高頻剛需、最具確定性的場景,是經(jīng)過PMF(產(chǎn)品市場匹配度)驗證的領(lǐng)域。”丁宇如此對光錐智能說道。
也正因此,越來越多的企業(yè)開始布局AI編碼賽道,領(lǐng)先的科技公司如微軟、谷歌、AWS、阿里、百度等走在前列。但如此多同類型產(chǎn)品,卻也造成了同質(zhì)化的競爭,未來該如何成功突圍?如何實現(xiàn)真正的大規(guī)模地商業(yè)化落地?
從打輔助到協(xié)同作戰(zhàn),
AI真成了你的程序員同事
2024年8月,美國知名企業(yè)Cloudflare副總裁Ricky Robinett的女兒,一個僅8歲小女孩,用時45分鐘就開發(fā)了一款聊天機器人,引發(fā)180萬網(wǎng)友在線關(guān)注。
她使用的AI代碼編輯器Cursor,也一夜爆火。這也讓AI編碼賽道再次成為行業(yè)關(guān)注的焦點。
在全球范圍內(nèi),據(jù) PitchBook 數(shù)據(jù)顯示,大約有250家初創(chuàng)公司推出了 AI 編碼助手。在國內(nèi),包括阿里巴巴、百度、騰訊、字節(jié)跳動等互聯(lián)網(wǎng)大廠,科大訊飛、商湯科技等獨角獸企業(yè),甚至AI大模型創(chuàng)業(yè)公司智譜AI等都紛紛推出相關(guān)產(chǎn)品。
AI代碼產(chǎn)品如雨后春筍般露出,是大模型給AI代碼工具能力帶來實質(zhì)性的進化。
早期AI代碼工具主要能夠執(zhí)行簡單任務,比如根據(jù)程序員的注釋,自動補全代碼,在程序員寫代碼過程中,提供代碼錯誤提示等。
隨著大模型能力的升級,AI代碼工具能夠解決的問題越來越多,比如能夠基于存量工程進行維護升級工作,“已經(jīng)能夠自主實現(xiàn)某些研發(fā)任務了。”丁宇說道。
比如,大語言模型能夠以自然語言理解人類指令,并根據(jù)工程上下文,自動完成復雜編碼任務,包括同時修改前后端多個文件,執(zhí)行腳本、編寫測試、部署代碼等。
“最開始通義靈碼是以編碼助手的形態(tài)出現(xiàn),主要是給程序員打輔助,根據(jù)代碼上下文,幫助程序員在研發(fā)時自動補全代碼。”丁宇說道,“2024年年底通義靈碼升級到2.0的AI程序員形態(tài),成為協(xié)同編碼助手,能夠和人類程序員協(xié)同工作,感知整個工程,根據(jù)場景任務做批量文件修改,實現(xiàn)能力的躍遷。”
而從AI代碼工具助手升級為AI程序員,前者代碼生成的主力還是人,而后者則逐漸轉(zhuǎn)向以AI為主,人類在其中主要起到監(jiān)測和確認的作用。
“此前主要是由人寫代碼,AI輔助做一些簡單的、可預測性強的、重復性的工作,而現(xiàn)在則可以通過需求描述,讓AI來理解和幫助程序員完成一些中等難度的代碼開發(fā)工作。”張濤也如此說道。
另外,隨著多模態(tài)大模型、深度推理大模型的進化,AI代碼工具的能力也在不斷完善。
商湯小浣熊家族的“辦公小浣熊”產(chǎn)品,除了可以進行基于大模型的數(shù)據(jù)處理、數(shù)據(jù)分析和文檔創(chuàng)作外,還能夠支持生成數(shù)據(jù)圖片和 PPT文件,這是一個多模態(tài)能力輸出的綜合體現(xiàn)。
多模態(tài)輸入同樣重要,“很多工具類產(chǎn)品,如果僅通過語言描述來交互,很難準確地實現(xiàn)需求,因為當我們把內(nèi)容描述成文本時,存在語言表達上的信息損失。同時,大模型當前自身存在的語義理解能力上的欠缺,幻覺問題等,也限制了AI代碼工具的能力邊界。直接以圖像或視頻等視覺方式輸入至大模型,則能夠更高效地完成任務。”張濤說道。
同時,多模態(tài)大模型能夠讓AI代碼工具實現(xiàn)從文生圖,到生代碼的端到端全棧功能的實現(xiàn)。
以網(wǎng)站設(shè)計為例,設(shè)計師可以通過文生圖的方式設(shè)計出前端視覺稿之后,可以直接給到Coding大模型,把視覺稿翻譯成前端界面,再根據(jù)前端界面功能大模型自動生成后端代碼。
“目前,AI編碼已經(jīng)可以完成復雜任務,消除知識技能的不對稱,比如從前端到后端可以一體化生成,打破了以前前端、后端人員和能力的分離協(xié)作模式,大幅提效。”丁宇說道,“并且在生成之后,AI編碼還可以幫助程序員自動生成測試,最終返回測試修改好的結(jié)果。”
不過,雖說AI已經(jīng)能夠自主生成一些代碼,但在實際過程中,AI所生成的代碼并不能夠一次性運行起來,其中也存在著諸多bug。
一位浙江大學AI方向在讀博士生陳榮(化名)對光錐智能表示:“復雜點的代碼都會有Bug,基本上很難一遍過,從技術(shù)邏輯上來說,可以理解為模型其實把coding當作翻譯任務一樣來做,輸出的是一串代碼序列,可能沒考慮好代碼的運行環(huán)境等。”
這背后的原因主要有兩方面,一方面是大多數(shù)人類很難準確地描述出自己的實際需求,甚至很多資深程序員在寫代碼過程中也是需要反復修改。
另一方面,則在于大模型當前自身理解語義能力上的欠缺,包括存在的幻覺問題,也限制了AI代碼工具的能力邊界。因此,雖然“在模型上下文窗口允許的范圍,大模型可達到萬行級代碼的理解,但AI代碼的能力邊界仍然較難界定。”張濤如此說道。
就像人類程序員需要反復修改測試代碼一樣,在AI生成代碼過程中,也可以通過與其多輪交互,來減少代碼bug的存在。
丁宇表示:“AI編碼并不是一次性生成最終結(jié)果,而是跟大模型有多輪交互迭代完成,在跟大模型聯(lián)合編碼過程中,有持續(xù)思考和推理探索的過程,在多輪交互修改結(jié)果正確后,還可以自主進行測試驗證,并對代碼進行部署使用,全生命周期完成任務。”
盡管當前AI代碼工具產(chǎn)品仍存在一些問題,但有越來越多的企業(yè)開始引入AI代碼類工具,“便宜活兒好”的AI代碼工具不僅提高了程序員的編程效率,也實現(xiàn)了企業(yè)的降本增效。
大型項目中的“螺絲釘”,
AI為程序員提效超10%
大模型給AI代碼工具帶來的進化,讓編程的門檻變得更低。
目前,AI能夠獨立實現(xiàn)自主編程的場景主要有三類:
一類是小產(chǎn)品,比如個人生活類的APP助手;
一類是以內(nèi)容為主的網(wǎng)站,其代碼量和難度適中,AI能夠自主實現(xiàn);
一類是辦公產(chǎn)品,比如Excel表格編輯、數(shù)據(jù)匯總等。
從實際應用來看,這些場景整體的代碼量并不高,且實際開發(fā)難度并不大,對于開發(fā)者的編程知識要求也不高。
可以說,AI代碼工具確實降低了編程的門檻,讓更多無代碼能力的人能夠接觸到代碼編程,并可以自主開發(fā)一些產(chǎn)品功能。
但是,盡管AI代碼工具降低了編程的門檻,卻需要程序員提升自身編程能力的上限,尤其是在更加復雜的軟件開發(fā)以及大型企業(yè)級系統(tǒng)軟件開發(fā)中。
一位金融科技行業(yè)的程序員肖肖(化名)對光錐智能表示:“對于一個公司的工程化項目,還是很難直接全盤交給AI,工程化項目要求的流程多,也需要多部門協(xié)作,而AI沒辦法看到全局。”
可以明顯看到,在企業(yè)中大模型做的更多地還是臟活累活,全局性及創(chuàng)新的活兒還是需要人類程序員來做。
“程序員的工作并不僅僅只是生成一個小型項目,其面對的生產(chǎn)代碼,整個項目文件上下文非常復雜,代碼關(guān)系也很繁雜,而程序員也對代碼質(zhì)量有自己的要求。”張濤說道。
這也就意味著,于企業(yè)中的程序員而言,AI代碼工具更多還是輔助性角色,但也間接地拉高了程序員工作能力的下限,畢竟簡單重復性的工作,AI基本已經(jīng)能夠搞定。
“如果讓AI直接生成一家銀行所有業(yè)務的10萬個代碼文件,它目前肯定是做不到的。”丁宇坦言,“目前在企業(yè)大型項目中,AI編碼肯定是從小任務開始,找到一個切面,如實現(xiàn)一個功能模塊,或者在一個百萬工程代碼中找安全漏洞,AI能夠做得非常準確且快速。”
另外,業(yè)內(nèi)皆知,對于大型企業(yè)項目來說,最怕存在的問題就是系統(tǒng)的不確定性,如果出現(xiàn)系統(tǒng)bug,就可能會帶來資源和經(jīng)濟上的巨額損失。
因此,在丁宇看來:“大型工程仍需要人類程序員來掌握軟件開發(fā)過程中的不確定性,比如架構(gòu)設(shè)計、領(lǐng)域建模等,把已經(jīng)確定性的內(nèi)容拆解開來,比如模塊開發(fā)、找安全漏洞、補充測試用例等,并交付給AI,讓其根據(jù)人類的指令做這些確定性的工作。”
盡管只是打輔助,AI代碼工具卻也給開發(fā)者和企業(yè)帶來了實打?qū)嵉男侍嵘?/strong>
以阿里云為例,目前所有技術(shù)全員都在使用通義靈碼,月活占比超82%,每天AI生成的代碼占總提交代碼量30%以上。基于這個數(shù)據(jù)大致能夠算出來,AI對開發(fā)者提升效率大概是17.5%,打個折扣也會在10%-15%之間。
“因此,我每次見企業(yè)的負責人都會講通義靈碼能夠給工程師團隊提效10%以上。”丁宇說道,“也就是說,如果一家企業(yè)有100個工程師在使用通義靈碼,就能額外產(chǎn)出10個工程師的產(chǎn)能。”
另外,人類程序員都是有細分分類的,比如前端、后端等,如果想要讓一個后端去做前端,那可能就需要給后端工程師做大量的培訓學習,其并不能立馬就接手前端程序員的工作。
但有了AI代碼工具后,程序員只需要問問AI,就可以輕松學習各種語言平臺的研發(fā)知識,快速上手。“以前做一個項目可能花兩三周預研,現(xiàn)在兩三天就能完成任務,讓員工實現(xiàn)1-N的能力增長。”丁宇說道。
當然,對于AI來說,還可以幫助人類程序員做更多重復性的工作,比如很多開發(fā)者都不愿意寫測試代碼,這些在程序員角度來看屬于沒有創(chuàng)造性的工作,但卻又不得不做。
而AI代碼工具可以根據(jù)程序員的代碼作為提示詞,自動生成單元測試,真正地解放了開發(fā)者,讓開發(fā)者把精力花在更具有創(chuàng)造性的工作上。
此外,對于企業(yè)來說,除顯性價值提升外,存在的隱性價值在于,AI代碼工具能夠讓企業(yè)更容易保持軟件系統(tǒng)的高質(zhì)量且長期穩(wěn)定,其不僅能夠做單元測試的補全,還能夠自主發(fā)現(xiàn)安全漏洞并給出修復建議,提升質(zhì)量的同時,還能縮短項目交付周期。
更為有趣的是,現(xiàn)階段AI的編碼能力,借助外部工具使用,已經(jīng)逐漸趕超中級程序員,商湯小浣熊底層模型特點之一,就是在代碼解釋器能力上做了加強,讓模型能夠?qū)崿F(xiàn)自主代碼調(diào)試迭代。
“在復雜項目中,單純依靠大模型推理生成代碼,一次性通過率不高,一般不超過20%。”張濤說道,“而辦公小浣熊基于代碼解釋器方案,在日常圖表等能力上,代碼通過率已經(jīng)接近80%。”
AI編碼賽道開始分化,
細化場景的創(chuàng)新決定成敗
AI編碼已經(jīng)是一個通過PMF驗證的落地方向,這也導致眾多玩家切入這一賽道,出現(xiàn)眾多同質(zhì)化類型的產(chǎn)品。
目前,在中國市場中眾多企業(yè),包括互聯(lián)網(wǎng)大廠、中小企業(yè),及大模型創(chuàng)業(yè)公司,都紛紛推出了AI代碼產(chǎn)品,比如阿里云的通義靈碼、百度的文心快碼、字節(jié)跳動的豆包 MarsCode、騰訊云AI代碼助手、智譜AI的CodeGeeX等等。
盡管AI代碼產(chǎn)品眾多,但各家在提供的功能能力上差別并不是很大,“目前市場中同質(zhì)化比較嚴重,功能實際上差不多,畢竟編程產(chǎn)品希望能夠解決用戶的問題是一樣的。”張濤說道。
不過,隨著大模型技術(shù)的迭代升級,AI編碼賽道也邁入了“分化”的中期階段。“從當前AI代碼賽道來講,已經(jīng)開始分化出不同的實現(xiàn)方式。”張濤說道。
像Cursor這樣的產(chǎn)品,能夠基于自己改造的開源IDE,做完整的任務編程;也有像Bolt.new這樣的產(chǎn)品,以線上工具的形式使用,用戶描述需求,AI完成網(wǎng)頁開發(fā),但它只能實現(xiàn)前端技術(shù)棧相關(guān)內(nèi)容等。
現(xiàn)階段可以明顯看到,各個產(chǎn)品已經(jīng)開始找到不同的細分場景并構(gòu)建自己的產(chǎn)品優(yōu)勢,實現(xiàn)差異化發(fā)展——有的更擅長做網(wǎng)頁開發(fā),有的則更擅長做已有項目的一些代碼修改任務,還有的可以做一些小工具的開發(fā),或低代碼工作等。
丁宇也認為:“軟件研發(fā)存在非常多場景,有很多細分領(lǐng)域,企業(yè)可以從不同的切入點切入,做細分場景的創(chuàng)新或產(chǎn)品形態(tài)的創(chuàng)新。”
而各家AI代碼工具產(chǎn)品在功能場景上的細分,也會給各家產(chǎn)品帶來商業(yè)上的差異,不同企業(yè)的商業(yè)化側(cè)重點也并不完全相同。
比如商湯科技小浣熊家族中辦公小浣熊產(chǎn)品主要聚焦在辦公工具類賽道,在實際的商業(yè)化落地中,則是C端和B端同步進行。
其中C端主要以付費訂閱為主,B端以企業(yè)進行私有化部署為主,“目前私有化部署客戶接近40家,包含體量比較大的互聯(lián)網(wǎng)廠商等。”
不過,張濤同樣看好C端賽道的市場潛力,現(xiàn)階段C端產(chǎn)品的推廣超預期。
從場景功能,到商業(yè)化落地方向,AI編碼賽道都已經(jīng)開始出現(xiàn)分化,但這并不是AI代碼行業(yè)發(fā)展的終局形態(tài)。
隨著大模型技術(shù)能力的持續(xù)迭代,下一步AI代碼將實現(xiàn)“自主編程”,即不僅僅輔助程序員開發(fā)項目,而是能夠自主接受獨立的需求,完成完整的項目任務。
“未來一定會走向AI 自主編程,這也意味著將為企業(yè)和開發(fā)者帶來10倍的IT生產(chǎn)力提升。”丁宇說道。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。