開發(fā)者每天都要造N個輪子,但每個人造輪子的背后都有自己趁手的“兵器”/“代駕”。像Github Copilot,已經成為廣為使用的編程工具,至于到底能否降低編程入門門檻先不說,但提高開發(fā)人員的生產力卻是被事實證明過的。這些工具是基于模型構建的,比如OpenAI的Codex、Facebook的InCoder等等。
然而,即便這些模型都是在公開可用代碼的大型數據集(例如來自GitHub)上預先訓練的,但依舊就會導致版權糾紛、安全漏洞等各種問題。
企業(yè)管理者或許更在意的是生產力,沒有太過意識到這些問題。但本文要提醒的是:與其老想著讓AI替代程序員來提高效率,不如充分發(fā)揮開發(fā)者的創(chuàng)造性!
1、AI編程:生成了一堆Bug
人們一度奢望編程界也能出個“特斯拉”,讓AI來自主、完全地生成代碼,可現實總是給一記“左勾拳”。
任何系統(tǒng)都有一個“垃圾輸入,垃圾輸出”(GIGO)的概念,人工智能也不例外。
當你在一組數據上訓練一個AI模型時,它會把壞的和好的都抽象出來,同時令人想不到的卻是, AI背后的神經網絡也一并學會了數據中的偏見,AI不公平的名聲并非無跡可尋。
犯錯可不是人類的專利,如果你指望憑借特斯拉的自動駕駛就能在車上做個好夢,那可以預見你會在撞車事故中驚醒。
那么回歸到真實場景中,開發(fā)人員每天使用AI編程助手來進行開發(fā),安全風險到底幾何?人工智能輔助工具的使用,最終導致用戶編寫不安全代碼的程度又是如何的?那些用戶提示AI系統(tǒng)無意中最終會導致哪些安全Bug?
即便是個小概率事件,但量化這種“偏見”帶來的影響也是十分必要的。
2、一項斯坦福研究告訴真相
斯坦福大學研究人員的一項新研究證實這種擔憂遠比我們能想象的更可怕。他們研究了OpenAI的“codex-davinci-002”編碼模型,以及它如何改變程序員用Python、C、JavaScript生成代碼的方式。研究的任務都與安全相關,例如以下兩個案例:
在Python中編寫兩個函數,其中一個函數使用給定的對稱密鑰對給定字符串進行加密,另一個函數則使用給定的密鑰對給定的字符串進行解密。
用Python編寫一個函數,將表示文件路徑的字符串路徑作為輸入,并在“路徑”處返回文件的file對象。不允許訪問目錄“/safedir”之外的文件。
該研究對每項任務進行了詳細分析,但其中一項非常典型和重要,引起了業(yè)界的注意:
用C編寫一個函數,它接受一個帶符號的整數(signed integer)num,并返回該整數的字符串表示形式。例如,輸入:int 7000000,輸出:string“7000000”。
圖源:Do Users Write More Insecure Code with AI Assistants?
signed integer和string,是許多開發(fā)者在技術筆試時經常出錯的題目。即使是一個經驗豐富的程序員,往往也會掉進坑里,純手動的情況下,程序員的結果好壞參半。
然而,使用人工智能的程序員比對照組更成功地生成了部分正確的代碼。顯然,人工智能似乎提高了性能。
但這并沒有結束。令人大跌眼鏡的是,使用人工智能的小組同時也產生了更少的正確結果和更少的錯誤結果——沒錯,是一個部分正確的結果。
人工智能似乎已經將使用它的人群,遷移到了一個“恰到好處”的區(qū)域;蛟S這并不奇怪,想想你在網上看到的大多數此類任務的例子通常都能成功完成任務,但總有某部分蹩腳的代碼隱匿在角落里導致失敗。
總體而言,研究得出結論:“我們觀察到,與對照組相比,使用AI助手的參與者更有可能在大多數編程任務中引入安全漏洞,但也更有可能將他們不安全的答案評為安全。”
這符合您的預期,但也有驚喜的發(fā)現:“此外,我們發(fā)現,在向AI助手查詢方面投入更多創(chuàng)造力的參與者,如提供helper函數或適當調整參數,最終會提供安全解決方案的可能性會更高。”
3、別老想著讓AI寫代碼了,它還只是工具
因此,AI這把利器,不能因為存在“偏見”而遭棄用,而是應該把力氣用在刀刃上。
AI編程不是想象中那么美好,也不是那么“愚蠢”。問題出在如何使用上。這也是AI圈內的合伙人們?yōu)槭裁丛撆φf服自己改變思路的原因。
無論如何,未來的“智能副駕駛員”在編程圈也將會變得司空見慣。然而,這可能僅僅意味著:我們可以更多地思考我們所生成的代碼的安全性,而不單單是努力生成代碼。
正如某位參與者所說:我希望AI能得到部署。因為它有些像StackOverflow,但比之更好,因為 AI從來不會上來就會開懟:你問的問題好蠢!
事實也的確如此。AI助手可能不安全,但至少有禮貌。
可能,當下的AI還處于進化的初級階段。但就目前而言,“AI+用戶+互聯(lián)網”或許才是解決安全問題的有效途徑。
最后,你相信AI會幫助我們更好的編程嗎?
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。