今天凌晨2點,OpenAI開啟了第9天技術分享直播,正式發(fā)布了o1模型的API,并且對實時API進行大升級支持WebRTC。
其中,o1模型的API與之前的預覽版本相比,思考成本降低了60%,并且附帶高級視覺功能;GPT-4o的音頻成本降低60%,而mini版本價格更是暴降了10倍。
同時OpenAI還發(fā)布了全新的偏好微調方法,通過直接偏好優(yōu)化算法可以讓大模型更好地掌握用戶的偏好風格。
o1模型API
今天發(fā)布的正式版本o1模型API還集成了很多新功能,包括函數(shù)調用、結構化輸出、開發(fā)者消息以及推理工作量。
函數(shù)調用允許模型根據(jù)輸入數(shù)據(jù)自動調用相應的后端服務或外部API,實現(xiàn)復雜任務處理能力;結構化輸出支持JSON格式的數(shù)據(jù)返回,確保輸出結果符合預期結構,方便后續(xù)解析與應用;
開發(fā)者消息是一種新型系統(tǒng)消息形式,賦予開發(fā)者更大的控制權來指導模型行為;而推理工作量參數(shù)用于調整模型思考時間,平衡性能與準確性之間的關系。
在演示環(huán)節(jié)中,OpenAI展示了一款基于高級視覺功能的應用案例,檢測錯誤表單。通過上傳填寫有誤的文本表格圖片,o1模型成功識別出了其中存在的計算錯誤,并提供了詳細的修正建議。
此外,對于某些需要精確執(zhí)行的任務,o1模型還可以借助內置函數(shù)庫與后臺服務器通信,獲取最新稅率等信息,確保最終結果的準確性和時效性。
實時API增強、支持WebRTC,極大簡化開發(fā)流程
WebRTC是一種為互聯(lián)網(wǎng)構建的實時通信技術,主要應用于會議和低延遲視頻流傳輸?shù)阮I域。OpenAI在實時API中支持WebRTC,使開發(fā)的AI應用能夠自動處理互聯(lián)網(wǎng)變化,例如,調整比特率和回聲消除,為實時語音應用帶來更好的性能和穩(wěn)定性。
與之前的 Websockets 集成相比,WebRTC 支持顯著簡化了代碼。使用 Websockets 時,開發(fā)者需要處理200-250行代碼來解決反壓等問題。而采用 WebRTC,僅需12行代碼即可實現(xiàn)相同功能。
例如,在實時語音聊天應用中,WebRTC 的使用使開發(fā)者能夠更快速地構建功能強大的應用程序,提高開發(fā)效率。
在演示環(huán)節(jié)中,通過簡單的 HTML 代碼創(chuàng)建對等連接,實現(xiàn)了音頻流的發(fā)送和接收,展示了 WebRTC 支持下實時語音應用開發(fā)的便捷性。開發(fā)者只需關注應用邏輯,無需處理復雜的網(wǎng)絡通信細節(jié),大大降低了開發(fā)難度。
此外,為了進一步方便開發(fā)者集成實時 API,OpenAI推出了Python SDK支持,同時大幅度降低價格。
偏好微調
偏好微調與傳統(tǒng)的監(jiān)督式微調有很大的不同,采用成對樣本比較學習的方式,使模型能夠理解并適應特定應用場景中的細微差異。在實施偏好微調時,開發(fā)者首先需要準備一組包含兩個不同版本回答的數(shù)據(jù)集,其中一個被認為是更優(yōu)的選擇。
然后,將這些數(shù)據(jù)送入模型進行訓練,使其學會區(qū)分好壞答案之間的差異,并根據(jù)用戶的反饋不斷調整自己的行為準則。
偏好微調特別適合那些對回答格式、語氣或者抽象特質(如友好度、創(chuàng)造力)有較高要求的應用場合。例如,在構建金融咨詢聊天機器人時,開發(fā)團隊不僅希望模型能夠提供專業(yè)且準確的財務建議,還期望它能保持友好和易于理解的溝通方式。
此時就可以利用偏好微調方法,向模型展示多種不同的對話示例,直至找到最理想的表達方式為止。這種方法確實能夠顯著改善模型的表現(xiàn),尤其是在涉及主觀評價的任務上,客戶服務或個性化推薦系統(tǒng)。
另外,偏好微調不僅僅局限于文本生成任務,同樣適用于其他類型的輸出,如圖像生成、代碼補全等。通過對大量樣例的學習,模型可以逐漸形成一套穩(wěn)定的行為模式,以更好地滿足用戶需求。更重要的是,這種微調方式允許持續(xù)迭代和改進,隨著更多高質量數(shù)據(jù)的積累,模型的表現(xiàn)也會隨之提高。
目前,這些API已經(jīng)普遍可用,更詳細內容可以去OpenAI開發(fā)論壇查看。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。