中國品牌,讓東南亞感受“消費(fèi)升級”小紅書本地“坐抖望團(tuán)”CrowdStrike“全球滅霸響指”事件后續(xù),德國 10% 企業(yè)更換安全供應(yīng)商導(dǎo)致 1TB 數(shù)據(jù)泄露后,迪士尼宣布棄用 Slack 平臺合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫像”平臺,加速數(shù)字化轉(zhuǎn)型重慶:力爭今年智能網(wǎng)聯(lián)新能源汽車產(chǎn)量突破 100 萬輛,到 2027 年建成萬億級產(chǎn)業(yè)集群微信iOS最新版上線:iPhone用戶可在朋友圈發(fā)實況照片了蘋果有線耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚相關(guān)搜索量暴漲384%2024 vivo開發(fā)者大會官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來了,阿里云「通義靈碼」全面進(jìn)化,全流程開發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷量及銷售額領(lǐng)先鴻蒙PC要來了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國AR/VR出貨23.3萬臺,同比下滑了 29.1%IDC:2024 上半年中國 AR / VR 頭顯出貨 23.3 萬臺,同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專利探索AR技術(shù)新應(yīng)用:檢測屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個運(yùn)行時安全解決方案,實現(xiàn)從代碼到云的全面軟件完整性和可追溯性
  • 阿里媽媽給出了什么樣的賽題,被頂會NeurIPS 2024 pick了?

    2024年07月15日 15:02:15   來源:機(jī)器之心公眾號

      在眾多人工智能頂會中,NeurIPS 屬于什么段位?有人將其代入《甄嬛傳》宇宙做了張圖:大概配享「后位」。

      這一排名可能存在爭議,但毋庸置疑的是,NeurIPS 在 AI 頂會中始終穩(wěn)居前三,并且長期處于 Google Scholar 全球所有學(xué)科期刊、頂會的前十名。

      因此,能夠在這一會議中發(fā)表論文是眾多 AI 研究者的共同目標(biāo)。開創(chuàng)性的 AlexNet、Transformer、GPT-3論文都是該頂會的接收論文。

      但值得注意的是,論文并不能代表 NeurIPS 的全部價值,會議期間舉辦的一些競賽可能更適合一些專注于 AI 實踐的研究者、工程師。連 NeurIPS 官方也說,「這些競賽在研究和解決復(fù)雜問題方面發(fā)揮著重要作用」。

      那這些競賽去哪里找呢?其實,NeurIPS 官方在6月份就發(fā)布了一篇博客,專門給出了這些競賽的列表。

      該列表總共包含16個賽題,每個賽題都經(jīng)過了層層篩選,具有大會要求的「廣泛的科學(xué)研究價值」。

      這些賽題由 NeurIPS 官方征集而來。以往年的經(jīng)驗來看,能最終入選的賽題絕大部分來自高校、研究機(jī)構(gòu)或者 Google、OpenAI、Meta 等國外科技公司,國內(nèi)工業(yè)界提報的賽題入選幾率極低。今年,由于大模型賽道火熱,賽題競爭更為激烈。

      但令人驚喜的是,在如此激烈的競爭環(huán)境下,國內(nèi)工業(yè)界依然有人脫穎而出,列表中的「Auto-Bidding in Large-Scale Auctions: Learning Decision-Making in Uncertain and Competitive Games(大規(guī)模拍賣中的自動出價:不確定和競爭博弈中的學(xué)習(xí)決策)」便是他們提報的賽題。

      該賽題由北大 - 阿里媽媽人工智能創(chuàng)新聯(lián)合實驗室(PAAI)中的決策智能方向合作團(tuán)隊產(chǎn)出,阿里媽媽決策智能技術(shù)團(tuán)隊作為第一單位同北京大學(xué)鄧小鐵教授、盧宗青教授研究團(tuán)隊聯(lián)合提報。在賽題入選后,阿里媽媽拿到了這一比賽的主辦權(quán),成為國內(nèi)工業(yè)界今年唯一一家獲得 NeurIPS 比賽主辦權(quán)的組織。

      賽題圍繞「大規(guī)模拍賣中的自動出價」問題展開。該問題與我們每天打開購物 APP,搜索、瀏覽商品的界面息息相關(guān),背后蘊(yùn)藏著巨大的研究和商業(yè)價值。NeurIPS 專家評委給賽題的評價是「Practically important, well organized, and well tested(實際意義重大,組織良好,測試良好)」。

      那么,「大規(guī)模拍賣中的自動出價」是個什么問題?為什么會由北大 - 阿里媽媽人工智能創(chuàng)新聯(lián)合實驗室提出并且獲得了如此高的評價?參賽者具體要做什么?機(jī)器之心將在這篇文章中一一拆解。

      什么是「大規(guī)模拍賣中的自動出價」?

      要理解什么是「大規(guī)模拍賣中的自動出價」,我們先回憶一下打開淘寶開始購物的經(jīng)歷。

      每次你輸入一個關(guān)鍵詞,系統(tǒng)都會彈出一個商品頁面。其實,這個頁面大有講究:哪些商品會出現(xiàn),哪個商品排在前面都是系統(tǒng)精密計算的結(jié)果,其中的廣告是平臺運(yùn)行拍賣機(jī)制把廣告位分配給廣告主的結(jié)果。

      整個過程的運(yùn)行邏輯如下:首先,平臺會通過分析用戶的興趣和行為模式來構(gòu)建用戶畫像。當(dāng)用戶在淘寶上進(jìn)行搜索或瀏覽商品時,平臺會立即在后臺啟動廣告拍賣流程。廣告主們通過競價機(jī)制參與到這場拍賣中,希望能夠讓自己的廣告獲得展示機(jī)會。自動出價系統(tǒng)在這個過程中發(fā)揮著核心作用,它綜合考慮用戶的畫像、行為數(shù)據(jù)、廣告主的推廣目標(biāo)、預(yù)算限制,以及拍賣環(huán)境中的多種因素,實時計算出最優(yōu)化的出價策略。平臺會根據(jù)這些數(shù)據(jù)和計算結(jié)果,選擇出價最高且與用戶需求最相關(guān)的廣告。這些廣告結(jié)果會和自然結(jié)果一起展現(xiàn)給用戶。整個過程完全自動化,能在極短的時間內(nèi)完成。

      從這個過程可以看出,通過自動出價系統(tǒng),廣告主能夠大大簡化廣告投放的流程,利用人工智能技術(shù)實現(xiàn)精準(zhǔn)營銷,從而節(jié)省時間和精力。

      2023年,全球線上廣告市場規(guī)模已經(jīng)達(dá)到6268億美元。自動出價技術(shù)對于推動其持續(xù)增長至關(guān)重要。類似的研究問題還有廣告投放策略和其他機(jī)制設(shè)計,它們都屬于決策智能的研究范疇。決策智能相關(guān)研究可以為企業(yè)帶來新的運(yùn)營方式,在決策機(jī)制上降低對人的依賴,從而顯著提企高業(yè)的收益增長速度,提升企業(yè)成長空間。

      不過,要做好賽題中的「自動出價」并不容易。因為自動出價系統(tǒng)需應(yīng)對龐大且復(fù)雜的數(shù)據(jù)洪流,涵蓋用戶行為數(shù)據(jù)、廣告數(shù)據(jù)、競價數(shù)據(jù)等多維度信息,而且這些數(shù)據(jù)會實時更新。此外,系統(tǒng)還需在一個充滿不確定性的博弈環(huán)境中進(jìn)行決策,無法獲得所有影響因素的完整信息。因此,系統(tǒng)只能依賴于當(dāng)前可用的數(shù)據(jù)和累積的歷史經(jīng)驗,通過智能算法進(jìn)行預(yù)測和決策,力求在瞬息萬變的市場環(huán)境中做出最優(yōu)的出價選擇。

      「自動出價」優(yōu)化之路

      從強(qiáng)化學(xué)習(xí)到生成式 AI

      總體來看,整個出價領(lǐng)域業(yè)界的方法經(jīng)歷了四代演化。在自動出價策略的優(yōu)化上,阿里媽媽也進(jìn)行了多年的研究。

      第一代:經(jīng)典控制類。把效果最大化的優(yōu)化問題間接轉(zhuǎn)化為預(yù)算消耗的控制問題;跇I(yè)務(wù)數(shù)據(jù)計算消耗曲線,控制預(yù)算盡可能按照設(shè)定的曲線來消耗。PID 及相關(guān)改進(jìn)是這一階段常用的控制算法。當(dāng)競價流量價值分布穩(wěn)定的情況下,這類算法能基本滿足業(yè)務(wù)上線之初的效果優(yōu)化。

      第二代:規(guī)劃求解類。相比于第一代,規(guī)劃求解類(LP)算法直接面向目標(biāo)最大化來進(jìn)行求解。可基于前一天的參競流量來預(yù)測當(dāng)前未來流量集合,從而求解出價參數(shù)。自動出價問題根據(jù)當(dāng)前已投放的數(shù)據(jù)變成新的子問題,因此可多次持續(xù)地用該方法進(jìn)行求解,即 Online LP。這類方法依賴對未來參競流量的精準(zhǔn)預(yù)估,因此在實際場景落地時需要在未來流量的質(zhì)和量的預(yù)測上做較多的工作。

      第三代:強(qiáng)化學(xué)習(xí)類。現(xiàn)實環(huán)境中在線競價環(huán)境是非常復(fù)雜且動態(tài)變化的,未來的流量集合也是難以精準(zhǔn)預(yù)測的,要統(tǒng)籌整個預(yù)算周期投放才能最大化效果。作為典型的序列決策問題,第三階段用強(qiáng)化學(xué)習(xí)類方法來優(yōu)化自動出價策略。其迭代過程從早期的經(jīng)典強(qiáng)化學(xué)習(xí)方法落地,到進(jìn)一步基于 Offline RL 方法逼近「在線真實環(huán)境的數(shù)據(jù)分布」,再到末期貼近問題本質(zhì)基于 Online RL 方法實現(xiàn)和真實競價環(huán)境的交互學(xué)習(xí)。

      第四代:生成模型類。以 ChatGPT 為代表的生成式大模型以洶涌澎湃之勢到來,在多個領(lǐng)域都表現(xiàn)出令人驚艷的效果。新的技術(shù)理念和技術(shù)范式可能會給自動出價算法帶來革命性的升級。阿里媽媽技術(shù)團(tuán)隊提前布局,以智能營銷決策大模型 AIGA(AI Generated Action)為核心重塑了廣告智能營銷的技術(shù)體系,并衍生出以 AIGB(AI Generated Bidding)為代表的自動出價策略。

      在業(yè)界的最新研究處于第三代時(2022年),北大 - 阿里媽媽人工智能創(chuàng)新聯(lián)合實驗室(PAAI)成立。這個實驗室集齊了產(chǎn)業(yè)界和學(xué)術(shù)界的多位大牛:北京大學(xué)智能學(xué)院院長朱松純教授領(lǐng)銜學(xué)術(shù)指導(dǎo),北京大學(xué)講席教授小鐵、北大智能學(xué)院副教授宋國杰和阿里媽媽技術(shù)負(fù)責(zé)人鄭波都是實驗室的核心成員。幾位大牛帶領(lǐng)實驗室在已有成果的基礎(chǔ)上繼續(xù)研究自動出價等決策智能問題。

      在研究過程中,他們發(fā)現(xiàn),原有的強(qiáng)化學(xué)習(xí)方法存在一些局限,比如在自動出價這種長序列決策場景下會有訓(xùn)練誤差累積過多的問題。與此同時,ChatGPT 在多個領(lǐng)域正在驗證生成式 AI 的強(qiáng)大能力。于是,該團(tuán)隊開始思考,生成式模型能夠給自動出價策略帶來什么?最終,他們提出了一種基于生成式模型構(gòu)造的出價策略優(yōu)化方案 ——AIGB(AI Generative Bidding)。

      具體來說,AIGB 將出價、優(yōu)化目標(biāo)和約束等具備相關(guān)性的指標(biāo)視為一個聯(lián)合概率分布,從而將出價問題轉(zhuǎn)化為了條件分布生成問題。與強(qiáng)化學(xué)習(xí)的視角不同,它直接關(guān)聯(lián)決策軌跡和回報信息(如下圖所示),能夠避免訓(xùn)練誤差累積,更適合長序列決策場景。這是聯(lián)合實驗室率先將生成式大模型應(yīng)用在智能出價領(lǐng)域的一次嘗試,相關(guān)論文已被國際頂會 KDD2024接收。

      當(dāng)然,「大規(guī)模拍賣中的自動出價」等決策智能問題遠(yuǎn)未解決,生成式 AI 在這些問題中的應(yīng)用也才剛剛進(jìn)入嘗試階段。因此,聯(lián)合實驗室就向 NeurIPS 提報了相關(guān)賽題,期望借助多年的研究積累,匯聚社區(qū)的力量,共同推動這些問題的深入研究與解決。

      除了商業(yè)價值,這些問題本身也有很高的研究價值。因為決策智能整合了人工智能、數(shù)據(jù)科學(xué)和博弈論等學(xué)科,提供了系統(tǒng)化框架來解決復(fù)雜問題。這促進(jìn)了跨學(xué)科融合,推動了計算機(jī)科學(xué)、統(tǒng)計學(xué)和經(jīng)濟(jì)學(xué)等領(lǐng)域的創(chuàng)新與合作。

      AIGB、通用兩大賽道

      報名已開啟

      「大規(guī)模拍賣中的自動出價」賽題總共分為兩個賽道,分別是:

      AIGB 賽道:利用生成式模型學(xué)習(xí)自動出價 Agent

      通用賽道:含不確定性的自動出價

      在 AIGB 賽道,參賽者需要思考如何針對長序列做精準(zhǔn)的出價決策。前面提到,傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法在面對這一問題時會受到誤差累積等因素的限制,性能表現(xiàn)受限,而廣義的生成模型在這一任務(wù)上表現(xiàn)出了較大的潛力。因此,這個本賽道要求參賽者采用廣泛的生成式模型,如 Diffusion Models、Transformers 等,來應(yīng)對這一挑戰(zhàn)。如果你有 Diffusion Models、Transformers、Foundation Models、大型語言模型(LLMs)及其他生成方法的研究或從業(yè)背景,可以考慮報名該賽道。

      在通用賽道,參賽選手面臨的挑戰(zhàn)是在大規(guī)模拍賣中做出有效的出價決策,這需要有效地感知競爭對手策略的變化。真實世界中復(fù)雜的廣告拍賣環(huán)境帶來了額外的挑戰(zhàn),即不確定性。參與者必須考慮消費(fèi)者到達(dá)的隨機(jī)性、轉(zhuǎn)化行為預(yù)測的方差、數(shù)據(jù)稀疏性及其他因素。如果你有強(qiáng)化學(xué)習(xí)、優(yōu)化、機(jī)器學(xué)習(xí)、博弈論和數(shù)據(jù)科學(xué)的研究或從業(yè)背景,可以考慮報名該賽道。

      參加本次比賽將帶來眾多收獲。NeurIPS具有極高的國際影響力,在比賽中取得優(yōu)異成績,對于你的個人簡歷無疑是個加分項,將非常有助于未來的職業(yè)發(fā)展。此外,優(yōu)勝者還有機(jī)會贏得6000美元的賽事獎金,以及阿里巴巴的實習(xí)機(jī)會、校招綠色通道以及訪問學(xué)者資格。

      本次比賽也將首次公開約5億條博弈數(shù)據(jù)及相應(yīng)的訓(xùn)練框架,如此大規(guī)模的博弈數(shù)據(jù)在業(yè)界非常少見。這對于決策智能、強(qiáng)化學(xué)習(xí)、博弈和生成式模型等領(lǐng)域的研究者和從業(yè)者來說,都是一次很好的實踐和研究機(jī)會。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    TCL實業(yè)榮獲IFA2024多項大獎,展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)成功斬獲兩項“IFA全球產(chǎn)品設(shè)計創(chuàng)新大獎”金獎,有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實業(yè)斬獲多項AWE 2024艾普蘭獎

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。