1956 年 8 月,在美國韓諾斯小鎮(zhèn)達(dá)特茅斯學(xué)院中,約翰·麥卡錫等 5 名科學(xué)家聚在一起,討論著一個不食人間煙火的主題:用機(jī)器人來模仿人類學(xué)習(xí)以及其他方面的智能。
1956 年也就成為了人工智能元年。
當(dāng)人工智能走過了 67 年的發(fā)展歷程,一場以「 大規(guī)模 GPT 」為產(chǎn)業(yè)賽道的「 大戰(zhàn) 」一觸即發(fā)。2023 年 4 月是中國大模型「 狂飆 」的關(guān)鍵月,前有華為、高湯的大模型發(fā)布,后有科大訊飛星火認(rèn)知大模型在眾行業(yè)的廣泛鏈接......一時間,整個產(chǎn)業(yè)圈爭先恐后,資本市場風(fēng)起云涌。
5 月初,大型教育企業(yè)先后競相推出教育相關(guān)大模型產(chǎn)品,希望借由 AI 大模型技術(shù),革新傳統(tǒng)的教育模式。其中包括,學(xué)而思面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)進(jìn)行的數(shù)學(xué)大模型 MathGPT 的研發(fā);科大訊飛公布其自研的星火認(rèn)知大模型等。陣勢如此之大,大模型會將智能化學(xué)習(xí)領(lǐng)域應(yīng)用推向新紀(jì)元嗎?
大模型「狂飆」時代到來
2022 年末,Open AI 的「 ChatGPT 」宣告誕生,作為人工智能研發(fā)領(lǐng)域的「 新物種 」,引起國內(nèi)外人工智能產(chǎn)業(yè)界的軒然大波,隨后不到四個月的時間,一場「 大模型之戰(zhàn) 」席卷而來。據(jù)不完全統(tǒng)計,目前國內(nèi)已有 30 多個研發(fā)機(jī)構(gòu)和企業(yè)紛紛推出自己的大模型產(chǎn)品,這自然少不了百度、阿里云等大公司參與其中。
中國社科院王宗琦教授指出,以大規(guī)模生成式語言模型為發(fā)展方向的研發(fā)與應(yīng)用,可以在某一特定領(lǐng)域產(chǎn)生效率,但在需要強(qiáng)大邏輯推理能力的數(shù)學(xué)、醫(yī)學(xué)等領(lǐng)域會有明顯欠缺與不足,不論人工智能發(fā)展到何種程度,用在學(xué)科學(xué)習(xí)上,不僅需要大模型語言處理的能力,更需要其在數(shù)學(xué)學(xué)習(xí)中所具備的精細(xì)、準(zhǔn)確的邏輯推理能力。
我們不難發(fā)現(xiàn),國內(nèi)各大企業(yè)發(fā)布的大模型產(chǎn)品,大部分的開展方向多集中在通用語言模型上,有報道稱,這種模型更像是一個「 文科生 」,在語言翻譯、摘要、理解和生成等任務(wù)上有出色的表現(xiàn),但在數(shù)學(xué)問題的解決、講解、問答和推薦方面則存在明顯不足。
大語言模型在文學(xué)創(chuàng)作、商業(yè)文案寫作、中文理解等使用場景能力突出,甚至在意圖理解力以及回答準(zhǔn)確性、流暢性上都接近人類水平,但想在數(shù)學(xué)領(lǐng)域具備批判性思考的能力和使用科學(xué)方法去解決問題的能力,仍需研發(fā)新的大模型。
據(jù)悉,學(xué)而思正在進(jìn)行自研數(shù)學(xué)大模型 MathGPT 的研發(fā),面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,在復(fù)雜邏輯條件下,完成數(shù)學(xué)學(xué)習(xí)多步驟推理任務(wù),該項研發(fā)目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應(yīng)用。因此,學(xué)而思已經(jīng)啟動在美國硅谷的團(tuán)隊建設(shè),將成立一支海外算法和工程團(tuán)隊,在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。
由于大語言模型的推理與計算能力有限,因此 MathGPT 需要結(jié)合大語言模型和計算引擎兩者的能力,大語言模型需要理解題目、分步解析,并在合適的步驟自行調(diào)用計算引擎。據(jù)了解,數(shù)學(xué)大模型 MathGPT 的研發(fā)需要極其巨大的計算資源和大量的數(shù)據(jù),以及更加復(fù)雜的算法和技術(shù),學(xué)而思之所以用自己在數(shù)學(xué)和 AI 上的多年積累,面向全球范圍內(nèi)的數(shù)學(xué)愛好者和科研機(jī)構(gòu),進(jìn)行數(shù)學(xué)大模型的研發(fā),最終是希望通過 MathGPT 攻克數(shù)學(xué)學(xué)習(xí)和科學(xué)研究上存在的「 解題出現(xiàn)錯誤、解題步驟不穩(wěn)定、解題方法機(jī)械化 」等諸多的問題。
著名教育家、課程專家李靜純先生認(rèn)為,過去幾年我國數(shù)學(xué)教學(xué)一直沒放棄對數(shù)學(xué)建模的探索與實踐,但仍然停留在數(shù)學(xué)建模思想的探索范疇,實際應(yīng)用并未取得突破性進(jìn)展。建立數(shù)學(xué)大模型的過程是把錯綜復(fù)雜的實際問題轉(zhuǎn)化為合理的數(shù)學(xué)結(jié)構(gòu)的問題,數(shù)學(xué)大模型是一種數(shù)學(xué)的思考方法。數(shù)學(xué)的特點不僅在于概念的抽象性、邏輯的嚴(yán)密性、結(jié)論的明確性和體系的完整性,而在于它應(yīng)用的廣泛性。特別是現(xiàn)在,各種實際應(yīng)用的題目越來越多,這就需要建立數(shù)學(xué)大模型。
專家認(rèn)為,數(shù)學(xué)大模型強(qiáng)調(diào)如何把實際問題轉(zhuǎn)化為數(shù)學(xué)問題,學(xué)生需要應(yīng)用數(shù)學(xué)思維、數(shù)學(xué)邏輯及相關(guān)知識對實際問題進(jìn)行研究并經(jīng)過計算,進(jìn)而解決這些問題,得出反映實際問題的最佳數(shù)學(xué)模型及模型最優(yōu)解。因此,在數(shù)學(xué)學(xué)習(xí)中融入數(shù)學(xué)大模型思想,鼓勵學(xué)生參與數(shù)學(xué)大模型的理論與實踐相結(jié)合,不但可以使學(xué)生學(xué)以致用,做到理論聯(lián)系實際,而且還會使他們感受到數(shù)學(xué)的生機(jī)與活力,激發(fā)求知的興趣和探索的欲望,數(shù)學(xué)修養(yǎng)自然而然得以培養(yǎng)及提高。
會解數(shù)學(xué)題的GPT如何誕生?
「 ChatGPT 」橫空出世,意味著人工智能迎來前所未有的技術(shù)革命,但研發(fā)大模型產(chǎn)品并非易事,又有多少企業(yè)具備數(shù)據(jù)、算力、人力、財力的條件和優(yōu)勢?大模型產(chǎn)品能否贏得市場,不僅要擁有豐富的行業(yè)知識和數(shù)據(jù),而且最關(guān)鍵的還要靠全面的開源技術(shù)體系作支撐;所以,有人說「 大模型 」是屬于「 大公司 」的「 盛宴 」。
對于國內(nèi)掀起的「 大模型 」產(chǎn)業(yè)風(fēng)暴,復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點實驗室主任肖仰華指出,大模型的誕生宣告了整個人工智能進(jìn)入全新的重工業(yè)時代,人類歷史上技術(shù)革命歷經(jīng)數(shù)次突破和發(fā)展,已經(jīng)從相對低級的「 手工作坊 」模式最終形成了成熟的重工業(yè)發(fā)展模式,而今天的大模型產(chǎn)業(yè)發(fā)展有三個鮮明的特征:大模型、大算力和大數(shù)據(jù)。
據(jù)了解,當(dāng)前我國大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)方面是有優(yōu)勢的,在算力方面是有所缺乏的,是短期之內(nèi)難以跟上或者超越的。有專家認(rèn)為,隨著大模型參數(shù)量的持續(xù)增長,大模型對于算力的需求越來越迫切。算力已經(jīng)成為大模型玩家的準(zhǔn)入門檻,已經(jīng)成為制約大模型發(fā)展的主要瓶頸,這是需要付出巨大代價進(jìn)行摸索的。
大模型產(chǎn)業(yè)的發(fā)展與競爭,歸根結(jié)底是算力的競爭,絕大多數(shù)大模型玩家都缺乏算力,靠買算力支撐大模型產(chǎn)品的研發(fā)。而如今,從某種程度上來看,學(xué)而思已經(jīng)完全實現(xiàn)了算力自主自控,為今天學(xué)而思啟動大模型 MathGPT 的研發(fā),提供了充分的開源算法體系的支持。
學(xué)而思數(shù)學(xué)大模型 MathGPT 究竟會對全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)帶來怎樣的影響?有報道稱,數(shù)學(xué)大模型 MathGPT,可以用來預(yù)測、分類、聚類、優(yōu)化等各種具有挑戰(zhàn)性的各種任務(wù),可以運用深度學(xué)習(xí)算法來解決數(shù)學(xué)領(lǐng)域中各種復(fù)雜的問題,提高數(shù)學(xué)學(xué)習(xí)的高效性和準(zhǔn)確性。 當(dāng)今數(shù)學(xué)在各個領(lǐng)域蓬勃發(fā)展,應(yīng)用廣泛。學(xué)而思的數(shù)學(xué)大模型 MathGPT 在人工智能新的發(fā)展階段,或許會承擔(dān)更大的使命。大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開始
大模型產(chǎn)業(yè)研究與發(fā)展,對社會各行業(yè)的發(fā)展產(chǎn)生了重大的影響,大模型的 AI 技術(shù)廣泛地鏈接到眾行業(yè)(教育、辦公、汽車、數(shù)字員工等),下沉到更多的應(yīng)用場景,眾行業(yè)因此迎來了全新的變革。有業(yè)界人士認(rèn)為,國內(nèi)大模型的發(fā)展,盡管呈現(xiàn)一片「 熱鬧 」景象,但也存在令人擔(dān)憂的地方。國內(nèi)人工智能產(chǎn)業(yè)的企業(yè)與研發(fā)機(jī)構(gòu)要清醒地認(rèn)識到,大模型應(yīng)用模式也仍然面臨著若干問題,比如仍存在技術(shù)路線同質(zhì)化嚴(yán)重、數(shù)據(jù)生態(tài)不完善、算力掣肘、模型創(chuàng)新有限等問題。仍需要企業(yè)與研發(fā)機(jī)構(gòu)從數(shù)據(jù)共享、算力協(xié)作、開源生態(tài)、人才培養(yǎng)、評測體系、成本控制、應(yīng)用探索與技術(shù)研究等各方面推動大模型發(fā)展。
據(jù)了解,在數(shù)學(xué)領(lǐng)域,目前市場上存在幾個主要流派。比如 Google 收購的 Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計算的 WolframAlpha 等產(chǎn)品,主要利用通用 LLM (大型語言模型)的 AI 技術(shù)加上數(shù)據(jù)庫的方式解決數(shù)學(xué)問題。盡管也產(chǎn)生了很大的變化,但本質(zhì)上只是模型接受了更多數(shù)據(jù)的訓(xùn)練 —— GPT-4 仍然不能保證計算結(jié)果的準(zhǔn)確或給出清晰易懂的推理過程。
也就是說,盡管在數(shù)學(xué)領(lǐng)域存在著幾大大模型流派,但在實際應(yīng)用場景中需要的復(fù)雜的決策能力、研判能力、綜合任務(wù)的拆解能力、不確定場景的邏輯推理能力仍十分的欠缺;所以從強(qiáng)大的語言處理能力到復(fù)雜的邏輯推理能力仍需要漫長的摸索的時間。
在大型語言模型不斷進(jìn)化的浪潮下,不同的技術(shù)路線選擇孰優(yōu)孰劣,仍有待討論和驗證。學(xué)而思獨立自研的 MathGPT 大模型是否成立,是否能夠超越通用模型在數(shù)學(xué)任務(wù)上的表現(xiàn),是否更匹配不同人群的數(shù)學(xué)學(xué)習(xí)場景,這個問題還需要在創(chuàng)新實踐中尋找答案。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。