大模型能否將AI智能化學(xué)習(xí)推向新紀(jì)元？

2023年05月24日 15:14:51 來源：多鯨資本

　　1956 年 8 月，在美國韓諾斯小鎮(zhèn)達(dá)特茅斯學(xué)院中，約翰·麥卡錫等 5 名科學(xué)家聚在一起，討論著一個不食人間煙火的主題：用機(jī)器人來模仿人類學(xué)習(xí)以及其他方面的智能。

　　1956 年也就成為了人工智能元年。

　　當(dāng)人工智能走過了 67 年的發(fā)展歷程，一場以「大規(guī)模 GPT 」為產(chǎn)業(yè)賽道的「大戰(zhàn) 」一觸即發(fā)。2023 年 4 月是中國大模型「狂飆」的關(guān)鍵月，前有華為、高湯的大模型發(fā)布，后有科大訊飛星火認(rèn)知大模型在眾行業(yè)的廣泛鏈接......一時間，整個產(chǎn)業(yè)圈爭先恐后，資本市場風(fēng)起云涌。

　　5 月初，大型教育企業(yè)先后競相推出教育相關(guān)大模型產(chǎn)品，希望借由 AI 大模型技術(shù)，革新傳統(tǒng)的教育模式。其中包括，學(xué)而思面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)進(jìn)行的數(shù)學(xué)大模型 MathGPT 的研發(fā);科大訊飛公布其自研的星火認(rèn)知大模型等。陣勢如此之大，大模型會將智能化學(xué)習(xí)領(lǐng)域應(yīng)用推向新紀(jì)元嗎?

　　大模型「狂飆」時代到來

　　2022 年末，Open AI 的「 ChatGPT 」宣告誕生，作為人工智能研發(fā)領(lǐng)域的「新物種」，引起國內(nèi)外人工智能產(chǎn)業(yè)界的軒然大波，隨后不到四個月的時間，一場「大模型之戰(zhàn) 」席卷而來。據(jù)不完全統(tǒng)計，目前國內(nèi)已有 30 多個研發(fā)機(jī)構(gòu)和企業(yè)紛紛推出自己的大模型產(chǎn)品，這自然少不了百度、阿里云等大公司參與其中。

　　中國社科院王宗琦教授指出，以大規(guī)模生成式語言模型為發(fā)展方向的研發(fā)與應(yīng)用，可以在某一特定領(lǐng)域產(chǎn)生效率，但在需要強(qiáng)大邏輯推理能力的數(shù)學(xué)、醫(yī)學(xué)等領(lǐng)域會有明顯欠缺與不足，不論人工智能發(fā)展到何種程度，用在學(xué)科學(xué)習(xí)上，不僅需要大模型語言處理的能力，更需要其在數(shù)學(xué)學(xué)習(xí)中所具備的精細(xì)、準(zhǔn)確的邏輯推理能力。

　　我們不難發(fā)現(xiàn)，國內(nèi)各大企業(yè)發(fā)布的大模型產(chǎn)品，大部分的開展方向多集中在通用語言模型上，有報道稱，這種模型更像是一個「文科生」，在語言翻譯、摘要、理解和生成等任務(wù)上有出色的表現(xiàn)，但在數(shù)學(xué)問題的解決、講解、問答和推薦方面則存在明顯不足。

　　大語言模型在文學(xué)創(chuàng)作、商業(yè)文案寫作、中文理解等使用場景能力突出，甚至在意圖理解力以及回答準(zhǔn)確性、流暢性上都接近人類水平，但想在數(shù)學(xué)領(lǐng)域具備批判性思考的能力和使用科學(xué)方法去解決問題的能力，仍需研發(fā)新的大模型。

　　據(jù)悉，學(xué)而思正在進(jìn)行自研數(shù)學(xué)大模型 MathGPT 的研發(fā)，面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)，以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心，在復(fù)雜邏輯條件下，完成數(shù)學(xué)學(xué)習(xí)多步驟推理任務(wù)，該項研發(fā)目前已經(jīng)取得階段性成果，并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應(yīng)用。因此，學(xué)而思已經(jīng)啟動在美國硅谷的團(tuán)隊建設(shè)，將成立一支海外算法和工程團(tuán)隊，在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。

　　由于大語言模型的推理與計算能力有限，因此 MathGPT 需要結(jié)合大語言模型和計算引擎兩者的能力，大語言模型需要理解題目、分步解析，并在合適的步驟自行調(diào)用計算引擎。據(jù)了解，數(shù)學(xué)大模型 MathGPT 的研發(fā)需要極其巨大的計算資源和大量的數(shù)據(jù)，以及更加復(fù)雜的算法和技術(shù)，學(xué)而思之所以用自己在數(shù)學(xué)和 AI 上的多年積累，面向全球范圍內(nèi)的數(shù)學(xué)愛好者和科研機(jī)構(gòu)，進(jìn)行數(shù)學(xué)大模型的研發(fā)，最終是希望通過 MathGPT 攻克數(shù)學(xué)學(xué)習(xí)和科學(xué)研究上存在的「解題出現(xiàn)錯誤、解題步驟不穩(wěn)定、解題方法機(jī)械化」等諸多的問題。

　　著名教育家、課程專家李靜純先生認(rèn)為，過去幾年我國數(shù)學(xué)教學(xué)一直沒放棄對數(shù)學(xué)建模的探索與實踐，但仍然停留在數(shù)學(xué)建模思想的探索范疇，實際應(yīng)用并未取得突破性進(jìn)展。建立數(shù)學(xué)大模型的過程是把錯綜復(fù)雜的實際問題轉(zhuǎn)化為合理的數(shù)學(xué)結(jié)構(gòu)的問題，數(shù)學(xué)大模型是一種數(shù)學(xué)的思考方法。數(shù)學(xué)的特點不僅在于概念的抽象性、邏輯的嚴(yán)密性、結(jié)論的明確性和體系的完整性，而在于它應(yīng)用的廣泛性。特別是現(xiàn)在，各種實際應(yīng)用的題目越來越多，這就需要建立數(shù)學(xué)大模型。

　　專家認(rèn)為，數(shù)學(xué)大模型強(qiáng)調(diào)如何把實際問題轉(zhuǎn)化為數(shù)學(xué)問題，學(xué)生需要應(yīng)用數(shù)學(xué)思維、數(shù)學(xué)邏輯及相關(guān)知識對實際問題進(jìn)行研究并經(jīng)過計算，進(jìn)而解決這些問題，得出反映實際問題的最佳數(shù)學(xué)模型及模型最優(yōu)解。因此，在數(shù)學(xué)學(xué)習(xí)中融入數(shù)學(xué)大模型思想，鼓勵學(xué)生參與數(shù)學(xué)大模型的理論與實踐相結(jié)合，不但可以使學(xué)生學(xué)以致用，做到理論聯(lián)系實際，而且還會使他們感受到數(shù)學(xué)的生機(jī)與活力，激發(fā)求知的興趣和探索的欲望，數(shù)學(xué)修養(yǎng)自然而然得以培養(yǎng)及提高。

　　會解數(shù)學(xué)題的GPT如何誕生?

　　「 ChatGPT 」橫空出世，意味著人工智能迎來前所未有的技術(shù)革命，但研發(fā)大模型產(chǎn)品并非易事，又有多少企業(yè)具備數(shù)據(jù)、算力、人力、財力的條件和優(yōu)勢?大模型產(chǎn)品能否贏得市場，不僅要擁有豐富的行業(yè)知識和數(shù)據(jù)，而且最關(guān)鍵的還要靠全面的開源技術(shù)體系作支撐;所以，有人說「大模型」是屬于「大公司」的「盛宴」。

　　對于國內(nèi)掀起的「大模型」產(chǎn)業(yè)風(fēng)暴，復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點實驗室主任肖仰華指出，大模型的誕生宣告了整個人工智能進(jìn)入全新的重工業(yè)時代，人類歷史上技術(shù)革命歷經(jīng)數(shù)次突破和發(fā)展，已經(jīng)從相對低級的「手工作坊」模式最終形成了成熟的重工業(yè)發(fā)展模式，而今天的大模型產(chǎn)業(yè)發(fā)展有三個鮮明的特征：大模型、大算力和大數(shù)據(jù)。

　　據(jù)了解，當(dāng)前我國大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)方面是有優(yōu)勢的，在算力方面是有所缺乏的，是短期之內(nèi)難以跟上或者超越的。有專家認(rèn)為，隨著大模型參數(shù)量的持續(xù)增長，大模型對于算力的需求越來越迫切。算力已經(jīng)成為大模型玩家的準(zhǔn)入門檻，已經(jīng)成為制約大模型發(fā)展的主要瓶頸，這是需要付出巨大代價進(jìn)行摸索的。

　　大模型產(chǎn)業(yè)的發(fā)展與競爭，歸根結(jié)底是算力的競爭，絕大多數(shù)大模型玩家都缺乏算力，靠買算力支撐大模型產(chǎn)品的研發(fā)。而如今，從某種程度上來看，學(xué)而思已經(jīng)完全實現(xiàn)了算力自主自控，為今天學(xué)而思啟動大模型 MathGPT 的研發(fā)，提供了充分的開源算法體系的支持。

　　學(xué)而思數(shù)學(xué)大模型 MathGPT 究竟會對全球數(shù)學(xué)愛好者和科研機(jī)構(gòu)帶來怎樣的影響?有報道稱，數(shù)學(xué)大模型 MathGPT，可以用來預(yù)測、分類、聚類、優(yōu)化等各種具有挑戰(zhàn)性的各種任務(wù)，可以運用深度學(xué)習(xí)算法來解決數(shù)學(xué)領(lǐng)域中各種復(fù)雜的問題，提高數(shù)學(xué)學(xué)習(xí)的高效性和準(zhǔn)確性。當(dāng)今數(shù)學(xué)在各個領(lǐng)域蓬勃發(fā)展，應(yīng)用廣泛。學(xué)而思的數(shù)學(xué)大模型 MathGPT 在人工智能新的發(fā)展階段，或許會承擔(dān)更大的使命。大模型產(chǎn)業(yè)所引發(fā)的人工智能變革，才剛剛開始

　　大模型產(chǎn)業(yè)研究與發(fā)展，對社會各行業(yè)的發(fā)展產(chǎn)生了重大的影響，大模型的 AI 技術(shù)廣泛地鏈接到眾行業(yè)(教育、辦公、汽車、數(shù)字員工等)，下沉到更多的應(yīng)用場景，眾行業(yè)因此迎來了全新的變革。有業(yè)界人士認(rèn)為，國內(nèi)大模型的發(fā)展，盡管呈現(xiàn)一片「熱鬧」景象，但也存在令人擔(dān)憂的地方。國內(nèi)人工智能產(chǎn)業(yè)的企業(yè)與研發(fā)機(jī)構(gòu)要清醒地認(rèn)識到，大模型應(yīng)用模式也仍然面臨著若干問題，比如仍存在技術(shù)路線同質(zhì)化嚴(yán)重、數(shù)據(jù)生態(tài)不完善、算力掣肘、模型創(chuàng)新有限等問題。仍需要企業(yè)與研發(fā)機(jī)構(gòu)從數(shù)據(jù)共享、算力協(xié)作、開源生態(tài)、人才培養(yǎng)、評測體系、成本控制、應(yīng)用探索與技術(shù)研究等各方面推動大模型發(fā)展。

　　據(jù)了解，在數(shù)學(xué)領(lǐng)域，目前市場上存在幾個主要流派。比如 Google 收購的 Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計算的 WolframAlpha 等產(chǎn)品，主要利用通用 LLM (大型語言模型)的 AI 技術(shù)加上數(shù)據(jù)庫的方式解決數(shù)學(xué)問題。盡管也產(chǎn)生了很大的變化，但本質(zhì)上只是模型接受了更多數(shù)據(jù)的訓(xùn)練 —— GPT-4 仍然不能保證計算結(jié)果的準(zhǔn)確或給出清晰易懂的推理過程。

　　也就是說，盡管在數(shù)學(xué)領(lǐng)域存在著幾大大模型流派，但在實際應(yīng)用場景中需要的復(fù)雜的決策能力、研判能力、綜合任務(wù)的拆解能力、不確定場景的邏輯推理能力仍十分的欠缺;所以從強(qiáng)大的語言處理能力到復(fù)雜的邏輯推理能力仍需要漫長的摸索的時間。

　　在大型語言模型不斷進(jìn)化的浪潮下，不同的技術(shù)路線選擇孰優(yōu)孰劣，仍有待討論和驗證。學(xué)而思獨立自研的 MathGPT 大模型是否成立，是否能夠超越通用模型在數(shù)學(xué)任務(wù)上的表現(xiàn)，是否更匹配不同人群的數(shù)學(xué)學(xué)習(xí)場景，這個問題還需要在創(chuàng)新實踐中尋找答案。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信