全場景深度思考模型Baichuan-M1-preview發(fā)布：囊括三大推理能力

2025年01月24日 14:13:25 來源：DoNews

　　百川智能發(fā)布了國內(nèi)首個全場景深度思考模型Baichuan-M1-preview。該模型是國內(nèi)目前唯一同時具備語言、視覺和搜索三大領域推理能力的模型。在數(shù)學、代碼等多個權威評測中，Baichuan-M1-preview的表現(xiàn)均超越了o1-preview，展現(xiàn)了其在多領域推理方面的獨特優(yōu)勢。

　　此外，作為國內(nèi)唯一專注醫(yī)療領域的頭部大模型公司推出的深度思考模型，它還解鎖了醫(yī)療循證模式，實現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務，能夠快速、精準地回答醫(yī)療臨床、科研問題。

　　Baichuan-M1-preview現(xiàn)已在百小應中正式上線，在深度思考模式下不僅能準確解答數(shù)學、代碼、邏輯推理等問題，面對復雜醫(yī)療問題，還能像資深醫(yī)療專家一樣，通過深度思考構建嚴謹?shù)尼t(yī)學推理過程，為用戶提供全面的疾病分析和個性化健康管理建議。

　　為了更好地繁榮AI醫(yī)療生態(tài)，助力醫(yī)療事業(yè)發(fā)展，百川智能還同時推出了行業(yè)首個開源醫(yī)療增強大模型Baichuan-M1-14B，其醫(yī)療能力超越了更大參數(shù)量的Qwen2.5-72B，與o1-mini相差無幾。

　　Baichuan-M1-preview多項能力超越o1-preview，解鎖醫(yī)療循證模式

　　作為一個全場景深度思考模型，Baichuan-M1-preview的能力全面，具備強大的語言推理、視覺推理及搜索推理能力。語言推理方面，其在AIME和Math等數(shù)學基準測試，以及LiveCodeBench代碼任務上的成績均超越了o1-preview等模型。

　　視覺推理方面，在MMMU-val、MathVista等權威評測中的成績，超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等國內(nèi)外頭部模型。

　　Baichuan-M1-preview的另一大亮點是解鎖了醫(yī)療循證模式。在面對復雜醫(yī)學問題時，會將專業(yè)可靠的醫(yī)療知識作為推理依據(jù)，幫助用戶做出最佳的醫(yī)療決策。

　　為實現(xiàn)這一能力，百川智能自建了涵蓋億級條目的循證醫(yī)學知識庫，囊括了國內(nèi)外海量醫(yī)學論文、權威指南、專家共識、疾病與癥狀解析、藥品說明等專業(yè)醫(yī)療內(nèi)容，且以天為單位進行動態(tài)更新，及時收錄醫(yī)療領域的新突破、新進展。

　　眾所周知，醫(yī)學知識多樣性強、因果關系復雜。因此，即使構建了龐大的醫(yī)療知識庫，在調(diào)用其中的醫(yī)學知識，尤其疊加了互聯(lián)網(wǎng)上搜索到的醫(yī)療信息時依然會遇到部分醫(yī)學數(shù)據(jù)、醫(yī)學理論不一致的情況。

　　針對這一問題，醫(yī)療循證模式能運用醫(yī)學知識和證據(jù)評估標準，對證據(jù)進行多層分級，并對不同權威等級的證據(jù)進行專業(yè)分析與整合，精準識別各類權威信息的來源和可信度，從而避免因信息混雜導致的誤判，然后基于這些醫(yī)學證據(jù)進行可靠、準確的醫(yī)學推理，最終提供可信賴的醫(yī)療答案。

　　通過“醫(yī)療循證模式”，Baichuan-M1-preview實現(xiàn)了從證據(jù)檢索到深度推理的完整端到端服務，能夠有效地解決醫(yī)療場景中信息過載、不確定性和碎片化等痛點。無論是醫(yī)生面對復雜病案，還是患者尋求權威建議，它都能通過“擺事實、講道理”的循證方式提供言之有物、有理有據(jù)的解答。不僅能在臨床場景中幫助醫(yī)生提升診療效率，在醫(yī)學科研場景中大幅縮短科研探索時間，還能幫助普通用戶更好地理解自身健康狀況，幫助患者科學管理生活方式，提升治療效果。

　　行業(yè)首個開源醫(yī)療增強通用大模型，Baichuan-M1-14B醫(yī)療能力超越Qwen2.5-72B

　　為了推動AI技術在醫(yī)療領域的創(chuàng)新發(fā)展，增強AI醫(yī)療技術的透明度和可信性，提高醫(yī)療服務的可及性，繁榮AI醫(yī)療生態(tài)，百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

　　作為行業(yè)首個開源醫(yī)療增強通用大模型Baichuan-M1-14B的表現(xiàn)非常優(yōu)異，不僅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等權威醫(yī)學知識和臨床能力評測上的成績超越了更大參數(shù)量的Qwen2.5-72B-Instruct，并且與o1-mini也相差無幾。

　　為了提升Baichuan-M1-14B的醫(yī)療能力，百川智能多管齊下：數(shù)據(jù)構建方面，面向細分醫(yī)療場景，收集了萬億級 token 的嚴肅醫(yī)療數(shù)據(jù)，涵蓋了千萬級的中/英文專業(yè)醫(yī)療論文、院內(nèi)真實中/英文醫(yī)療病例，億級的醫(yī)療問答、醫(yī)療問診、臨床數(shù)據(jù)等，還對全網(wǎng)數(shù)據(jù)進行了包括醫(yī)療科室、醫(yī)療內(nèi)容以及醫(yī)療價值在內(nèi)的分類評估，確保模型能學習到有價值且全面的醫(yī)療知識。

　　在此基礎上，百川智能還針對病例、醫(yī)學教材、醫(yī)學指南等不同類別的高質(zhì)量醫(yī)療數(shù)據(jù)生成了超千億 token 的多樣化數(shù)據(jù)，包含了醫(yī)療復雜決策推理鏈條、決策依據(jù)以及問答對等多樣化形式。這些合成數(shù)據(jù)擁有豐富的知識呈現(xiàn)形式以及與醫(yī)生一致的思維過程，進一步強化了Baichuan-M1-14B的醫(yī)學知識能力和醫(yī)療推理能力。

　　進入到模型訓練階段，百川智能運用行業(yè)首創(chuàng)的多階段領域提升方案，將整個訓練過程分為通識提升、醫(yī)療基礎知識提升、醫(yī)療進階知識提升三個階段，依次提升模型的基礎語言、高階及疑難病癥應對等能力。此外還在 CoT 訓練框架中創(chuàng)新的引入了ELO強化學習法，優(yōu)化思維鏈路徑，避免傳統(tǒng)獎勵模型偏差，有效提升了模型的生成質(zhì)量與邏輯推理能力。

　　Baichuan-M1-preview是百川智能在AI醫(yī)療領域的又一次重要突破，為其實現(xiàn)“造醫(yī)生、改路徑、促醫(yī)學”的AI醫(yī)療愿景提供了有力支撐。于此同時，Baichuan-M1-14B開源模型則為中國AI醫(yī)療健康生態(tài)建設提供了強大助力。百川智能不僅希望加速AI技術在醫(yī)療領域的廣泛應用，更旨在激發(fā)更多創(chuàng)新力量，共同推動中國醫(yī)療健康生態(tài)的持續(xù)進步，助力實現(xiàn)更公平、更高效的高質(zhì)量醫(yī)療服務。

　　文章內(nèi)容僅供閱讀，不構成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信