澳雷朗2024年度業(yè)績穩(wěn)健增長,創(chuàng)新驅(qū)動門店建設與服務升級OpenAI CEO宣布ChatGPT免費版將引入o3-mini,效率翻倍!中國聯(lián)通發(fā)布元景思維鏈大模型:性能超越GPT-4300倍體積縮減!Hugging Face推SmolVLM模型:小巧智能,手機也能跑商務部數(shù)據(jù)顯示已有792萬人申請手機等數(shù)碼購新補貼 用國補買手機上京東元象推出智能數(shù)字人平臺「元象日播」追覓空氣凈化器震撼登場:集成多項創(chuàng)新技術,凈化、送風、制暖三合一!HeyGen推出數(shù)字人運動控制功能 能彈樂器還能跳舞潛在智能泊車故障 小米汽車召回共計30931臺SU7標準版電動汽車AI視頻的2025:“價格戰(zhàn)”打響,哪家大模型最適合“上車”?2025,“出海速度”看數(shù)字化SensorTower發(fā)布2024年中國手游出海收入榜與發(fā)行商收入榜:多款新游增長亮眼人形機器人,自動駕駛“老炮”創(chuàng)業(yè)第二站用AI做智駕的理想汽車,能撐起李想的AI理想嗎?直播間里,藏著毛衫界的「胖東來」中小手型鼠標選購指南,游戲黨春節(jié)電競狂歡必備!大模型進化論:AI產(chǎn)業(yè)落地將卷向何方?B站盈利初實現(xiàn),電商布局再發(fā)力,小店能否成轉機?重磅 | 深睿醫(yī)療完成新一輪近5億融資 聚集全流程全場景AI數(shù)智化全場景深度思考模型Baichuan-M1-preview發(fā)布:囊括三大推理能力
  • 首頁 > 云計算頻道 > 大模型

    全場景深度思考模型Baichuan-M1-preview發(fā)布:囊括三大推理能力

    2025年01月24日 14:13:25   來源:DoNews

      百川智能發(fā)布了國內(nèi)首個全場景深度思考模型Baichuan-M1-preview。該模型是國內(nèi)目前唯一同時具備語言、視覺和搜索三大領域推理能力的模型。在數(shù)學、代碼等多個權威評測中,Baichuan-M1-preview的表現(xiàn)均超越了o1-preview,展現(xiàn)了其在多領域推理方面的獨特優(yōu)勢。

      此外,作為國內(nèi)唯一專注醫(yī)療領域的頭部大模型公司推出的深度思考模型,它還解鎖了醫(yī)療循證模式,實現(xiàn)了從醫(yī)療證據(jù)檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫(yī)療臨床、科研問題。

      Baichuan-M1-preview現(xiàn)已在百小應中正式上線,在深度思考模式下不僅能準確解答數(shù)學、代碼、邏輯推理等問題,面對復雜醫(yī)療問題,還能像資深醫(yī)療專家一樣,通過深度思考構建嚴謹?shù)尼t(yī)學推理過程,為用戶提供全面的疾病分析和個性化健康管理建議。

      為了更好地繁榮AI醫(yī)療生態(tài),助力醫(yī)療事業(yè)發(fā)展,百川智能還同時推出了行業(yè)首個開源醫(yī)療增強大模型Baichuan-M1-14B,其醫(yī)療能力超越了更大參數(shù)量的Qwen2.5-72B,與o1-mini相差無幾。

      Baichuan-M1-preview多項能力超越o1-preview,解鎖醫(yī)療循證模式

      作為一個全場景深度思考模型,Baichuan-M1-preview的能力全面,具備強大的語言推理、視覺推理及搜索推理能力。語言推理方面,其在AIME和Math等數(shù)學基準測試,以及LiveCodeBench代碼任務上的成績均超越了o1-preview等模型。

      視覺推理方面,在MMMU-val、MathVista等權威評測中的成績,超越了GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview等國內(nèi)外頭部模型。

      Baichuan-M1-preview的另一大亮點是解鎖了醫(yī)療循證模式。在面對復雜醫(yī)學問題時,會將專業(yè)可靠的醫(yī)療知識作為推理依據(jù),幫助用戶做出最佳的醫(yī)療決策。

      為實現(xiàn)這一能力,百川智能自建了涵蓋億級條目的循證醫(yī)學知識庫,囊括了國內(nèi)外海量醫(yī)學論文、權威指南、專家共識、疾病與癥狀解析、藥品說明等專業(yè)醫(yī)療內(nèi)容,且以天為單位進行動態(tài)更新,及時收錄醫(yī)療領域的新突破、新進展。

      眾所周知,醫(yī)學知識多樣性強、因果關系復雜。因此,即使構建了龐大的醫(yī)療知識庫,在調(diào)用其中的醫(yī)學知識,尤其疊加了互聯(lián)網(wǎng)上搜索到的醫(yī)療信息時依然會遇到部分醫(yī)學數(shù)據(jù)、醫(yī)學理論不一致的情況。

      針對這一問題,醫(yī)療循證模式能運用醫(yī)學知識和證據(jù)評估標準,對證據(jù)進行多層分級,并對不同權威等級的證據(jù)進行專業(yè)分析與整合,精準識別各類權威信息的來源和可信度,從而避免因信息混雜導致的誤判,然后基于這些醫(yī)學證據(jù)進行可靠、準確的醫(yī)學推理,最終提供可信賴的醫(yī)療答案。

      通過“醫(yī)療循證模式”,Baichuan-M1-preview實現(xiàn)了從證據(jù)檢索到深度推理的完整端到端服務,能夠有效地解決醫(yī)療場景中信息過載、不確定性和碎片化等痛點。無論是醫(yī)生面對復雜病案,還是患者尋求權威建議,它都能通過“擺事實、講道理”的循證方式提供言之有物、有理有據(jù)的解答。不僅能在臨床場景中幫助醫(yī)生提升診療效率,在醫(yī)學科研場景中大幅縮短科研探索時間,還能幫助普通用戶更好地理解自身健康狀況,幫助患者科學管理生活方式,提升治療效果。

      行業(yè)首個開源醫(yī)療增強通用大模型 ,Baichuan-M1-14B醫(yī)療能力超越Qwen2.5-72B

      為了推動AI技術在醫(yī)療領域的創(chuàng)新發(fā)展,增強AI醫(yī)療技術的透明度和可信性,提高醫(yī)療服務的可及性,繁榮AI醫(yī)療生態(tài),百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

      作為行業(yè)首個開源醫(yī)療增強通用大模型Baichuan-M1-14B的表現(xiàn)非常優(yōu)異,不僅在cmexam、clinicalbench_hos、clinicalbench_hos、erke等權威醫(yī)學知識和臨床能力評測上的成績超越了更大參數(shù)量的Qwen2.5-72B-Instruct,并且與o1-mini也相差無幾。

      為了提升Baichuan-M1-14B的醫(yī)療能力,百川智能多管齊下:數(shù)據(jù)構建方面,面向細分醫(yī)療場景,收集了萬億級 token 的嚴肅醫(yī)療數(shù)據(jù),涵蓋了千萬級的中/英文專業(yè)醫(yī)療論文、院內(nèi)真實中/英文醫(yī)療病例,億級的醫(yī)療問答、醫(yī)療問診、臨床數(shù)據(jù)等,還對全網(wǎng)數(shù)據(jù)進行了包括醫(yī)療科室、醫(yī)療內(nèi)容以及醫(yī)療價值在內(nèi)的分類評估,確保模型能學習到有價值且全面的醫(yī)療知識。

      在此基礎上,百川智能還針對病例、醫(yī)學教材、醫(yī)學指南等不同類別的高質(zhì)量醫(yī)療數(shù)據(jù)生成了超千億 token 的多樣化數(shù)據(jù),包含了醫(yī)療復雜決策推理鏈條、決策依據(jù)以及問答對等多樣化形式。這些合成數(shù)據(jù)擁有豐富的知識呈現(xiàn)形式以及與醫(yī)生一致的思維過程,進一步強化了Baichuan-M1-14B的醫(yī)學知識能力和醫(yī)療推理能力。

      進入到模型訓練階段,百川智能運用行業(yè)首創(chuàng)的多階段領域提升方案,將整個訓練過程分為通識提升、醫(yī)療基礎知識提升、醫(yī)療進階知識提升三個階段,依次提升模型的基礎語言、高階及疑難病癥應對等能力。此外還在 CoT 訓練框架中創(chuàng)新的引入了ELO強化學習法,優(yōu)化思維鏈路徑,避免傳統(tǒng)獎勵模型偏差,有效提升了模型的生成質(zhì)量與邏輯推理能力。

      Baichuan-M1-preview是百川智能在AI醫(yī)療領域的又一次重要突破,為其實現(xiàn)“造醫(yī)生、改路徑、促醫(yī)學”的AI醫(yī)療愿景提供了有力支撐。于此同時,Baichuan-M1-14B開源模型則為中國AI醫(yī)療健康生態(tài)建設提供了強大助力。百川智能不僅希望加速AI技術在醫(yī)療領域的廣泛應用,更旨在激發(fā)更多創(chuàng)新力量,共同推動中國醫(yī)療健康生態(tài)的持續(xù)進步,助力實現(xiàn)更公平、更高效的高質(zhì)量醫(yī)療服務。

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。