在釘釘10周年發(fā)布會(huì)上,壹生檢康CEO王強(qiáng)宇宣布,其自主研發(fā)的豆蔻婦科大模型(doukou.ai),在國(guó)家婦產(chǎn)科衛(wèi)生高級(jí)職稱(正高)筆試考試中成績(jī)超過(guò)GPT-5的52.59分,取得了64.94分的成績(jī)。這一結(jié)果不僅彰顯了國(guó)產(chǎn)醫(yī)療人工智能在專業(yè)化賽道上的快速進(jìn)步,也展示了垂直行業(yè)大模型更高的實(shí)際應(yīng)用價(jià)值,為人工智能賦能醫(yī)療臨床實(shí)踐提供了新的樣本。
專業(yè)考試驗(yàn)證垂直行業(yè)大模型性能
本次測(cè)評(píng)嚴(yán)格采用國(guó)家衛(wèi)健委指定的人衛(wèi)版《婦產(chǎn)科高級(jí)職稱考試全真模擬卷》,考試范圍覆蓋臨床婦產(chǎn)科學(xué)、婦科腫瘤、圍產(chǎn)期醫(yī)學(xué)、生殖內(nèi)分泌、計(jì)劃生育等12個(gè)核心學(xué)科,題型包含多選題(占比40%)和案例分析題(占比60%)兩大題型。其中,案例分析題要求模型根據(jù)患者主訴、檢查報(bào)告等多源信息,解決臨床診斷、鑒別診斷、治療方案等問(wèn)題,全面考察臨床決策能力,需要全部正確才能得分,評(píng)判標(biāo)準(zhǔn)高于人類實(shí)際考試標(biāo)準(zhǔn)。

在相同的測(cè)試環(huán)境下測(cè)評(píng)結(jié)果顯示,豆蔻婦科大模型在整體得分上領(lǐng)先GPT-5 11.31分,不僅在知識(shí)覆蓋度上更契合中國(guó)婦產(chǎn)科的臨床體系,還在病例解析和診療路徑推薦等應(yīng)用場(chǎng)景中展現(xiàn)出更強(qiáng)的專業(yè)性與實(shí)用性。
豆蔻大模型由壹生檢康(杭州)生命科技有限公司研發(fā)。壹生檢康創(chuàng)始人、CEO王強(qiáng)宇表示,“測(cè)評(píng)聚焦于中國(guó)婦產(chǎn)科體系的理論知識(shí)和高標(biāo)準(zhǔn)臨床決策,豆蔻婦科大模型的優(yōu)勢(shì)建立在其高度本土化和垂直化的訓(xùn)練之上。而在通用知識(shí)、多模態(tài)能力、邏輯推理的廣度上,通用大模型依然擁有其不可替代的優(yōu)勢(shì),兩者是互補(bǔ)而非簡(jiǎn)單的取代關(guān)系。在具體行業(yè)的深度應(yīng)用上,垂直大模型擁有比通用大模型更高的實(shí)用價(jià)值”。
王強(qiáng)宇認(rèn)為,垂直行業(yè)大模型的核心優(yōu)勢(shì)體現(xiàn)在三個(gè)方面:第一,行業(yè) know-how,垂直模型深度結(jié)合行業(yè)知識(shí)體系與專家經(jīng)驗(yàn),能精準(zhǔn)匹配專業(yè)領(lǐng)域的邏輯與流程,垂直模型更懂行業(yè)。第二,高質(zhì)量數(shù)據(jù),相比通用語(yǔ)料,垂直模型能夠利用規(guī)范化、標(biāo)準(zhǔn)化、權(quán)威化的高質(zhì)量數(shù)據(jù),從而在可靠性與準(zhǔn)確性上更有保障。第三,快速迭代, 專業(yè)團(tuán)隊(duì)可根據(jù)臨床反饋以及最新指南不斷更新迭代,形成“專家—數(shù)據(jù)—模型”的閉環(huán),提升更新速度與實(shí)用價(jià)值!岸罐⒋竽P驼且揽可罡麐D產(chǎn)科的專業(yè)know-how、結(jié)合高質(zhì)量的臨床數(shù)據(jù)訓(xùn)練,并通過(guò)與醫(yī)生群體的互動(dòng)迭代來(lái)取得比GPT-5更強(qiáng)的專業(yè)性能”。

據(jù)了解,豆蔻婦科大模型基于釘釘企業(yè)專屬AI平臺(tái)研發(fā)迭代。釘釘企業(yè)專屬AI平臺(tái)及大模型訓(xùn)練服務(wù)體系,為豆蔻大模型訓(xùn)練提供了從數(shù)據(jù)治理、高效訓(xùn)練到靈活部署的完整端到端工具鏈和服務(wù)支持。壹生檢康團(tuán)隊(duì)將豆蔻婦科大模型訓(xùn)練平臺(tái)轉(zhuǎn)移到釘釘企業(yè)專屬AI平臺(tái)后,在數(shù)據(jù)處理、算力增加、模型優(yōu)化等環(huán)節(jié)進(jìn)行了多方位調(diào)整。通過(guò)釘釘企業(yè) AI 專屬平臺(tái)的分布式訓(xùn)練、多Lora部署等加速優(yōu)化手段,將單次訓(xùn)練時(shí)長(zhǎng)從26小時(shí)縮短至7小時(shí),降幅高達(dá) 73%!釘釘提供的不僅僅是資源,更是方法論,釘釘行業(yè)專屬模型團(tuán)隊(duì)在訓(xùn)練過(guò)程中提供的快速響應(yīng)和專家級(jí)指導(dǎo),大大提升了訓(xùn)練效率,助力豆蔻模型快速迭代升級(jí)!”豆蔻產(chǎn)品負(fù)責(zé)人陳宇表示。
豆蔻充實(shí)國(guó)產(chǎn)大模型生態(tài)
隨著國(guó)家對(duì)數(shù)據(jù)安全、醫(yī)療合規(guī)和自主可控的高度重視,國(guó)產(chǎn)醫(yī)療大模型在專業(yè)領(lǐng)域的突破具有更加深遠(yuǎn)的戰(zhàn)略意義。醫(yī)療作為關(guān)乎民生的重點(diǎn)行業(yè),更需要在人工智能底層能力上實(shí)現(xiàn)自主可控。豆蔻的成績(jī)說(shuō)明,中國(guó)不僅可以在大模型賽道中發(fā)展通用型產(chǎn)品,更可以通過(guò)行業(yè)化、專業(yè)化的路線,形成差異化競(jìng)爭(zhēng)力。這也意味著,在醫(yī)療、教育、金融、制造等對(duì)專業(yè)性要求極高的行業(yè)中,國(guó)產(chǎn)垂直大模型將成為重要力量。
專家指出,中國(guó)擁有龐大的醫(yī)療體系和豐富的臨床數(shù)據(jù)資源,這是構(gòu)建本土化垂直行業(yè)大模型的獨(dú)特優(yōu)勢(shì)。隨著產(chǎn)業(yè)鏈逐漸完善、政策支持不斷強(qiáng)化,未來(lái)中國(guó)將有望形成一個(gè)通用大模型與垂直大模型并存、協(xié)同發(fā)展的生態(tài)格局,在全球人工智能產(chǎn)業(yè)中占據(jù)更重要的地位。
王強(qiáng)宇說(shuō),“人工智能不會(huì)取代醫(yī)生,但能夠成為醫(yī)生的重要助手。通過(guò)與釘釘合作,我們探索并驗(yàn)證了一條高效構(gòu)建企業(yè)專屬大模型的成功路徑,并愿意將此經(jīng)驗(yàn)分享給醫(yī)療行業(yè),愿有更多的企業(yè)擁用自己的專屬大模型,大家一起在 “AI + 醫(yī)療” 的創(chuàng)新實(shí)踐中走出一條具有本土特色的發(fā)展道路”。
豆蔻婦科大模型體驗(yàn)地址:http://doukou.ai/