德適生物科技(2526)周四(30日)在香港正式發布醫療AI評測平台DoctorBench該平台首次以「臨床實戰能力」為核心尺規,為全球醫療大模型構建起一套貼近真實診療場景的多維評測體系。
德適匯聚了礎醫學、臨床醫學、人工智慧、醫療產業等多領域的專家,將嚴謹的臨床醫學邏輯與前沿的深度學習演算法深度融合,讓DoctorBench既能理解AI技術的邊界,又能洞察臨床實踐的複雜需求,並以此為標準構建評測體系。

圖說:發布會同時揭曉首期全球醫學大模型排行榜,其中杭州智診科技的WiseDiag-v2、谷歌的Gemini-3.1-Pro-Preview、OpenAI的GPT-5.4 位列前三甲。
DoctorBench構建了三大榜單體系,包括醫學主榜單(LLM)、多模態榜單(VLM)與智慧體榜單(Agent),分別評測模型的文本診療能力、多模態理解能力,以及模擬診療環境中的多輪決策與工具調用能力。

圖說:宋甯指,期待與全球更多科研機構、臨床中心和行業夥伴攜手,讓DoctorBench惠及每一位患者。
「醫療AI的發展是一場關乎人類共同健康福祉的長跑,既需要顛覆式的技術創新和跨學科、跨地域的深度協作,更需要對生命健康的絕對敬畏與堅守。」德適創始人宋甯表示,期待與全球更多科研機構、臨床中心和行業夥伴攜手,讓真正有實力的技術被看見、被信賴,最終惠及每一位患者。(記者 鄺偉軒)