我国开源医疗大模型终于有了重大突破,HealthBench评测给了这个叫Baichuan-M3的模型4分高评。要知道,现在大家都盯着医疗这块,因为它关系到人命,大家都想抢着在这块高地站住脚跟。北京百川智能科技有限公司这次正式把自家的Baichuan-M3开源了,这消息一出,业界都挺惊讶。HealthBench是个全球公认的权威标准,Baichuan-M3在这个榜单上拿到了65.1分的高分,直接冲到了第一名。它甚至在那个专门考医生复杂决策能力的Hard子项里也赢了,拿了44.4分。 这可不是瞎吹的,它不仅打破了最高分的纪录,还意味着咱们自己搞出来的模型已经在核心能力上全面超过了国外的领先水平。能有这么好的表现,背后肯定是下了硬功夫。 以前医疗AI总爱瞎说八道,生成的信息不靠谱或者全是编的。百川智能为了解决这个问题,直接在训练的时候就把医学事实的正确性当核心目标来做。他们没像别人那样用外部工具事后修修补补,而是在模型一开始就把“知之为知之,不知为不知”这一条给内置进去了。结果出来一看,在不需要查资料的纯模型环境下,“幻觉率”居然被控制在了3.5%的极低水平。这就把安全这块给托稳了。 更厉害的是,Baichuan-M3在和人对话这块特别像个好医生。咱们看病时总没法把话说得很清楚,Baichuan-M3能像老专家一样一步步问清楚,把病人的病情理顺了再下结论。数据显示,在这种一问一答的问诊任务里,它做得比真人医生平均水平还要好。 这种表现可不是靠简单地假装医生来的,而是模型自己有一套逻辑,专门用来引导用户说出关键信息。百川智能的CEO王小川也说过,现在的医疗AI主要还是起辅助作用的。他觉得以后的主战场在医院外面和健康管理上,目标就是帮大家更好地了解健康知识、提高自主选择权。这次开源Baichuan-M3就是为了让技术更便宜、更容易用。 现在全世界的大公司都在搞医疗AI了,咱们的研究团队也拿出了领跑的成绩。Baichuan-M3在复杂推理和主动交互方面的表现特别强,这说明咱们在基础模型研发上有创新活力。 这次突破让人工智能在以后的临床决策、公共卫生和健康管理里有了更多的可能性。这是科技服务民生、建设健康中国的一个重要方向。百川智能坚持开源和自主创新的做法很好地反映了行业的发展趋势。 当然了,未来还得靠大家一起努力。产学研医得紧密配合起来推动技术进步、制定标准、保障安全、理清伦理问题才行。只有这样才能让人工智能真正变成提升医疗质量、守护老百姓生命健康的有力帮手。