喜讯:啄医生医疗大模型在最新的中文医疗模型评估中(CMB-Exam)排名第一!

原创 健培科技2023/12/29 18:58:51

热点


近日,CMB官方发布了最新的中文医疗模型评估(CMB-Exam)排名,列出了从四种生成类别中选择的最佳准确率:Zero-shot (with/without COT) and Few-shot (with/without COT) 生成和评估的详细信息。包括香港中文大学、阿里云通义千问、中科院深圳先研院、蚂蚁集团、美国人工智能研究公司等团队成功上榜。其中健培科技啄医生医疗大模型??jianpeiGPT 以 81.78 平均分位列第一。




啄医生团队基于庞大的医疗行业数据集、自主开发的多学科专业知识库、以及丰富的临床实践,训练的医疗垂直行业大模型,已经在多个场合落地应用。在CT、DR、MRI、眼底等影像上实现了AI辅助疾病诊断,并在医疗数据质控、健康筛查、随访、手术规划等全流程环节应用,帮助提高疾病诊疗的质量和效率。


啄医生大模型??JianpeiGPT


啄医生团队在医疗健康大模型的研发上具备深厚积累,在数据、算法和落地能力方面优势明显。

数据层面,围绕医疗垂直领域中防、筛、诊、治、康各环节,提炼海量高质量的医学知识数据形成上百亿token的高质量医学知识专库,以及上万份医学指南、几千万例次真实病历等。海量高质量的训练数据,保证了“啄医生”医疗大模型响应的可靠性和准确性。

算法层面,通过高效的分布式计算技术、硬件加速器技术支持,高效持续训练“啄医生”医疗大模型,激发大模型对医疗场景的强大的理解、生成、逻辑和记忆能力,为“啄医生”医疗大模型开发和高效快速迭代提供强力支撑。


关于CMB


CMB是一个全方位、多层次的中文医学基准。它包含了280,839道题和74道复杂病例会诊题,涵盖了所有临床医学专业和各种专业水平。该平台旨在全面评估大模型的医学知识和临床咨询能力。具体组成如下。


中文医疗模型评估基准 CMB,其包括了医学知识的多层次综合评估(CMB-Exam)和基于真实病例的复杂临床诊断问题(CMB-Clin)。其中 CMB-Exam 的构建理念是反映真实医疗领域的考核体系,覆盖了医生、药剂师、医技科室、护士岗位,对于一致的大学学科知识考试和研究生入学考试进行了合并,归纳出了六个类别。以此来评测出模型对于医疗知识的掌握程度。CMB 从现实医学考核和临床应用出发,结合选择题和复杂病历问诊来全面检验模型在医学知识与诊断能力上的表现。为医学大模型的研发者们提供有力的反馈,帮助更快地完善模型,促进中文医学领域语言模型的持续创新和应用。?

微信扫一扫
关注该公众号