• AI问诊逐渐取代医生是不是伪命题?实测国内外医疗专用大模型


    随着贫富差距和人口老龄化的进程加速,以及区域医疗资源的不均衡,医疗成了最让人民群众头疼的事情be7dc685de8608905104d9e61b117757.jpeg虽然互联网和云计算的普及,一定程度上的缓解了这些矛盾。例如:人们可以通过遇到简单的医疗问题的时候,可以去搜索引擎去搜索,但是事实上搜索引擎的搜索结果,仅仅是通过文本的语义匹配和相关度来呈现有可能相关的内容。这种结果往往是不可信的。传统的搜索引擎,不仅在检索方面有很多的弊端,而且充斥着海量的医疗广告,坑害了大量的患者。那么伴随这轮大模型的火热,AI大模型走进我们的生活,前一段的新闻,ChatGPT精准诊断了一个儿童的病症,而在之前的25名医生都没有诊断正确,AI大模型能否代替一部分初级的问诊?下面我们就来实测一下!


    01

    百度灵医BOT(国内)
    面向我国医疗健康产业推出领域增强的医疗行业大模型原生应用,提供包括:健康问答、草拟病历、多轮预问诊、可能涉及的病症、用药知识、角色扮演、医疗信息抽取、医学教学答题等多种能力。21adf2f91dc8a3a99fc2b21c10ed4372.jpege7fb1dc94bca5cceac8d21be51f5ece4.jpeg889670a4a276fefcb4300635489cbf7f.jpeg


    02

    Medisearch

    f6605002cf8ffc7480e55f2fee8969a4.jpegda737d9592504e7b7bfa400169514150.jpeg它的特点是:所有回答,都引用自权威信源。MediSearch 在美国医学执照样本考试上的表现为92%,比GPT-4和claude 2的表现更好。

    问题1:我在一次体检中发现了,首次发现我肺部有个8mm的磨玻璃结节,我应该怎么办?

    百度灵医BOTdfae0292dd46e5846d404f957ec55fe7.jpeg

    MediSearch7fd09148ca20e44b1cb5c841cda57bc8.jpeg
    点评:我提问了一个问题,并且追问了后续的检查结果,两个模型的回答都比较保守,当然这是正常的,两者的回答都没什么大问题,但是MediSearch会给与一些下一步的提问,引导用户提问,效果更好一些。


    问题2:我偶尔过几个月会头疼一次,头疼发作的时候,怕光,怕风,怕吵,而且还呕吐,请问我是什么病?

    百度灵医BOTc0d7be000d78818952ec5905cf80ed73.jpeg0d55ebcea2d072a30cd37f5df02614a1.jpeg

    MediSearchd5e5706b0c73791800caf9a4c8e97b69.jpeg1026d1b9c47c5bd575ce97d3209c1905.jpeg点评:两者都诊断出来了我有偏头痛,并且给予了一些建议,百度灵医BOT给的建议更加详细一点,而且对中国用户更加友好一些,毕竟是国产,MediSearch没有给与具体的用药。但是给予了方向。


    03

    总结


    两个大模型,总体各有优劣。百度灵医BOT优点:

    • 响应速度快
    • 常见病会更加激进,直接提示用药
    • 更符合国人的习惯

    百度灵医BOT缺点:

    • 不会提示追问
    • 引用的信息不一定全部都很权威

    MediSearch优点:

    • 会提示追问
    • 引用信息权威

    MediSearch缺点:

    • 响应速度慢
    • 回答过于保守

    总体来看,两个大模型都能一定程度的解决基础问诊的痛点,比漫无目的的去搜索引擎去获取信息要更加快速。由于目前市场的医疗垂直大模型大部分不支持公测,小编无法对比其他大模型,后续有机会接触其他大模型后,会给大家带来一手的评测信息。欢迎大家持续关注我们。

  • 相关阅读:
    智能指针笔记
    springboot操作es
    【原创】浅谈指针(十)链表的写法
    springboot入门
    服装行业在快手打广告效果好吗?如何在短视频平台推广服装?
    计数类DP
    TypeScript核心
    英语学习(娱乐篇)
    realsense d455 semantic_slam实现语义八叉树建图
    ADRC Ardupilot代码分析
  • 原文地址:https://blog.csdn.net/specssss/article/details/134018920