码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 医学知识和医疗应用开发交叉领域中垂类大语言模型应用相关研究


    前言:

    基于公司对LLM落地的期望,此proposal尚未研究完毕,只是简单做了一些消息整合和建议。

    关于知识细节详见末尾Refs

    背景:

    随着LLM(大语言模型)的爆火,不少企业都在寻找通过LLM解决企业业务问题的方法,以达到降本增效的效果。但是,当面对较为复杂的业务问题(如:背景资料多、问题分类多、条件判断复杂、涉及模块多等)时,以LLM当前的发展程度,仅通过简单的LLM对话交互,是无法有效地解决此类问题的,原因在于,LLM也有自身的能力限制,如幻觉、上下文等。

    ChatGPT在医学医学知识和医疗应用开发交叉领域中的局限性:

    1.1. 缺乏可靠性和准确性:由于ChatGPT是基于大量文本数据训练而成的,它可能会生成一些错误或不合适的内容,需要人类进行核对和修改。

    1.2. 缺乏逻辑性和连贯性:由于ChatGPT是基于局部上下文生成内容的,它可能会忽略全局的逻辑结构和主题一致性,需要人类进行调整和补充。

    1.3. 缺乏原创性和创新性:由于ChatGPT是基于已有的文本数据生成内容的,它可能会重复或抄袭一些已有的内容,需要人类进行检测和避免。

    2、ChatGPT在医学写作中的伦理考虑:分析了ChatGPT在医学写作中涉及到的伦理问题,包括:

    2.1. 版权法律问题:使用ChatGPT生成内容可能会侵犯原作者或出版商的版权,需要遵守相关法律规定,并给出合适的引用或声明。

    2.2. 医疗法律问题:使用ChatGPT生成内容可能会影响医疗决策或结果,需要承担相应的法律责任,并保证内容的真实性、有效性和安全性。

    2.3. AI透明度问题:使用ChatGPT生成内容可能会造成读者或用户对AI来源或质量的不了解或误解,需要提供清晰的标识或说明,并保证内容的可解释性、可信度和可控性。

    生物医学领域应用大模型的范式。

    由难到易分别是:

    • 从头开始预训练(pre-train from scratch)
    • 继续训练通用大模型(further pre-train from general LLMs)
    • 各种指令/任务微调(instruction tuning, etc)
    • 提示词工程(prompt engineering)

    细化到单个公司体来说,市面上垂类大预言模型的局限性:

     1.有限的上下文窗口

     2.组织内的知识信息经常散落在各个系统或文档内,难以统筹管理。

     3. LLM 缺少特定领域知识

    再细化到医疗软件开发人员的痛点:

    1. 知识整合

    2. 结构化数据与非结构化数据

    3. 第三方应用与 API

    回到应用范式, 对于公司来说,需要在最短时间内利益最大化。性价比较为高的方式是“各种指令/任务微调(instruction tuning, etc)” 或者 使用 提示词工程(prompt engineering)

    一种可能的解决方案:

    GPTbot产品提出的RAG(retrieval augmented generation)系统,以FLOW的方式(搭建工作流)将复杂多变的业务问题简化并抽象为多个“节点”和“流程”,并通过可视化编排 workflow方式,让多个专职LLM并行/串行工作,各司其职,从而快速地搭建起一个Bot,并立即应用于实际业务问题场景中。

    BOT 

    BOT 

    Reference:

    1. ChatGPT in medicine: an overview of its applications, advantages, limitations, future prospects, and ethical considerations - PubMed

    2.  GitHub - AI-in-Health/MedLLMsPracticalGuide: A curated list of practical guide resources of Medical LLMs (Medical LLMs Tree, Tables, and Papers)

    3.NIH 讲座 & 综述|ChatGPT 等大语言模型在医疗健康中的应用 - 知乎 

    4.「RAG」简介及GPBbots的优化实践

    5. How to easily solve complex business problems with "Flow"

  • 相关阅读:
    开源社区赋能,Walrus 用户体验再升级
    最短无序连续子数组
    个人网页制作 个人网页设计作业 HTML CSS个人网页模板 大学生个人介绍网站毕业设计 DW个人主题网页模板下载 个人网页成品代码 个人网页作品下载
    HTML制作一个介绍自己家乡的网站——贵阳,排版整洁,内容丰富,主题鲜明
    Qt应用软件【文件篇】Linux平台QFileSystemWatcher与QFile操作GPIO
    构建强大监控系统:使用Linux Zabbix和cpolar实现远程访问
    (附源码)node.js自我展示博客网站 毕业设计 231547
    Hyper-V 下的 Debian 双网卡配置
    自动跑测试记录后发送邮件提醒并自动解析数据
    Docker和Pycharm
  • 原文地址:https://blog.csdn.net/dongnihao/article/details/136357911
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号