• AI 编程与研发效能论坛 笔记摘录


    大模型出来之后,90%的技能好像价值归零了,但是由于杠杆作用,剩余的10%的技能则放大了1000倍。                     —— Kent  Beck

    目录

    LLM涉及到的领域

    LLM涉及到的技术

    关键问题与技术挑战

    企业面临的挑战

    AI编程是不是软件工程的一颗银弹?


     LLM涉及到的领域

    • NLP/ML
    • 提示工程
    • 知识工程
    • 多任务调度
    • 算法优化

    LLM涉及到的技术

    • 算法:深度学习、强化学习、迁移学习

    • 大语言模型预训练技术,包括构建预训练系统

    • 参数高效微调技术

    • 数据治理技术,包括预训练数据、微调数据

    • 模型缩放技术

    • 安全、可信、稳健性


    关键问题与技术挑战

    关键技术具体内容所属分类
    中文友好的代码生成
    • 在保障模型性能的条件下,增强中文语义的理解能力,满足利用中文/英文描述同等的代码生成能力
    模型优化
    Prompt
    • 判断用户输入的任务描述完整性和合理性,并通过交互明确意图,提高代码生成准确率
    • Prompt结合精准上下文,扩大模型生成感知野
    模型优化
    AI Agent 探索
    • 结合预训练模型,在Agent逻辑下,完成复杂任务的精准生成与推理
    • 结合记忆模块,进行搜索增强,减少模型幻觉,提升回答准确率

    模型优化

    工程优化

    体验评估与优化
    • 构建客观且贴近真实工程的评估指标/手段
    工程优化
    模型在线学习
    • 基于用户的显式和隐式反馈对在线的大模型进行微调,实现在线模型实时更新
    模型优化
    低成本SFT
    • 如何实现各种研发场景的训练/验证数据集快速低成本建设,以及模型的训练以及自动验证部署
    • 模型参数外挂等技术,实现低成本训练与数据隔离
    模型优化
    后处理
    • 根据项目上下文,检查和修复所生成代码的编译运行错误
    • 结合单元测试,修复生成程序中的逻辑性错误

    模型优化

    工程优化

    模型量化
    • 在保证精度不过多下降的前提下,量化模型,支撑端测算力实现模型推断
    工程优化

    企业面临的挑战

    1. 算力硬件投入巨大
      1. >以2012年为分水岭,AI模型对算力的需求在仅仅6年间增长了300,000倍。
      2. >GPU 硬件性能每年增长1倍。
    2. 算力建设成本高昂
      1. >当今AI负载要求单机架具备20kw-40kw供电能力,未来可能增长到80kw。

      2. >大部分企业目前单机架供电能力在7~15kw左右

    3. 算力需求多样
      1. >单机单卡、单机多卡、多机多卡训练资源要求多样资源占用率、利用率高

      2. >开发人员数量众多,开发环境资源占用率高,利用率低


     AI编程是不是软件工程的一颗银弹?

    可能是,目前的AI编程已经相当成熟,在有限的时间下,解决一道编程问题,专业的竞赛选手在AI的辅助下,可以在15分钟内提供满分求解代码。但需要认识到的一点,对于那些调用深度代码很高的项目,比如C++,项目的函数调用深度可以深入到10乃至18层。受限于目标视野,这时候使用AI进行编程将很难得到预想的效果,这也是未来需要进行解决的一个难题。

    这是一个多角度的问题,因为现在一定程度上,很多互联网公司已经开始使用AI编程了;但很多从业人员对AI编程持有怀疑态度,对编码的可靠性存有疑问。

    或许在未来的某一天,AI编程真的达到了很高的水准,并且得到了业内大部分人的认可和应用,这时候我们可以回过头说,这确实是一颗银弹,是一个普适的解决方式,是行业的巨大变革。

  • 相关阅读:
    惨败阿里,洒泪复习3个月!上岸美团惨遭面试官狂问MySQL
    扫雷小游戏 2.0版本
    Linux操作系统粘滞位(解决上篇文章提出的问题)
    观察者模式
    现代C++(Modern C++)基本用法实践:五、智能指针
    Scala (十二) --------- IDEA 快捷键
    Xilinx SDK编译完成自动生成SREC文件(适用于ISE、Vivado、Vitis)
    【主流技术】日常工作中关于 JSON 转换的经验大全(Java)
    【网安神器篇】——瑞士军刀Netcat
    cobalt strike 的基础使用
  • 原文地址:https://blog.csdn.net/cold_code486/article/details/134020834