码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • C代码写的比Codex还溜的AI神器开源


    整理 | 章雨铭 责编 | 张红月
    出品 | CSDN(ID:CSDNnews)
    近几年来,AI 代码生成器十分流行,从OpenAI的Codex再到DeepMind的AlphaCode。DeepMind甚至表示,AlphaCode在Codeforces(一个编程竞赛平台)举办的编程竞赛(有5000多名参赛者)中,取得了平均排名前54.3%的成绩,并且声称它是首批可与人类程序员竞争的代码生成系统之一。但无论是Codex还是AlphaCode,截止目前都还没有对外开源。

    卡内基梅隆大学(Carnegie Mellon University,以下简称CMU)的研究人员表示,“大型科技公司没有公开发布他们的模型,这确实阻碍了科学研究和这种大型语言模型代码的应用。”为此,几个来自CMU的研究人员开发了PolyCoder——一个具有 27B 参数,基于 GPT-2 架构且开源的自动代码生成器模型,在12种编程语言的249GB代码数据库中进行训练。
    在这里插入图片描述

    12种编程语言代码集

    研究人员声称,PolyCoder在编写C语言方面的表现优于所有的已知模型(包括Codex)。

    和其他开源模型比较,PolyCoder在C、JavaScript、Rust、Scala和TypeScript方面的表现都比类似模型GPT-Neo 2.7B要好。
    在这里插入图片描述

    但是在C语言之外的其他十一种语言中,所有其它开源模型包括PolyCoder可能要略逊Codex。

    作为一个开源的 AI 代码生成器,PolyCoder算是取得了不错的成绩。但研究人员担心,像PolyCoder这样的模型可能会提示生成有漏洞的程序,即使是带有一些难以检测的安全漏洞程序。而且他们还担心未来其对手可以在代码生成模型中“隐藏”恶意行为,所以他们建议将Codex大小的模型开源,这不仅可以避免上述情况的发生,还有另一个额外的好处,即开发人员可以通过微调对模型进行个性化操作,这比从头训练模型的成本低很多。

    其研究人员还表示,希望能够通过开源,节约资源以及促进科技研究的发展。

    参考资料:https://arxiv.org/pdf/2202.13169.pdf
    https://venturebeat.com/2022/03/04/researchers-open-source-code-generating-ai-they-claim-can-beat-openais-codex/

  • 相关阅读:
    C++ | C++11新特性(下)
    计算机毕设(附源码)JAVA-SSM基于的防疫隔离服务系统
    framework.jar如何导入到android studio中进行framework的开发+系统签名
    一个简单高效低内存的.NET操作Excel开源框架 - MiniExcel
    软件测试基本概念知识
    【Android】字节码插桩技术实现卡顿监控
    minikube创建一个pod并暴露端口(使用docker驱动安装)
    Python学习之CSDN21天学习挑战赛计划之14
    【CT】LeetCode手撕—88. 合并两个有序数组
    老卫带你学---leetcode刷题(98. 验证二叉搜索树)
  • 原文地址:https://blog.csdn.net/csdnnews/article/details/123403167
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号