• CCF ChinaSoft 2023 论坛巡礼 | 智能化软件开发和维护论坛


    2023年CCF中国软件大会(CCF ChinaSoft 2023)由CCF主办,CCF系统软件专委会、形式化方法专委会、软件工程专委会以及复旦大学联合承办,将于2023年12月1-3日上海国际会议中心举行。

    本次大会主题是“智能化软件创新推动数字经济与社会发展”,学术、工业、教育、竞赛等分论坛活动40余场,期待您的参与!

    目前大会火热报名中!早鸟注册(early-bird registration)10月22日截止,提前注册付费锁定注册费优惠权益。

    CCF ChinaSoft 2023官方首页:

    http://chinasoft.ccf.org.cn/

    点击文末“阅读原文”或扫描下方二维码进入官方注册通道:

    https://conf.ccf.org.cn/chinasoft2023

    ab442dad758d39c0447d6b5af5d3769a.jpeg

    a1398e16164682fe59cf7f0375822547.jpeg

    ✦  +

    +

    论坛巡礼

    论坛名称:智能化软件开发和维护论坛

    时间: 2023年12月1日 14:00-18:00

    地点: 上海国际会议中心,5楼长江厅

    论坛简介:

         智能化软件开发和维护是近年来软件工程研究领域的一个热点。它利用人工智能和机器学习技术来帮助软件的开发和维护。其目标是提高软件的开发效率和软件质量,减少运行和维护成本。

        本论坛将提供一个交流最新技术和趋势的平台,有助于让参会者了解当前智能化软件开发和维护领域的最新进展。参会者可以分享他们在智能化软件开发和维护方面的经验,并与该领域专家和行业从业者进行交流。希望通过本论坛,参会者可以发现智能化软件开发和维护中存在的问题,并寻求解决方案,共同推进智能化软件开发和维护的发展。

    日程安排

    Schedule

    5d678373f1137d87691452707b7d63bc.jpeg

    论坛主席

    Forum Chairmen

     96adea32f928e3db6e85a702aed33e83.jpeg

    张洪宇

    重庆大学

        重庆大学大数据和软件学院教授、院长,主要研究方向是软件数据挖掘,智能化软件开发,和软件维护。在国际著名会议和期刊上发表了200多篇论文,获得过8次ACM杰出论文奖和最佳论文奖。担任2024年亚太软件工程会议(APSEC 2024)大会主席,2020年国际软件维护会议(ICSME 2020)的大会主席,期刊ACM Computing Surveys, Automated Software Engineering, 和 Journal of Systems and Software的副主编,以及ICSE、FSE、ASE、ISSTA、ICML、NeurIPS、ICLR等会议程序委员会委员。他是ACM杰出会员,CCF杰出会员,澳洲工程师协会会士(FIEAust)。

     f4801d62cdcae57fcc2eac983e932140.png

    彭鑫

    复旦大学

        复旦大学计算机科学技术学院副院长、教授。中国计算机学会(CCF)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,上海市计算机学会青工委主任,《Journal of Software: Evolution and Process》联合主编(Co-Editor),《ACM Transactions on Software Engineering and Methodology》、《Empirical Software Engineering》、《Automated Software Engineering》、《软件学报》等期刊编委。2016年获得NASAC青年软件创新奖。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车等。研究工作多次获得IEEE Transactions on Software Engineering年度最佳论文奖、ICSM最佳论文奖、ACM SIGSOFT杰出论文奖、IEEE TCSE杰出论文奖等奖项。担任2022年与2023年CCF中国软件大会(ChinaSoft)组织委员会主席与程序委员会共同主席,以及ICSE、FSE、ASE、ISSTA等会议程序委员会委员。

     cb1cd13c23d9857a9557dffc24056f3b.jpeg

    文俊浩

    重庆大学

        重庆大学大数据和软件学院教授,重庆市学科学术技术带头人(软件工程),重庆市名师。中国计算机学会(CCF)理事、CCF服务计算专委常委,CCF软件工程专委委员,CCF重庆分部主席。近年来,发表SCI/EI学术论文70多篇,出版专著3部;主持国家重点研发计划、国家自然科学基金等省部级以上科研项目10余项;获重庆市科技进步二等奖1项;获国家教学成果奖2项。承办了第九届服务科学国际会议(9th ICSS2016)与第十届CCF服务计算学术会议(10th CCF NCSC 2019);承办了首届CCF中国软件大会(ChinaSoft 2020).

    论坛嘉宾

    Forum Guests

     caabaf7d9ca7a6fb32366ae475b85e20.png

    彭鑫

    复旦大学

    复旦大学计算机科学技术学院副院长、教授。中国计算机学会(CCF)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,上海市计算机学会青工委主任,《Journal of Software: Evolution and Process》联合主编(Co-Editor),《ACM Transactions on Software Engineering and Methodology》、《Empirical Software Engineering》、《Automated Software Engineering》、《软件学报》等期刊编委。2016年获得NASAC青年软件创新奖。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车等。研究工作多次获得IEEE Transactions on Software Engineering年度最佳论文奖、ICSM最佳论文奖、ACM SIGSOFT杰出论文奖、IEEE TCSE杰出论文奖等奖项。担任2022年与2023年CCF中国软件大会(ChinaSoft)组织委员会主席与程序委员会共同主席,以及ICSE、FSE、ASE、ISSTA等会议程序委员会委员。

    报告题目:

    面向软件智能化开发的大模型能力增强

    报告摘要:

        如何在快速迭代、持续演化的开发过程中实现效率提升和可信保障是当前企业软件开发中面临的主要挑战。以GPT系列为代表的大模型在代码生成及其他代码层任务上表现出了很强的能力,但在复杂软件系统的开发特别是维护性任务上的支持仍然不足,其中的一个主要原因是代码数据所提供的平面化信息不足以支撑大模型获得更高层次上的智能化开发能力。为此,我们提出在程序分析的基础上通过开发历史、文档知识等方面的知识增强形成一种汇聚软件开发知识的代码数字孪生,以此来增强大模型的软件智能化开发能力。本次报告将在针对当前大模型的软件智能化开发能力的分析和思考基础上,介绍面向软件智能化开发的大模型增强技术并对未来的发展方向进行展望。

     4cc59e5364a9dd600bacfecd7063cef8.jpeg

    张洪宇

    重庆大学

    重庆大学大数据和软件学院教授、院长,主要研究方向是软件数据挖掘,智能化软件开发,和软件维护。在国际著名会议和期刊上发表了200多篇论文,获得过8次ACM杰出论文奖和最佳论文奖。担任2024年亚太软件工程会议(APSEC 2024)大会主席,2020年国际软件维护会议(ICSME 2020)的大会主席,期刊ACM Computing Surveys, Automated Software Engineering, 和 Journal of Systems and Software的副主编,以及ICSE、FSE、ASE、ISSTA、ICML、NeurIPS、ICLR等会议程序委员会委员。他是ACM杰出会员,CCF杰出会员,澳洲工程师协会会士(FIEAust)。

    报告题目:

    智能化软件工程 – 进展与挑战

    报告摘要:

        软件正在驱动这个世界。然而,当前的软件开发过程仍然主要是个人工的、耗时的、容易出错的过程。在大数据和人工智能时代,我们的目标是实现智能化软件工程,通过从软件数据中(如源代码、执行日志、历史故障、度量数据等)构建基于机器学习的智能模型,来自动化编程、测试、故障诊断和运行维护等任务,从而提高软件开发的生产效率,减少维护工作。具体例子包括了代码生成、代码搜索和日志分析等。近年来,各种深度学习模型,包括大语言模型(LLMs),被广泛应用于智能化软件工程。本次报告将介绍一些关于智能化软件工程方向的新工作,包括了智能编程和智能运维。报告也将简要讨论这个新兴领域面临的一些挑战。

     47c9ab884389cc23814855afcb64361f.jpeg

    熊英飞

    北京大学

       熊英飞于2009年从日本东京大学获得博士学位,2009-2011年在加拿大滑铁卢大学工作,2012年加入北京大学,现任新体制长聘副教授、软件研究所副所长、计算机学院院长助理。熊英飞的研究兴趣是程序设计语言和软件工程,特别是程序合成、修复和分析。他提出了理论和方法降低程序编写和缺陷修复的代价。比如,基于差别的双向变换框架是最广泛使用的双向变换框架之一,概率和逻辑结合的程序合成框架玲珑框架将程序修复的正确率从此前不到40%提升到80%以上。他的工作也被工业界采用,比如新一代Linux内核配置项目、燕云DaaS系统、华为公司等。他获得电子学会自然科学一等奖(排名1)、CCF-IEEE CS青年科学家奖、MODELS十年最有影响力论文奖,5次获得ACM SIGSOFT/IEEE TCSE杰出论文奖。他是SATE18的程序委员会联合主席,也在PLDI、ICSE、FSE等会议担任PC。

    报告题目:

    基于语法的预训练模型

    报告摘要:

        代码预训练模型在很多任务中都展现出良好的能力,但目前代码预训练模型仍然把代码当作单词序列,难以充分利用代码的结构信息。非预训练模型上的实验表明,根据语法规则对代码结构编码可以显著提升模型的能力。本报告将汇报北京大学将语法规则编码用于预训练的最新工作。不同于非预训练模型,大型预训练模型需要处理更大的词汇表,需要处理多种编程语言,还需要一系列预训练任务。我们展示这些问题在语法规则编码上仍然可以解决。实验证明,我们采用语法规则编码的预训练模型,只用了1/3的参数量就达到了目前最优的CodeT5模型的表现。

     bcc3b84ea3bd3a72da9ac62f7c009059.jpeg

    刘力华

    阿里云

       刘力华,阿里云云效代码智能负责人。在阿里巴巴先后从事文本数据挖掘、智能问答等NLP领域的产品技术应用。目前在阿里云云效负责代码生成、代码搜索、代码缺陷检测、代码质量评估等领域的研究以及在产品中的应用。

    报告题目:

    云效代码智能的探索与实践

    报告摘要:

        在当前人工智能以及大模型的时代背景下,企业期望在DevOps生命周期内通过人工智能解决传统工程方法难以解决的问题,从而提升整体的研发效率及质量。然而当前学术研究中的部分技术方法在企业级应用中存在较大挑战,本次报告将介绍阿里云云效团队在代码搜索、缺陷检测、代码语法分析中的探索及应用,通过人工智能以及大数据平台的方法提升在产品应用中的性能及效果,以及通过与通义大模型的结合打造智能编码助手,为开发者带来编码效率的提升。

     079b402bb2da3d3dbe8d34e998ad6119.jpeg

    钟欣

    科大讯飞

       科大讯飞星火军团iFlyCode产品总监,曾任网易杭研项目管理与效能中心总监。十余年的研发效能、DevOps、敏捷/大规模敏捷、互联网创新管理以及传统项目管理的实践经验,曾负责科大讯飞效能体系和效能云产品建设,目前负责iFlyCode产品线的工作。2016《网易一千零一夜》主要作者,2018 专业文章《网易云公有云项目管理白皮书》,收录于西湖管理峰会和PMI项目管理大会书册。担任中智联软件服务业质量创新联盟项目管理标准化技术委员会委员、项目管理专业人员能力评价要求国家标准工作组扩展团队成员。

    报告题目:

    讯飞智能化软件工程的探索和实践

    报告摘要:

        软件工程从规范化(流程)、自动化(DevOps)到智能化,其中的智能化一直是被放在最后一页进行展望的部分,随着大语言模型的发展和突破,在代码编程领域首先进入场景化应用,一时间软件工程已然进入到了智能化的阶段。科大讯飞作为一家人工智能公司,基于星火大模型的能力,在公司内部做了的万人研发团队规模的智能化软件工程的实践进行软件开发提效,也孵化出了iFlyCode智能编程助手这款商业化产品。本次分享也会为大家介绍下讯飞在软件工程领域智能化的实践经验,通过大模型我们能做到什么,不能做到什么,可以尝试什么,可以期待什么?希望能够在软件工程智能化领域的探索道路上更大家一起成长,迎接新一轮的变革。

     2755fb8e95657b89ef4ea4eb558607b0.jpeg

    顾小东

    上海交通大学

       上海交通大学软件学院副教授,博士生导师。研究方向为智能软件工程,包括程序自动生成、代码搜索、代码翻译等技术。在ICSE、FSE、ASE等软件工程顶级会议发表学术论文20余篇,主持国家自然科学基金以及多项与华为、腾讯等企业的合作项目。

    报告题目:

    代码翻译的细粒度评估

    报告摘要:

        代码翻译是提高软件开发效率的关键技术。但现有的评估方法只给模型打一个总体的分数如CodeBLEU,没有考虑不同翻译任务的难度,因而无法准确刻画模型细粒度的翻译能力。本报告介绍一种代码翻译的细粒度评估方法。首先对翻译任务按照难度进行分级,分别是Type1-字符级翻译,Type2-语法级翻译,Type3-库级翻译,Type4-算法级翻译。在此基础上提出一种分级的Benchmark,并用来测试现有的翻译模型,得到一些有趣的发现。

     25c977becb37cc2ecc52c4210448046d.png

    万成城

    华东师范大学

       万成城,华东师范大学软件工程学院副教授。2022年在芝加哥大学计算机系获博士学位。主要研究方向为智能软件系统优化。多项研究成果发表于ICSE、FSE、TOSEM、DAC、ATC、VLDB、ICML等国际顶级会议和期刊。曾获Siebel 学者、EECS Rising Star、ICSE的杰出论文奖等荣誉与奖项。报告人主页:https://chengcheng-wan.github.io

    报告题目:

    智能化软件的运行时故障修复

    报告摘要:

        软件是人工智能的使能和应用支撑技术,集成了人工智能组件的软件被称为智能化软件。然而,由于人工智能组件往往缺乏明确的、详尽的高质量的接口规范,智能化软件开发面临着巨大的集成挑战。即使软件各组件均被正确实现,当人工智能组件的输出与软件不兼容时,仍可能导致严重的故障。由于人工智能的输入空间巨大,测试数据难以覆盖运行时场景,在开发与测试阶段很难发现这类缺陷。针对这一挑战,我们首先进行了经验研究,分析总结智能化软件集成故障的根本原因和故障模式。然后,基于经验研究发现提出了一种智能化软件的运行时故障修复方法,SmartGear。SmartGear在人工智能组件和软件之间增加了一个中间层,在运行时动态地对人工智能组件的输出进行自动化检测和兼容适配,从而避免集成故障的发生。针对开源软件的实验结果表明,SmartGear能够检测70%不兼容的人工智能输出,阻止了67%集成故障的发生,优于现有的SOTA方法。

    项目开源地址:

     https://github.com/mlapistudy/SmartGear

     ff40954775ce416f8c76084440e03e74.jpeg

    万瑶

    华中科技大学

       万瑶,博士,华中科技大学讲师,2019年获得浙江大学计算机科学与技术专业博士学位。曾于2016年和2018年分别访问悉尼科技大学与伊利诺伊大学芝加哥分校。目前主要研究基于自然语言处理和程序分析的代码智能技术。在ICSE、FSE、ASE、ACL、EMNLP、NAACL、TOSEM、TSE等软件工程和人工智能顶级会议/期刊上(合作)发表论文10余篇。发起了首个代码智能开源平台NaturalCC。曾担任ACL、EMNLP、NAACL、AAAI、SIGKDD等国际会议程序委员会委员/审稿人。

    报告题目:

    NaturalCC:代码智能开源平台构建

    报告摘要:

        软件无处不在。随着开源社区的蓬勃发展,以GitHub为代表的开源社区平台积累了大量代码数据,也称为“代码大数据”(Big Code)。作为当前软件工程和人工智能学科领域新兴研究方向,代码智能旨在从代码大数据中高效且准确地挖掘知识,从而构建智能化软件开发工具,提高程序员开发效率。尽管当前基于自然语言处理等人工智能技术,在代码智能领域取得了较大进展,但仍然缺乏标准化算法实现和工具包,以及模型之间公平比较的基准。基于此,本人团队研发了一款开源软件NaturalCC,致力于打造首个代码智能开源平台,以便更好地支撑代码摘要生成、代码搜索、代码补全、代码类型推断等代码智能任务。

     30a0e8e8c898d2c818bb39fdd5eb4dd8.png

    王焱林

    中山大学

       王焱林,中山大学软件工程学院助理教授、硕士生导师,2022年入选中山大学百人计划。2019年博士毕业于香港大学计算机系,2019~2022年在微软亚洲研究院任研究员、主管研究员。主要研究领域为智能软件工程,尤其是与大模型结合的代码智能,包括代码搜索、代码摘要、代码生成等。已在ICSE、ISSTA、AAAI、ACL等软件工程及人工智能领域的高质量会议和期刊上发表二十余篇学术论文。在多个国际学术会议如ICSE,ISSTA,FSE industry等担任程序委员会委员,是TOSEM,TSE,JSS,EMSE等国际期刊的审稿人。

    报告题目:

    代码生成遇上大模型:进展与挑战

    报告摘要:

        本次报告将深入探讨代码生成的过去、现在与未来。首先,回顾代码生成的背景与历史轨迹,探讨其核心价值,以及研究它所涵盖的主要任务分类及其重要性。将分析传统的代码生成方法如基于模板、深度学习的方法,以及大模型如何为代码生成开辟了新的视角和范式。接着探讨当前代码生成的技术挑战,包括如何在计算资源有限或数据匮乏的环境下进行高效的代码生成。同时,我们也会讨论在特定需求场景下,如何进行代码生成、如何优化代码风格、安全性和性能。最后,我们将展望代码生成的未来,包括大模型将如何更好地融入现代软件开发流程,实现更高的开发效率和质量。

     26b341f5987087c60dbc55b21e7ef5f1.jpeg

    胡星

    浙江大学

       胡星,博士,浙江大学软件学院副教授、特聘研究员,硕士生导师,CCF软件工程专委会委员。主要研究方向为智能化软件工程,程序理解、软件仓库挖掘。在TOSEM、TSE、ICSE、ASE、FSE和EMSE等高水平会议和期刊上发表论文20余篇。主持国家自然科学基金专项培育项目,参与国家重点研发计划等多个科研项目。获得 ICPC 2018 ACM SIGSOFT Distinguished Paper Award。担任Internetware2023程序委员会主席,担任国际级顶级期刊(TSE、TOSEM、EMSE)审稿人,受邀担任国际会议ASE,MSR Data and Tool Showcase Track, ICSE Demo、SANER的程序委员会成员

    报告题目:

    大模型时代下的代码智能

    报告摘要:

        近年来,智能化软件工程成为软件工程领域的热点问题,利用深度学习以及大模型等技术可以有效的学习代码的语义和结构表示,从而提升机器理解代码和生成代码的能力。智能化软件工程技术研究极大的推动了开发人员的开发效率,同时提高了软件质量。报告从开发人员的日常软件开发视角为出发,介绍近年来在软件开发中的大模型时代下的代码智能技术研究进展。

    21c6718a3f7d266990b797bd843ff66f.jpeg

  • 相关阅读:
    Shopro商城 高级版 Fastadmin和Uniapp进行开发的多平台商城(微信公众号、微信小程序、H5网页、Android-App、IOS-App)
    2022年非一线IT行业就业前景?
    Matter 研讨会回顾(第二期)|乐鑫 Matter SDK 开发平台介绍和使用
    Sqoop数据导出 第1关:Sqoop数据导出语法学习
    Go Web——http标准库
    2022/9/16-2022/9/20
    C语言基础篇 —— 4.1 管理内存:栈(stack)、堆(heap)、数据区(.data)
    Unity 内存性能分析器 (Memory Profiler)
    倾斜摄影文件读取,不使用第三方库
    Golang使用自定义IP请求https
  • 原文地址:https://blog.csdn.net/pengxin_ce/article/details/134453957