
随着通用大模型时代到来,人工智能领域ChatGPT、文心一言等大模型的出现引起轰动、颠覆认知,也对各行各业、尤其是教育行业带来了很大的冲击。当前形势下,教育行业面临怎样的机遇和挑战?教育行业又应该以怎样的态度去应对和拥抱人工智能?在此前进行的WAVE SUMMIT 2023深度学习开发者大会上,天津大学教授、鹏程实验室研究员党建武给大家分享了“通用大模型时代教育面临的机遇与挑战”。

通用大模型的威力和魅力
一直以来,人们认为人类的智能才是真正的智能,因为它具备认知理解和知识推理能力。大家约定俗成的认知是:人工智能和人类智能间有不可逾越的鸿沟。但是ChatGPT出现以后,这个鸿沟被越过了,引起整个社会的轰动。
ChatGPT的出现带动了一大批大模型,“百模大战”的出现,显示了ChatGPT的威力和魅力,这种变化使得传统自然语言理解领域的学者们失去了许多研究阵地。
行业方面,例如Twitter解雇好多员工,但系统性能和效率并没有受到影响,给计算机领域的工程师带来了焦虑。智慧办公、方案设计层面,许多人开始用ChatGPT写文章或者做其他事情,ChatGPT还可以通过各类考试……但是显而易见,它也带来了一些问题,让人不得不正视和思考。
ChatGPT是继互联网革命以后,又一次直接冲击教育领域的一次革命。在传统教育模式下,尤其是对国内的应试教育来说,ChatGPT的刷题能力远远强过人,相应的,如果国内应试继续采用刷题的方法,未来应该怎么办呢?通用人工智能来的太突然,人类还没有准备好,教育行业也还没有准备好怎么样去应对人工智能所带来的变革。
通用大模型的使用现状及在教育领域应用的思考
根据日本的统计数据,ChatGPT出现半年以后,知道的人数占总人口的61%,使用过ChatGPT的人数占12%。其中,10-30岁的人群,超过20%都使用过ChatGPT。从全球来看,使用ChatGPT用户最多的三个国家是美国、印度、日本。教育领域,大学生、研究生和专科生占使用人数的21%,教职工占使用人数的20.5%。其他行业,比如公司的管理层占17%,一般职员占16%,医疗行业的为5.3%。

从日本的数据进行推测,其他国家ChatGPT的应用也大概是类似比例。其实各行各业都很看好人工智能的应用,但大家却都在小心翼翼“摸着石头过河”,教育领域更是如此。根据美国2月份的调查数据,有89%的学生利用ChatGPT完成家庭作业。有多所公立学校禁用ChatGPT,但从7月份开始,部分大学已解除对ChatGPT的禁令。但同时也有大学,比如密歇根法学院明令禁止在申请中使用ChatGPT。
相对来说,英国对ChatGPT在教育上的应用最开放。最近牛津、剑桥等24所罗素大学集团成员宣布:拥抱ChatGPT、文心一言等生成式人工智能,鼓励在教育和科研中合理使用AI工具。总之,通用大模型如何有效地在教育领域应用还在探索中,暂未找到灵丹妙药。这既是一个机遇,也是一个挑战。
机遇是面对通用人工智能的冲击,各国的教育都面临着相同的变革困境,谁能成功变革,谁就会处于主导地位。虽然它不是我国首先做出来的,但是在教育界领域里面的应用,大家有可能率先做出榜样来。
挑战则是指,随着语言大模型的崛起,知识传授和信息获取变得更加便捷。这种情况下,教育需要重新思考其目标,思考如何借助人工智能技术更有效地培养学生的创造性思维、解决问题的能力,以及适应快速变化的技能。
通用大模型在教育领域的应用,要考虑三个不同的教育场景目标和特色。一是中小学教育,要培养学生的观察能力,积极思考能力,促进综合素质提升,全面发展;二是大学研究生教育,要培养学生的独立思考、探索知识、解决问题的能力以及创新能力;三是教育机构,要考虑教育的个性化以及强化教育的问题,作为校园教育的补充。针对三个不同层次,应该考虑的问题也不同。
通用大模型对校园教育的影响
首先大模型可以带来一定好处,比如可以对学生进行个性化的学习观测和指导,缓解教师人力和时间上的限制。而且大模型具有非常丰富的知识资源和推理能力,可以使学习更方便,不受时间和空间的控制。
但是同时也必须客观认识到它对教师带来的挑战。它所拥有的便利条件,实际上是对知识性教育岗位的挑战,比如大模型可以替代大学基础课的内容,教师不想被替代,就必须找到或者拿出大模型做不到的事情来做。现实是,教师必须去理解和适应技术发展,去应对教育和人工智能的结合。
与之相关的,一些负面影响也开始显现。许多学生开始依靠ChatGPT去完成作业,依赖复制粘贴,失去了独立思考和创新的能力。这是一个较严重的问题,例如一直到去年为止,原本课程还都是用大作业写报告,但今年很多老师就不敢用了。
教育体制必须与时俱进,面临的问题是:怎么有效利用AI技术提高教育水平,如何最大限度降低AI技术带来负面的影响。
这里可以测试,比如通过小作文培养学生观测和独立思考的能力。家长自己写范文可能比较困难,但是ChatGPT可以写的非常漂亮。拿两个模型对比来看:

左侧是海河谛听模型,右侧是文心一言模型
给到它们的题目是:我是五年级学生,看到蚂蚁在搬运东西,觉得很有趣,很有感触,请写一篇文章。
出来的结果是,内容包括了合作精神、奉献精神,以及蚂蚁怎么辛勤劳动,还有生命价值观的一些内容。文心一言的参数是海河谛听模型的六倍左右,但是总体来看,对于小学生作文,水平和模型大小无关,但是文风和模型的风格有关。
那大模型到底有没有“人格”呢?
模型的“人格”调查
前段时间,字节跳动的两个人做了一个研究,他们通过好多实验以及不同的数据、不同的提示方法用MBTI 16型人格去描述和研究模型。最后的结论是:大模型的“人格”与训练数据有关、与提示训练有关。
大家都知道,上学时喜欢哪个老师,哪门课就能学的好。现在用大模型也是相同的道理,大模型有自己与众不同的性格,想哪门课好,就去找一个喜欢的大模型去跟着学习,这门课就能学好。另外还可以根据孩子的内向外向性格,选取内向模型或者外向模型,E和I分别表示内向和外向。
比如给到一个题目:我是初中三年级学生,喜欢物理,养了一只猫,你给我写一篇文章。

出来的结果比较有趣。海河谛听的模型写的中规中矩:观察它的跑步运动如何进行,看它玩这些轮子,从速度、加速度和动能的角度给到解释,把语文和物理结合起来。同样的题目,文心一言回答得很高大上,最后内容与太阳能相关。单纯看内容有点跑题,但整体来说,文心一言是把喜好物理和养一个小动物结合起来。
模型的风格多样性以及生成内容的可塑性,都有利于开拓学生的思路。大家必须充分利用这些要点,比如表达能力方面,国内学生与国外学生相差比较远,如何通过多模态的文本和语音以及图像结合的大模型,来提高学生的表达能力,有很大的发展空间。
在教学中活用大模型,积极拥抱人工智能
许多教师已经将大模型应用到教学中,抖音和哔哩哔哩等平台上能看到的很多分享,都具有一定的借鉴价值。比如在备课过程中,大模型可以生成完整全面的、可用的教案,可以帮教师深入理解讨论对象的机理、厘清其体系。但是大模型只限于表层语言的理解,无法理解语言所指向的真实物理世界,需要教师通过具身教育贯通表层语言理解和真实物理世界。同时,大模型依赖于人类用户的反馈,学习人类的审美方式,但没有自身的判断能力和审美标准,需要教师将审美标准传递给学生。大模型可以有效地整理知识,迅速发现人类尚未认识到的某些规律,但目前还没有能力将各种纷繁杂乱的规律整合成简洁自洽的理论体系。像是创新能力,需要通过假设—实验—升华,这都是目前大模型无法完成的。
教育信息化经历了三个主要阶段,一个是自动化,像计算器之类的“能存会算”;二是感知化,“能看会听”;三是智能化,“能理解会创作”。相对于前两个阶段,能理解会创作的智能化阶段在教育界受到质疑,其实是因为教育行业的特殊性。
教育的目标是培养人才、体现人的价值,而其他行业的目标,是以AI替代人力,降本提效。教育的功能是传递知识、培养价值观和培养创新能力,大模型和前两者都重叠,但因为其可能出现的幻觉令人心怀芥蒂,所以智能化对教育的影响更大。现在的教育体系是在第二次工业革命以后,经过细化形成的新学科和体系。第三次工业革命实际上是信息革命,人们想交叉融合但是没交叉融合起来,如今,利用大模型、人工智能AI 就能做到整体融合了。
接下来,人们应该积极去拥抱大模型。一个革命性的技术出现以后,影响可能超过这个技术本身,大模型正是如此,它实际上影响了一个生态。它考验的不再是国家技术科研能力本身,而是整个制度、产业生态与这次技术革命的适配性。所以业内要考虑做一个生态去适配它。
中国出现了大批大模型是可喜的,但目前的“百模大战”是一种内卷行为。关键问题是,一定要从制度上、管理方式上营造一个适合人工智能新技术的发挥作用、产生效益的环境。通过人工智能技术促进传统教育模式的改变,营造一个更适合于技术创新的社会环境,希冀并推动下一个革命性技术能够在中国出现。
本篇文章根据WAVE SUMMIT 2023深度学习开发者大会讲稿整理而成


关注【飞桨PaddlePaddle】公众号
获取更多技术内容~