本文是对Tackling Climate Change with Machine Learning 进行一个翻译,是阅读过程中的一个记录。
气候变化是人类面临的最大挑战之一,作为机器学习(ML)专家,我们可能想知道我们可以如何帮助人类。在这里,我们描述了ML如何成为减少温室气体排放和帮助社会适应气候变化的强大工具。从智能电网到灾害管理,我们发现了影响较大的问题,ML可以与其他领域合作填补现有空白。我们的建议包括令人兴奋的研究问题以及有前景的商业机会。同时我们呼吁ML社区加入全球应对气候变化的努力。
气候变化的影响日益明显。风暴、干旱、火灾和洪水变得更加强烈和频繁。全球生态系统正在发生变化,包括人类赖以生存的自然资源和农业。2018年政府间气候变化报告估计,除非全球温室气体(GHG)排放在30年内消除,否则世界将面临灾难性后果。然而,这些排放量年复一年地增加。
应对气候变化包括缓解(减少排放)和适应(为不可避免的后果做好准备)。这两个问题都是多方面的。减少温室气体排放需要改变电力系统、交通、建筑、工业和土地使用。适应需要在了解气候和极端事件的基础上规划抗灾能力和灾害管理。如此多样的问题可以被视为一个机会:有许多方法可以产生影响。
近年来,机器学习(ML)已被公认为技术进步的强大工具。尽管将ML和人工智能(AI)应用于社会和全球利益问题的运动日益增多,但仍然需要协调一致地努力确定如何最好地应用这些工具来应对气候变化。许多ML实践者希望采取行动,但不确定如何行动。另一方面,许多领域已经开始积极寻求ML社区的投入。
本文旨在通过有效的工程或创新研究,概述ML在应对气候变化中的应用。我们强调的战略包括气候排放和适应,以及支持其他气候变化的元级工具策略。为了最大限度地发挥我们建议的相关性,在编写本文的过程中,我们咨询了众多领域的一些专家(参见Acknowledgments)。
我们相信,我们的建议将证明对几个不同的受众是有价值的(详情如下)。考虑到涉及的技术领域的广泛多样性,我们不假设事先熟悉应用领域(如农业或电网),并尝试在本文的每个部分提供相关关键词和背景阅读。虽然我们使用ML中的基本术语,但了解我们引用的特定ML技术对于理解我们的任何关键点都是不必要的。有关ML的总体介绍,请参见参考文献。
研究人员和工程师:我们发现了许多需要概念创新的问题,这些问题可以推动ML领域的发展,并且具有高度的影响力。例如,我们强调气候模型如何为可解释ML提供了一个令人兴奋的领域(见第8.1节)。我们鼓励各个领域的研究人员和工程师利用他们的专业知识解决与社会相关的紧迫问题。
企业家和投资者:我们发现了许多问题,现有的ML技术在没有进一步研究的情况下可能会产生重大影响,而缺少的部分是部署。我们意识到,我们在这里提供的一些建议将对初创企业和非营利组织产生价值。例如,我们重点介绍了为电力公司提供精细太阳能预测的技术(见第2.1节)、帮助减少个人能源消耗的工具(见第11.2节)以及气候变化的财务影响预测(见第14节)。我们鼓励企业家和投资者填补目前广阔的开放空间。
企业领导者:我们发现了一些问题,如果企业参与者大规模采用ML,ML可以带来巨大的效率提升。例如,我们强调了优化供应链以减少浪费的方法(见第5.1节)和精准农业的软件/硬件工具(见第6.2节)。我们鼓励企业领导者利用ML提供的机会,造福于世界和底线。
地方和国家政府:我们确定ML可以改善公共服务、帮助收集决策数据和指导未来发展计划的问题。例如,我们重点介绍了智能交通系统(见第3.4节)、自动评估城市建筑能耗的技术(见第4.2节)和改进灾害管理的工具(见第9.4节)。我们鼓励决策者考虑与ML专家合作的机会,并在相关公共部门机构建设ML能力。我们进一步鼓励公共实体发布可能与气候变化缓解和适应目标相关的数据。(有关此主题的更多政策相关建议,请参见[406])
本文根据应用领域分为几个部分(见表1)。为了帮助读者,我们还包括了以下各个策略级别的标志。
高利用表示领域专家在气候变化缓解或适应方面发现的瓶颈,我们认为这些瓶颈特别适合ML的工具。对于希望产生巨大影响的ML从业者来说,这些领域可能特别富有成效,尽管未标记此标志的应用程序也很有价值,应该继续进行。
长期性表示2040年后将产生主要影响的应用程序。虽然这些应用程序极其重要,但在某些情况下,它们的紧迫性可能低于有助于在短期内应对气候变化的应用程序。
不确定性影响表示对温室气体排放的影响不确定(例如,反弹效应可能适用)或存在潜在不良副作用(负外部性)的应用。
这些标识不应被视为决定性的;它们代表了我们对所考虑领域内更严格分析的理解,以及我们对ML在这些不同应用中潜在作用的主观评估。
尽管这篇文章很长,但我们不能包罗万象。肯定会有很多应用我们没有考虑,或者我们错误地忽视了。我们期待着看到未来工作的方向。
我们在本文中强调的所有问题都需要跨领域协作。协作减少了出现故障模式的可能性,例如处理一个实际上没有影响的问题,过度简化一个复杂的问题,或者在简单的工具可以完成任务时使用高级计算工具。
合作对于确保创新能够产生预期效果也至关重要。相关利益相关者应参与问题范围确定和开发的全过程,以便最终解决方案能够根据使用环境进行调整。例如,代码可以使用预期用户已经流行的语言和平台编写,也可以集成到现有的广泛使用的工具中。
我们认识到,寻找合作伙伴以及相关资源(如数据)往往很困难。我们鼓励读者访问本文附带的网站www.climatechange.ai,我们提供额外的资源以及知识共享和联网的机会。
我们强调ML不是银弹。我们强调的应用是有影响力的,但没有一种解决方案能够“修复”气候变化。还有许多领域的行动ML是不适用的,我们完全省略了这些。此外,虽然我们在这里重点关注ML可以帮助解决气候变化的方式,但ML也可以应用于使气候变化恶化的方式。例如,ML被广泛用于加速化石燃料勘探和开采等活动,而一些ML模型本身在训练和运行时需要消耗大量能量。
最后,技术本身不足以解决气候变化问题,也不能替代气候行动的其他方面,如政策。许多有助于应对气候变化的技术工具已经存在多年,但尚未被社会大规模采用。虽然我们希望ML将有助于加速有效的气候行动战略,但人类也必须决定采取行动。
人工智能被称为“新电力”,因为它有可能改变整个行业。有趣的是,电力本身就是人工智能即将转型的行业之一。许多电力系统都充斥着数据,行业已经开始设想由人工智能和ML驱动的下一代系统(智能电网)。
电力系统每年造成约四分之一的人为温室气体排放。此外,随着建筑、交通和其他部门寻求替代温室气体排放燃料(第3-4节),对低碳电力的需求将增长。为了减少电力系统的排放,社会必须:
•快速过渡到低碳电源(如太阳能、风能、水力和核能)并逐步淘汰碳排放源(如煤、天然气和其他化石燃料)。
•减少与现有化石燃料和电力基础设施相关的温室气体排放,因为向低碳电力的过渡不会一蹴而就。
•在所有国家和环境中实施这些变革,因为电力系统无处不在。
ML可以为电力系统技术的研究、部署和运行提供信息,从而在所有方面做出贡献(图1)。这些贡献包括加快清洁能源技术的发展,改善对需求和清洁能源的预测,改善电力系统优化,以及加强系统监测。这些贡献需要各种ML范式和技术,以及与电力行业和其他专家的密切合作,以整合运筹学、电气工程、物理、化学、社会科学和其他领域的见解。
低碳电源对于应对气候变化至关重要。这些来源有两种形式:可变和可控。可变来源根据外部因素波动;例如,太阳能电池板只有在阳光照耀下才能发电,而风力涡轮机只有在风吹来时才能发电。另一方面,诸如核电站或地热电站等可控电源可以打开和关闭(尽管不是即时的)。这两种类型的电源对电力系统的影响不同,为ML技术提供了独特的机会。
2.1.1 可变源。大多数电力通过一个称为电网的物理网络输送给消费者,在电网中,发电量必须等于每时每刻消耗的电力。这意味着太阳能电池板、风力涡轮机和其他可变发电机由天然气发电厂、储能装置或其他可控电源组成,以缓冲其输出的变化(例如,当意外的云层阻挡太阳或风吹得比预测的弱时)。如今,这种缓冲通常由煤炭和天然气工厂提供,这些工厂以称为旋转储备的二氧化碳排放备用模式运行。在将来,这一角色预计将由储能技术发挥,如电池(第3.3节)、抽水蓄能或发电制气[226];有关综述,请参见[27]。ML既可以减少当今备用发电机的排放,又可以减少排放通过帮助改进必要的技术(即预测、调度和控制),并通过帮助创建先进的电力市场适应可变电力和灵活需求。
预测供应和需求 高利用
由于可变发电量和电力需求都会波动,因此必须提前对其进行预测,以便为实时电力调度和长期系统规划提供信息。更好的短期预测可以让系统运营商减少对污染备用电厂的依赖,并主动管理不断增加的可变源。更好的长期预测可以帮助系统运营商(和投资者)确定何时何地建设可变电站。尽管当今许多系统运营商使用基本的预测技术,但预测将需要变得越来越精确,跨越时间和空间的多个视野,并更好地量化不确定性以支持这些用例。ML可以在所有这些方面提供帮助。
迄今为止,许多ML方法已被用于预测电力供应和需求。这些方法利用历史数据、物理模型输出、图像甚至视频数据,在总体空间尺度上对太阳能、风能、水力发电、需求或其中一种以上进行中短期预测。这些方法涵盖各种类型的监督ML、模糊逻辑和混合物理模型,并采用不同的方法来量化(或不量化)不确定性。在空间粒度的层面上,一些工作试图了解特定类别的需求,例如通过对家庭进行聚类,或通过使用博弈论、优化、回归和或在线学习对电力信号进行分解。
虽然之前的大部分工作都使用了领域无关技术,但未来的ML算法将需要结合特定领域的见解。例如,由于天气从根本上驱动可变发电量和电力需求,预测这些量的ML算法应借鉴气候建模和天气预测(第8节)以及混合物理加ML建模技术的创新。此类技术有助于改善短期至中期预测,而且由于天气分布随时间变化,ML也有必要为长期(如年尺度)预测做出贡献。除了结合系统物理,ML模型还应直接针对系统目标进行优化。例如,[198]的作者使用深度神经网络进行需求预测,以优化电力调度成本,而不是预测精度;这一概念可以扩展到产生最小化温室气体排放的预测。在非自动化环境中,电力系统控制工程师(部分)确定每台发电机应产生多少功率,可解释的ML和自动化可视化技术可以帮助工程师更好地理解预测,从而改进他们调度低碳发电机的方式。更广泛地说,理解改进预测的领域价值是一个有趣的挑战。例如,以前的工作描述了美国某一地区特定太阳预报改进的益处;在不同背景下和针对不同类型改进的进一步研究可以帮助更好地指导预测空间中的ML工作。
改进调度和灵活的需求。 高利用
在平衡电力系统时,系统操作员使用一个称为调度和分发的过程来确定每个可控发电机应产生多少电力。这一过程缓慢而复杂,因为它受到NP难优化问题的控制,如机组组合和最优潮流,这些问题必须在多个时间尺度(从亚秒到未来几天)进行协调。此外,由于电力系统包括更多的存储、可变发电机和灵活需求,调度将变得更加复杂,因为运营商需要管理更多的系统组件,同时更快地解决调度问题,以考虑电力生产的实时变化。因此,调度过程必须显著改进,以便运营商管理高度依赖可变源的系统。
ML可以通过加速电力系统优化问题和提高优化解决方案的质量来帮助改进现有(集中式)调度和分派的过程。例如,ML可用于近似或简化现有优化问题,找到优化的良好起点,识别冗余约束,从电力系统控制工程师的行动中学习,或将这些结合起来。动态调度和(安全)强化学习(RL)也可用于实时平衡电网;事实上,一些电力系统运营商已经开始在基于测试用例的小规模上试验类似的方法。
虽然许多现代电力系统都是集中协调的,但最近的工作研究了如何(至少部分)使用储能、灵活需求、低碳发电机和其他连接到电网的资源来分散调度和分派。一种策略是显式设计局部控制算法;例如,最近的工作使用基于历史优化数据训练的监督学习技术控制了能量存储和太阳能逆变器。另一种策略是让存储、需求和发电响应实时价格,以反映(例如)当前的排放密集型电力如何。在这种情况下,ML可以帮助设计实时价格和响应这些价格。之前的工作已经使用RL和动态规划来设定实时电价,更广泛地说,是用于电力市场设计。然后,(深度)RL、基于代理的模型、在线优化和动态规划等技术可以帮助在给定实时价格的情况下实现分散存储、需求和发电的利润最大化。有关需求响应的深度学习技术概述,请参见[30]。一般来说,需要做更多的工作来测试和扩展现有的分散解决方案;除非在实际系统上部署,否则PowerTAC和Grid2Op等平台可以提供大规模模拟环境,在其上执行这些测试。
加速材料科学 高利用 长期性
科学家们正在努力开发新材料,以更好地储存或利用来自各种自然资源的能量。例如,创造太阳能燃料(由太阳光或太阳热产生的合成燃料)可以让我们在阳光照射时捕获太阳能,然后储存这些能量供日后使用。然而,发现新材料的过程可能缓慢而不精确;材料背后的物理特性尚未完全理解,因此人类专家通常会手动应用启发式方法来理解拟用材料的物理特性。ML可以通过将现有的启发式算法与实验数据、物理和推理相结合来应用甚至扩展现有的物理知识,从而实现这一过程的自动化。例如,最近的工作使用了来自ML、AI、优化和物理学的工具来确定拟议材料的晶体结构,目标是加速太阳能燃料材料的发现。寻求改进电池存储技术的其他工作将第一原理物理计算与支持向量回归相结合,以设计锂离子电池的导电固体。(ML在电池中的其他应用在第3.3节中进行了讨论。)最近的工作还提出了使用ML对电催化剂进行可扩展模拟,以实现电力到气体的应用。
更普遍地说,在材料科学中,ML技术(包括监督学习、主动学习和生成模型)已被用于帮助合成、表征、建模和设计材料,如综述[105,490]和最近的工作[299]所述。正如[105]中所讨论的,材料科学中ML的新挑战包括处理中等大小的数据集和从训练模型推断物理原理。除了推进技术,ML还可以为加速材料科学的政策提供信息;例如,之前的工作将自然语言处理应用于专利数据,以了解太阳能电池板创新过程。我们注意到,虽然我们在这里的重点是电力系统应用,但加速科学的ML也可能在电力系统之外产生重大影响,例如,通过帮助设计水泥替代品(第5.2节)或创建更好的CO2吸收剂(第7.1节)。
额外的应用
ML还有许多额外的机会来推进可变发电。例如,重要的是确保低碳可变发电机尽可能高效和盈利地生产能源。之前的工作试图通过使用RL或贝叶斯优化控制太阳能电池板或风力涡轮机叶片[2,,最大限度地提高发电量。其他工作使用图模型检测屋顶太阳能电池板的故障,并使用遗传算法优化风电场内的风力涡轮机。ML还可以帮助控制太阳能和风力发电场的电池,以增加这些发电场的利润,例如,当价格较低时储存电力,然后在价格较高时出售;之前的工作基于当前和历史价格使用ML预测电价,或使用RL控制电池。
ML还可以帮助将屋顶太阳能电池板整合到电网中,特别是在美国和欧洲。屋顶太阳能电池板连接到电网的一部分,称为配电网,配电网传统上没有很多传感器,因为它仅用于从集中式发电厂向用户“单向”供电。然而,屋顶太阳能和其他分布式能源在配电网上形成了“双向”电力流。由于电力系统运营商通常不知道屋顶太阳能电池板的位置和尺寸,因此之前的工作已经在卫星图像上使用计算机视觉技术来生成屋顶太阳能电池面板的尺寸和位置数据。此外,为了确保配电系统平稳运行,最近的工作采用了矩阵完备和深度神经网络等技术,在传感器较少的情况下估计系统的状态。
2.1.2 可控源。可控的低碳电源有助于实现气候变化目标,同时电网运行方式几乎不需要改变(因为今天的化石燃料发电厂也是可控的)。ML可以支持现有的可控技术,同时加快核聚变电站等新技术的发展。
管理现有技术。
许多可控制的低碳技术已经商业化;这些技术包括地热、核裂变和(在某些情况下)大坝水电。ML可以在规划这些技术的部署位置时提供有价值的输入,还可以帮助维护已经运行的发电厂。例如,最近的工作建议使用ML,利用卫星图像和地震数据来识别和管理地热能场地。之前的工作还使用了多目标优化,以满足能源和生态目标的方式布置水电站大坝。最后,ML可以通过从图像和视频数据中检测裂缝和异常,或者通过从高维传感器和模拟数据中抢先检测故障,帮助维护核裂变反应堆(即核电站)。([794]的作者推测,ML和高性能计算也可以用来帮助模拟核废料处理方案,甚至设计下一代核反应堆。)
加速科学的融合 高利用 长期性
核聚变反应堆具有使用几乎无限的氢燃料供应生产安全无碳电力的潜力,但目前消耗的能量比它们生产的多。虽然仍需要大量的科学和工程研究,但ML可以帮助加速这项工作,例如,指导实验设计和监测物理过程;另见[360]。聚变反应堆需要智能实验设计,因为它们有大量可调参数;ML可以在物理实验期间帮助确定应该探索哪些参数配置的优先级。例如,谷歌和TAE技术公司开发了一种能够快速探索TAE反应堆参数的回路实验设计算法。
物理监测聚变反应堆也是现代反应堆的一个重要应用。现代反应堆试图将氢超加热到等离子体状态,然后使其稳定,但在此过程中,等离子体可能会经历快速不稳定,从而损坏反应器。先前的工作试图先发制人,基于先前的中断数据使用支持向量机、自适应模糊逻辑、决策树和深度学习等监督学习方法检测托卡马克反应堆的中断。虽然这些方法中的许多被调整为在单个反应器上工作,最近的研究表明,深度学习可以使见解推广到多个反应堆。更一般地说,科学家需要理解的不是简单地检测干扰等离子体的状态如何随时间演变,例如,通过找到时间相关方程的解磁流体动力学方程;据推测,ML可以帮助描述这种演变甚至有助于通过反应堆控制将等离子体引导到安全状态。ML模型针对这种融合的应用可能采用模拟数据和实验数据的组合,并且需要考虑不同的物理特性、数据量和模拟器速度,或与不同反应器类型相关的精度。
虽然转向低碳电源至关重要,但与此同时,减少目前电力系统的排放也很重要。缓解当前系统影响的一些方法包括减少化石燃料的排放,减少电力输送产生的废物,以及灵活管理需求以将其排放影响降至最低。
减少生命周期化石燃料排放。 高利用 不确定的影响
在社会向低碳电力转型的过程中,减少化石燃料的排放是一个必要的权宜之计。特别是,ML有助于防止甲烷(一种极强的温室气体)从天然气管道和压缩机站泄漏。之前和正在进行的工作都使用了传感器和/或卫星数据来主动建议管道维护或检测现有泄漏,在这一领域有大量机会改进和扩展现有策略。除了泄漏检测外,ML还可以帮助减少固体燃料货运的排放(第3节),识别和管理从发电厂烟气中分离的CO2的储存场所(第7.2节),并优化发电厂参数以减少CO2排放。在所有这些情况下,应非常谨慎地开展项目,以免妨碍或延长向低碳电力系统的过渡;理想情况下,项目之前应进行系统影响分析,以确保它们确实会减少温室气体排放。
减少系统浪费。
当电力从发电机输送到消费者时,其中一些会在电线上以电阻热的形式流失。虽然其中一些损失是不可避免的,但其他损失可以大大减轻,以减少浪费和排放。ML可通过预测性维护,例如建议主动电网升级,帮助防止可避免的损失(另见第5.3节和第9.2节)。先前的工作已经使用长短时记忆(LSTM)、二分排序和神经网络加聚类技术对电网数据进行了预测维护,未来的工作将需要改进和/或将这些方法本地化到不同的环境中。
模拟排放。
灵活管理家庭、商业、工业和电动汽车(EV)需求(以及能量存储)有助于最大限度地减少基于电力的排放(第3、4、5和11节),但这样做需要了解电网在任何时刻的实际排放量。具体而言,边际排放系数反映了任何给定时间需求微小变化的排放效应。为了让消费者了解边际排放因子,Watttime和electricityMap项目等举措使用了基于ML和回归的技术,根据电力和天气数据预测边际排放。最近的工作还将ML用于边际排放预测模型中的趋势提取和特征选择。英国国家电网ESO使用集合模型预测平均排放因子,该因子测量所有发电厂的总排放强度。在改进这些方法的性能以及预测相关电量方面仍有很大的空间,如电力削减(即出于电网平衡目的而浪费通常低碳的电力)。由于大多数现有方法都会产生点估计,因此量化这些估计的不确定性也很重要,以确保负荷转移技术确实减少(而不是增加)排放。
围绕电力系统的大部分讨论通常集中在美国这样的环境中,几乎普及电力接入,数据相对丰富。然而,许多不具备这些特征的地方仍然是应对气候变化的组成部分,值得认真考虑。为了确保全球影响力,ML可以帮助改善电力接入,并将电力系统见解从高数据环境转换为低数据环境。
改善清洁能源的获取。
改善清洁电力供应可以解决气候变化问题,同时促进社会和经济发展。具体而言,通过电网、微电网或离网方式提供的清洁电力可以取代柴油发电机、烧柴炉和其他碳排放能源。弄清楚什么样的清洁电气化方法最适合不同的地区可能需要密集的实地调查工作,但ML可以帮助以可扩展的方式为这一过程提供输入。例如,之前的工作已经在卫星图像上使用了图像处理、聚类和优化技术,为电气化计划提供信息。ML还可以通过准确预测需求和电力生产以及量身定制的优化和控制方案[493],帮助运营农村微电网,因为小微电网比农村规模的电网更难平衡。因此,生成数据以帮助制定能源获取政策和更好地管理能源获取战略是ML可能具有良好应用前景的两个领域。
接近低数据设置。 高利用
虽然ML方法通常应用于具有广泛传感器的网格,但许多国家的系统操作员不收集或共享系统数据。尽管这些数据可用性实践可能会不断发展,但同时使用ML技术(如转移学习)将见解从高数据转换为低数据设置可能是有益的(特别是因为所有电网共享相同的基础系统物理)。开发数据高效的ML技术在低数据环境中也可能有用;例如,在[680]中,作者对弱监督ML模型实施物理或其他特定领域的约束,允许这些模型从很少的标记数据中学习。
ML还可以帮助在低数据设置中生成信息。例如,最近的工作利用卫星图像上的计算机视觉和图形搜索技术,估计了未明确绘制电网地图的地区的电网布局。公司有还使用卫星图像测量发电厂的二氧化碳排放量(另见第6.1节)。最近的另一项工作利用基于回归的蜂窝网络技术对电力消耗进行了建模网络数据,这可能在许多蜂窝塔但很少的情况下证明是有用的电网传感器。尽管低数据环境通常未被ML社区充分开发,但这些环境中的电力系统研究为创新的ML和气候变化缓解提供了机会。