|
大型强子对撞机的每一次质子碰撞都不同,但只有少数是特殊的。这种特殊的碰撞产生了不寻常的粒子(可能是新粒子、违反物理现象等)或者有助于填补我们对宇宙不完整的认识。发现这些碰撞比众所周知的大海捞针要困难得多,但改变的革新正在路上。费米实验室的科学家和其他合作者成功地测试了一种原型机器学习技术,与传统方法相比,该技术的处理速度提高了30到175倍。
面对每秒4000万次的碰撞,大型强子对撞机的科学家们使用功能强大的计算机,从普通碰撞的巨大静电中提取宝石——无论是希格斯粒子还是暗物质的迹象。机器学习技术快速浏览模拟的大型强子对撞机碰撞数据,成功地学会了识别一种特定的碰撞后模式,当它以惊人的每秒600幅图像速度查阅时,传统的方法每秒处理不到一幅图像,这项技术甚至可以在外部计算机上提供服务。。
挑战更多的数据,更强的计算能力
这是对机器学习服务如何支持一个已经有大量数据只会变得更大领域有希望的一瞥。研究人员目前正在升级大型强子对撞机,使其能以目前速度的五倍粉碎质子。到2026年,欧洲核子研究中心(CERN)的27千米环形地下机器将产生比现在多20倍的数据。CMS是大型强子对撞机的粒子探测器之一,CMS合作者们正在对仪器进行一些升级,使这个复杂、有故事那么高的仪器能够拍摄LHC粒子碰撞的更复杂照片。
如果大型强子对撞机的科学家想要保存,在一年内从高亮度大型强子对撞机收集到的所有原始碰撞数据,必须找到一种方法来存储大约1eb(约1万亿个人外置硬盘驱动器)的数据,其中只有一小部分可能揭示出新的现象。大型强子对撞机的计算机被编程来选择这一小部分,在瞬间决定哪些数据足够有价值,可以被发送到下游进行进一步研究。目前,大型强子对撞机的计算系统大约每10万个粒子事件中就有一个发生。
但目前存储协议将无法跟上未来的数据洪流,未来数据洪流将在数十年的数据采集过程中不断积累。升级后的CMS探测器拍摄高分辨率照片也不会让这项研究变得更容易。这一切都转化为对计算资源的需求,是大型强子对撞机现有计算资源的10倍以上。现在的原型测试表明,随着机器学习和计算硬件的进步,研究人员希望能够在即将到来的高亮度大型强子对撞机(LHC)上线时,对数据进行筛选。参与CMS实验的费米实验室科学家Nhan Tran说:这里的希望是,你可以用机器学习做非常复杂的事情,而且做得更快,这很重要。
机器学习拯救推理的差异
粒子物理学中的机器学习并不新鲜,在对撞机实验中,物理学家在数据处理的每个阶段都使用机器学习。但是,随着机器学习技术能够以比传统方法快175倍的速度处理大型强子对撞机数据,粒子物理学家正在碰撞计算过程中迈出改变游戏规则的一步。这种快速的速度要归功于微软Azure ML平台中精心设计的硬件,它加快了一个称为推理的过程。要理解推理,请考虑一个经过训练算法,该算法用于识别摩托车的图像:该对象有两个轮子和两个把手,连接到一个更大的金属体上。该算法足够聪明,可以知道具有类似属性的独轮车不是摩托车。
当系统扫描其他两轮、两柄物体的新图像时,能预测或推断出这些物体是摩托车。随着算法预测误差的修正,它在识别这些误差方面变得相当熟练,10亿次扫描之后,它进入了推理游戏。大多数机器学习平台都是为了理解如何对图像进行分类而构建,但并不是针对特定于物理的图像。物理学家必须教他们物理部分,比如识别希格斯玻色子所形成的轨迹,或者寻找暗物质的蛛丝马迹。来自费米实验室、欧洲核子研究中心、麻省理工学院、华盛顿大学和其他合作者的研究人员训练Azure ML从模拟CMS数据中识别出顶级夸克。
具体来说,Azure的任务是寻找顶部夸克喷流图像,这是由单个顶部夸克从碰撞中快速移动而脱离真空的粒子云。费米实验室的科学家伯特·霍尔兹曼(Burt Holzman)说:我们给它发送图像,用物理数据训练它,它展示了最先进的性能。非常快。这意味着可以输送大量这样的东西,总的来说,这些技术相当不错。推理加速背后的技术之一是将传统处理器与专用处理器结合起来,这是一种称为异构计算体系结构的结合。不同的平台使用不同体系结构,传统处理器是cpu(中央处理单元)。最著名的专用处理器是gpu(图形处理单元)和fpga(现场可编程门阵列),Azure ML结合了cpu和fpga。
这些过程需要加速的原因是这些计算量很,比如250亿次。把它安装到FPGA上,映射到FPGA上,并在合理的时间内完成,这是一项真正的成就。它也开始作为一种服务提供,该测试是第一次有人演示了如何将这种异构的as-a-service体系结构用于基础物理。在计算机世界中,使用“作为服务”具有特定的含义。外部组织提供资源(机器学习或硬件)作为服务,用户(科学家)在需要时利用这些资源。这类似于视频流媒体公司提供数小时的狂看电视服务,而不需要拥有自己的DVD和DVD播放器,而是使用它们的库和接口。大型强子对撞机的数据通常存储在CERN和费米实验室等合作机构的计算机服务器上并进行处理。
这为实验室提供了额外的计算能力和资源,从而增强了它们的能力,同时使它们不必自己提供服务器。加速计算的想法已经有几十年的历史了,但传统模式是购买一个带有gpu的计算机集群,并将其安装在实验室本地。伊利诺斯州芝加哥附近费米实验室的计算机只需100毫秒就能将粒子事件的图像发送到Azure云上,对其进行处理并返回。作为一种工具,机器学习继续为粒子物理学提供了解宇宙的新方法,它本身也令人印象深刻。我们可以用一些训练有素的东西来区分动物和人的照片,做一些适度的计算,让它告诉我们顶夸克射流和背景之间的区别。 |
|