当实验在欧洲核子研究组织的大型强子对撞机粒子加速器上进行时,这是一件巨大的事件。世界上最大的机器负责发现无数新的东西亚原子粒子,包括极其难以捉摸的希格斯玻色子。
最近,它的数据一直在诱人地暗示着新的物理学超越标准模型- 我们必须解释宇宙如何运作的最佳方程组。
但事实证明,世界只能看到其实际生成的数据的不到百分之一。
物理学家使用 26.7 公里(16.6 英里)长的大型强子对撞机隧道将粒子加速到接近光速,并尽最大努力将它们粉碎在一起,看看是否能在由此产生的粒子簇射中发现任何新东西。
这些粒子以令人难以置信的速度发生碰撞——质子束的初始速度约为每秒 3000 万次碰撞,其中包含约 1200 亿个质子。
这会产生大量的数据。在其网站上,CERN 指出,每秒 10 亿次碰撞会产生每秒 1 PB 的数据。
这是一个问题 - 因为存储(更不用说分析)那么多数据是不可能管理的。
“如果我们想保留每秒所有 3000 万个事件,我们需要大约 2,000 PB 来存储典型的 12 小时运行。对于 150 天正常运行时间的典型运行年,这意味着每年几乎 400,000 PetaByte = 400 ExaByte -我们无法存储大量数据,”CERN 研究物理学家 Andreas Hoecker 告诉 ScienceAlert。
“更糟糕的是,凭借可用的(重要的!)CPU 容量,我们将无法像数据传入一样快地处理数据。”
因此,必须就哪些数据需要削减存储量做出明智的决定。与事件总数相比,这个数字很小。每发生 3,000 万次碰撞,只能挽救 1,200 起事故。
这仅占生成的总数据的 0.004%,其余 99.996% 将永远丢失。
当你考虑到我们可能会错过什么时,这听起来相当可怕。
但不要惊慌。霍克表示,任何数据都不太可能指向新物理学之外的东西。即使考虑到其巨大的尺寸,它最终还是被扔进了废弃堆。
“我们所知道的大多数有趣的过程都相当罕见。例如,生产是一个非常罕见的过程。到目前为止,我们已经达到了 LHC 碰撞强度的最大水平,我们正在产生大约 1 个希格斯粒子每秒,”Hoecker 解释道。
“其他有趣的物理过程并不罕见,但仍然只有每秒几百个的速率。我们使用‘触发器’,这是一种基于定制硬件和软件的快速在线算法,从大多数不太有趣的。”
这些触发器由许多具有不同兴趣的物理学家设计,基于研究人员正在寻找的粒子的特性,这些粒子主要是较重的粒子,例如希格斯玻色子,顶夸克, 和W 和 Z 玻色子。
这些重粒子几乎立即衰变为较轻粒子,但损失的质量会转化为动量。这些较轻粒子的较高动量然后充当一种签名,可以通过寻找特定事件的算法来获取。
这是可能的,作为福布斯今年早些时候推荐的文章,从所谓的质子之间的“软”碰撞中抛出的低动量数据可能包含重要的线索。但霍克认为这种可能性不大。
“如果新粒子是轻粒子,人们会想知道为什么它们没有在以前能量较低的对撞机中被发现,”他说。 “大型强子对撞机建立在数十年对新粒子的搜索基础上(许多发现正在进行中),并将这些搜索扩展到更高的能量和更罕见的过程。”
新物理学可能隐藏在光粒子或光子中,例如假设的“暗光子”,这很可能被阿特拉斯探测器。
但解决这个问题的方法不是试图保留大量几乎无用的数据,而是随着我们的理解和技术能力的提高,为大型强子对撞机建造新的探测器。
霍克指出,即使我们可以存储所有这些数据,这样做仍然会浪费计算资源——尽管一些真正优秀的物理学确实不可避免地会被丢弃。
一个大型强子对撞机升级计划于 2025 年发射,物理学家将能够改进触发器,减少获取卡盘的良好数据量。
但是,霍克说,大型强子对撞机并没有真正浪费任何东西。它的设计目的是研究能源前沿的物理学,而这正是它正在做的事情 - 并且一路上发现了一些非常有趣的东西。包括新物理学。
“寻找希格斯玻色子实际上是新物理学,”霍克说。
“希格斯玻色子并不是超出标准模型的物理学,而且它是被假设的,这一事实并没有改变物理学家在观察和测量它时感受到的惊奇。”