PNAS前沿:使用深度学习模拟宇宙流体动力学
栏目:企业动态 发布时间:2021-08-07 21:29
天生模子的主意是研习数据之间的纷乱相合以创筑新的模仿数据,然而而今的步骤正在高维情状下不成行。当数据的天生基于物理历程时,通过研习物理历程背后的物理纪律,能够创筑...

  天生模子的主意是研习数据之间的纷乱相合以创筑新的模仿数据,然而而今的步骤正在高维情状下不成行。当数据的天生基于物理历程时,通过研习物理历程背后的物理纪律,能够创筑天生模子,得回物理历程中的对称性和管束,从而首肯模子正在高维情状下有较好的功效。今天公告于 PNAS 的一项琢磨,作家提出了拉格朗日深度研习(Lagrangian deep learning),并将其行使于研习宇宙学流体动力学模仿。

  宇宙大标准机合酿成的数值模仿对待从观测中提取宇宙讯息至合要紧。[1-7]法则上,流体动力学模仿也许预测宇宙中全数可观测物质的散布,从而能够模仿观测。然而,因为策动本钱高,高分别分子动力学模仿尚不成行。目前最寻常应用的步骤是举办仅存正在重力的N体模仿,然后应用半解析步骤填充重子,这种步骤有很强的假设性。[8][9]其余,很众宇宙学观测(比如X射线发射和Sunyaev–Zeldovich(SZ)发射)都是基于流体动力学的气体个性,比如气体密度、温度、压强等,正在唯有暗物质的情状下无法被筑模模仿。

  深度研习步骤供给了一种取代步骤,能够对宇宙可观测物质举办模仿。很众论文以为该工作是图像到图像的翻译题目,即将像素化的物质密度场动作输入数据,输出像素化的可观测场。这些步骤要么应用诸如天生对立收集(GAN)[10]和变分自编码器(VAE)[11][12]之类的深度天生模子求解要求概率散布p (ytargetxinput),要么应用深度卷积神经收集(DCNN)研习照射xinput→ytarget。该规模以前的劳动至极寻常,比如识别光晕(质子晕)[13-16],出现三维(3D)星系散布[17],天生热SZ(tSZ)信号[18],预测暗物质磨灭的反应讯息[19],研习中微子效应[20]以及从低分别率模仿中模仿高分别率特性[21][22]等。

  与这些正在像素(欧拉)空间中劳动并将视场视为图像的步骤分歧,动力学筑模的另一种步骤是拉格朗日步骤,即通过对单个粒子或流体元素的位移场举办筑模来跟踪其运动。位移场比密度场包罗更众的讯息,由于分歧的位移场能够出现相像的密度场,而且平凡比密度场具有更众的高斯散布和线性散布。该空间中的现有步骤仅能求解暗物质,比如近似的N体求解器[23][24]和DCNN[25]。

  正在这项劳动中,咱们提出了一种深度研习架构,即拉格朗日深度研习(Lagrangian deep learning),应用拉格朗日步骤对宇宙暗物质和流体动力学举办筑模。该模子是由物理学中有用外面思念促动的,一个真正物理历程恐怕因为过于纷乱而不行模仿,乃至于无法对它举办有用的,平凡是粗粒度的物理学描写。一个模范的例子是有用场论,个中对微扰场论填补了从命对称性的有用场论观念,这些观念是对非扰动的小标准效应的有用粗粒度描写。出现的有用描写具有与真正物理学相同的机合,然而具有务必满意的自正在系数,并解释了非扰动的小标准效应。

  宇宙暗物质和重子的演化能够通过偏微分方程来描写,该体系耦合重力、流体动力学和种种亚网格物理筑模历程(比如恒星酿成),这些历程从宇宙早先到本日都正在络续演化。人们欲望模仿很大一个别可观测宇宙,同时还以较小的数目级搜捕三维空间中要紧的物理历程。尽管应用摩登策动平台,最终的动力学模仿结果规模也过大。

  一种有用的步骤是将全豹题目改写成人们能够办理的大领域题目,并有用地描写无法办理的小领域题目。正在外面物理学中,这平凡是通过重写拉格朗日算法来竣工的,使得其为满意题目中对称性的最众数阵势,个中自正在系数描写了小标准粗粒度的影响。

  正在宇宙学中,大规模的演化受引力负责,能够很容易地通过扰动或数值求解。应用扰动伸开的有用描写[31],无法对小标准情状和纷乱的重子演化历程举办筑模。固然空间粗粒度是该念法的最众数杀青,但也能够将其行使于时代粗粒度。经典的偏微分方程求解器需求良众时代,花费浩大。姑且粗粒化用更少的积分时代步长来替代偏微分方程求解,其特质是用有用描写替代了真正的物理方程,同时又确保了大标准下的线]。

  咱们采用有用物理描写的思念,并将其与深度研习范式相团结,正在该范式中,数据通过简陋操作构成的众层照射,而且挑选某些耗费函数练习这些层的系数。固然使工具有大方系数的神经收集描写了机械研习层,然而正在这里,咱们应用与真正物理定律似乎的机合,将单个层视为单个时代步长的偏微分方程求解器。它的益处是能够保存题目固有的对称性。咱们欲望正在宇宙情况中保留的紧要对称是平移和挽回对称:物理定律没有首选的处所或对象。然而咱们也欲望满意现有的守恒定律,比如暗物质和重子质料守恒。

  满意这两个恳求的一个简陋杀青是描写暗物质或重子的拉格朗日位移。咱们应用势场梯度来搬动粒子,而且因为仅搬动粒子,质料保留守恒。为了确保有用描写中的平移和挽回对称性,咱们对傅立叶空间中的势场举办整形,使其仅取决于傅立叶波矢量的幅度。势场梯度能够看作是使粒子具有加快率的力,势场的体式等效于该力的径向合连性。此描写需求粒子的处所和速率,于是它是时代上的二阶偏微分方程,咱们把这个描写用于暗物质。

  对待重子,咱们通过假设它们的速率与暗物质的速率相像来简化筑模,这是由于速率受大标准的控制。正在这种境况下,咱们能够应用电势梯度直接替代粒子的处所,于是,这个描写正在时代上变为一阶方程。其余,通过对模子的简陋扩展,咱们能够将此观念行使于气压和温度等重子的可观测本质,此时守恒律不再实用。

  完好的描写还恳求咱们界说势的原因。正在物理学中,原因平凡是粒子的某些属性,比如质料或电荷数。正在这里,咱们欲望描写亚网格物理的纷乱非线性历程,以实时空上的粗粒度。与引力相像,咱们假设势场的源是密度的简陋幂律,应用研习获得的格林函数转换这个势场。因为欲望对几种分歧的物理历程举办筑模,咱们将模子堆叠为众层。因为该模子包罗了粒子数据,而且应用拉格朗日步骤对位移场举办了筑模,于是咱们将此模子称为拉格朗日深度研习。

  咱们的特定方向是应用也许获得物理对称性和守恒定律的有用描写,从设定的早期宇宙初始要求早先,对暗物质和流体动力学可观测物质的散布举办筑模。这种行使于时代和空间粗粒度的历程的一个示例是仅具有几个时代步长的暗物质演化,它团结了近似N体求解器的思念,并团结了势梯度低落(PGD)的历程搜捕粗粒度[32][33]。咱们最初应用准粒子网(PM)N体求解器FastPM[24],它确保了正在纵情数目的时代步长上都能精确地举办大标准改变,这是由于FastPM中越级积分器的反冲和漂移因子是按照线性(Zeldovich)运动方程式举办转变的。

  FastPM仅具有几层(平凡为5到10),而且应用粒子位移,它被一层PGD的附加层杀青,该层仅用于刷新小领域暗物质的散布。此历程的全数步伐均为拉格朗日深度研习阵势,于是能够视为其初始层。出现的暗物质图如图1所示,与Illustris TNG的全豹N体模仿有很好的划一性,这也能够通过参考文献[32]中的数值比拟获得证据。该秩序不是正在研习新的物理学,而是正在研习对时代和空间粗粒度的有用物理学描写:正在圭臬的N体模仿中,咱们应用了10步替代了1,000众个时代步长,应用64个消浸了质料分别率的特性而不是具有完好空间分别率的特性。

  图1 仿线行区别是暗物质密度、恒星质料、电子动量密度(kSZ信号)、电子压强(tSZ信号)和X射线流体动力学模仿中的相应方向场。左,中和右列区别为红移z=0,z=0.5和z=1。

  咱们欲望将这些思念扩展到更纷乱的宇宙流体动力知识题上,正在此咱们欲望通过有用描写来研习物理历程。重子具有耗散性和碰撞性,正在被称为暗物质晕的高密度区域内也许爆发很众物理历程,比如冷却、辐射、恒星酿成、气体攻击、湍流等。能够将位移增加到暗物质粒子上,以模仿流体动力学历程,从而使位移后的粒子具有与重子似乎的散布。焓梯度低落(EGD)便是这个念法的一个例子[32]:人们将小位移增加到暗物质粒子上,以刷新小标准的低分别率的近似模仿并正在总体上对重子举办物质散布筑模。

  正在这项劳动中,咱们同时应用FastPM和N体模仿,并将它们与拉格朗日深度研习团结应用,以按照线性密度图预测重子可观测值。咱们琢磨对恒星质料,动力学SZ(kSZ)信号,tSZ信号和X射线时举办筑模。暗物质粒子最初通过FastPM演化为这些红移,然后传达给拉格朗日深度研习收集以对重子举办筑模。通过将输出与TNG300-1流体动力学模仿的方向场举办成婚,能够优化拉格朗日深度研习中的参数[26-30]。因为kSZ信号与电子动量成正比,tSZ信号与电子压强成正比,咱们也对其举办筑模。

  除了FastPM,咱们还琢磨将拉格朗日深度研习模子与完好的N体仿线系列的低分别率纯暗物质秩序)中的红移z=1、z=0.5和z=0处获取粒子数据,并将粒子数据输入拉格朗日深度研习模子。咱们将这两种夹杂仿真的机能与方向高分别率流体动力学仿真举办了比拟。

  咱们总结了这些模仿的数值参数,还列出了TNG300-3(TNG300的低分别率流体动力学模仿秩序)。TNG300-3具有咱们的夹杂仿真的分别率,是与咱们的模子机能举办比拟的自然参考。结果,基于FastPM的夹杂仿真和基于N体的夹杂仿线个数目级策动量。与TNG300-3比拟,夹杂仿线个数目级的策动量,而且咱们阐明咱们的仿线. 模子模仿的结果

  咱们丈量这些势场的统计数据,并举办定量比拟。咱们最初比拟功率谱,这是宇宙学中应用最寻常的统计量。咱们将传达函数和合连系数散布界说为:

  正在图2到6中显示了3D和2D互谱、传达函数、恒星质料超密度δ∗的合连系数、电子动量、电子压强和X射线强度。正在大中标准水准上,咱们的夹杂仿真平凡与方向场尽头成婚(X射线除外,正在这种境况下,基于FastPM的夹杂仿线时的X射线契约的功效平凡较差,加倍是对待恒星质料而言。TNG300-3恒星质料的较大谬误恐怕个别是因为低分别率TNG300-3无法分别小晕中的恒星形成的。相反,通过对高分别率流体动力学模仿TNG300-1举办练习,咱们的低分别率夹杂模仿也许比流体动力学模仿更好地模仿那些细姨系。

  正在小标准境况下,全数预测场都显示出与方向场的某些谬误。咱们将鄙人一个别中议论形成这些境况的恐怕道理。咱们还看到,与基于FastPM的仿原形比,基于N体的夹杂仿真平凡能够预测更大的小标准能量。总体而言,基于N体的夹杂仿真的预测能量谱更好,尽量它能够预测太众的小标准能量(比如,红移1处的kSZ信号)。

  合连系数也显示正在图2-5中。能够视察到,夹杂仿线更好,基于N体的夹杂仿真比基于FastPM的仿真高少许。请留意,法则上,合连系数能够量化傅立叶判辨的相位划一性,它是比传达函数更要紧的统计量。这再次说明,与相像分别率下的完好流体动力学模仿比拟,咱们模子的重子模仿更亲昵线D能谱(上)、传达函数(中)和恒星质料超密度的合连系数(下)的比拟。比拟了红移为0、0.05和1的拉格朗日深度研习夹杂仿线流体动力学仿线 拉格朗日深度研习夹杂模仿TNG300-3和方向TNG300-1的流体动力学仿线D能谱(上)、传达函数(中)和电子动量密度合连系数(下)的比拟。

  图4 拉格朗日深度研习夹杂模仿TNG300-3和方向TNG300-1的流体动力学仿真之间的电子压强的测试集3D能谱(上)、传达函数(中)和互合连系数(下)的比拟。图5 拉格朗日深度研习夹杂模仿TNG300-3和方向TNG300-1的流体动力学仿真之间的气体个性(与X射线D能谱(上)、传达函数(中)和合连系数(下)的比拟。图6 拉格朗日深度研习夹杂仿线流体动力学仿真之间的分歧可观测值的测试集互谱之比。

  大标准机合的观测(比如弱透镜和星团)之间具有很强的合连性,由于它们都是由相像的根本物质散布确定的。这些观丈量之间的合连性还包罗其他讯息,这些讯息无法通过独立即判辨每个可视察到的量来得回。合连系数还具有不增进噪声的益处。咱们的夹杂仿真也许以较低的策动本钱同时天生种种可视察量,于是对待合连性判辨具有潜正在的前景。

  咱们提出了一个拉格朗日深度研习模子,用于从模仿或真正数据的输出中研习有用的物理定律。简直而言,正在本文中,咱们中心琢磨正在宇宙学模仿中重子流体动力学的物理。咱们通过将N体/准N体重力图解器与拉格朗日深度研习模子相团结来修筑夹杂仿真。结果说明,基于FastPM的夹杂模仿和基于N体的夹杂模仿均也许用线性密度场天生种种红移的恒星质料、kSZ、tSZ和X射线图,其策动本钱区别比如向高分别率流体动力学模仿低几个数目级。咱们正在这些量进步行了自愿能谱判辨和合连判辨,结果说明,夹杂模仿正在相像的分别率下平凡优于流体动力学模仿。

  拉格朗日深度研习模子欲望供给对根本物理学的有用描写。如此的描写务必从命题目的全数对称性,挽回安宁移稳固性是两个环节的对称性,然而其他对称性,比如质料守恒也恐怕浮现。正在本文中,咱们以为履行这些对称会创筑一个天生模子,该模子研习物理定律的有用描写,而不是研习数据散布。这是由于对称是天生模子上独一务必昭彰杀青的管束,所有都能够从数据中学到。

  正在这里,咱们发起通过组合功用正在描写体系(比如流体)的物理个性的有用粒子上的位移层,并依照拉格朗日步骤搬动粒子,来杀青天生模子的研习。能够将粒子的位移明确为潜正在物理历程的结果,而粒子传输则是诸如气体冷却、加热和湍流等历程的结果。输出层是一个非线性变换,是具有阈值的粒子密度场,用于模仿物理历程,比如恒星酿成。

  体系的平移和挽回对称性对模子施加了苛苛的管束。这使人们能够应用很少的参数来筑模纷乱的历程并天生数据图像。于是,尽管需求要描写极高的维数(108或更大)的体系,根本的有用物理描写也只需求少数几个参数。

  少量的自正在参数也使模子安靖且易于练习。一个要紧的益处是,咱们能够应用少量参数动作纷乱的微模子的有用物理描写,这相同于微模子的有用场论描写中因为重整化而出现的自正在参数。这说明拉格朗日深度研习步骤能够取代模仿恒星酿成历程的其他有用描写。与平凡依赖于不成微模子的半解析步骤比拟,该步骤具有昭着的可辨别性,于是人们能够应用反向鼓吹来得出相对待初始密度场的最终可观丈量的梯度。这能够很容易地嵌入到正演化模子的框架中,以按照观测结果重筑初始要求[37]。

  用拉格朗日深度研习举办流体动力学模仿的练习,并不是要取代之前的流体动力学模仿模子而是要对其举办填补:比如,它能够对粗网格举办插值并将其放大到更大的体积和更高的分别率。比拟之下,拉格朗日深度研习有恐怕息灭对半解析步骤的需求,半解析步骤是而今大标准机合中的圭臬样板。这些步骤最初运转N体模仿,然后应用可观测物质的半解析阵势填充其暗物质晕。拉格朗日深度研习不光能够正在相像的分别率下得回相像的结果,况且还优于这些半解析步骤。与N体仿线个拉格朗日深度研习层除外,夹杂模子以大约10个时代步长杀青了这些方向。咱们欲望这会推进宇宙学大标准机合(LSS)观测的模仿和对从LSS中得回的物理量的判辨。