HPE在太空启动两大空间服务器
-
面议
太空计算机项目将阿波罗机组送往国际空间站
HPE正在对其两台阿波罗服务器进行严格的空间管理,希望能够为星际之旅提供适当的产品线。
该公司已经向国际空间站(ISS)发送了两个高密度、的机组,以研究它们在太空的工作状态是否可以和在地球上一样流畅。
该组织正在寻求通过软件来“加固”应用程序,而不是调整硬件,使服务器变得更加坚固,从而使这项“太空计算机项目”实验变得与众不同。
美国HPE SIG的技术官Mark Fernandez和空间计算机项目软件的联合投资人告诉IT Pro:“我们可以假设,我们可以使用软件来硬化应用程序,而且该试验将帮助我们验证这样做是否可行。”
如果试验成功,那么Fernandez及其同事将能够使阿波罗机组不仅可以在卫星低轨道运行,还可以使之在返回陆地时畅通无阻。为进行相关测试,该团队还另设有两台服务器,它们与威斯康星州ISS中的控制服务器相同,共被分配在四个数据点。
他解释说:“从宏观的角度来看,无论是硅还是硬件,它们在传统的硬化技术面前都不堪一击,该技术试图预测放射物、微重力等之间的物理相互作用,并进行说明。我们正在研究。..。..科学应用及其成果,如果我放慢机器的正常运行速度,降低正常的运行温度,增加错误更正的时间,或者增加错误纠正检查的频率,那么是否还能得出正确的结果。”
Fernandez 说,由于实验中有多个变量,所以该团队可能会发现通过软件硬化可以正常运行一些计算,而其他方法则无法做到。
Fernandez说:“我们得到了NASA 的批准,可以交互访问ISS上的系统,我们准备调整软件参数,尝试找出一组能够在一年内进行正确计算并大限度地减少或消除错误的设备。”
他还说:“举例来说,如果我们发现收到的内存错误太多,那么运行内存密集型的应用程序可能不是一个好主意,但是如果您运行的是计算密集型程序,而且CPU没有遇到这些错误,那么我们就可以在飞船上使用一个标准的COTS服务器来承载这些[工作负载]。”
事实上,这个试验是HPE想要实现载人火星飞行任务这一野心的一项重大举措。正如该公司曾在一篇博文中指出的那样,大多数的太空运算和计算任务都是在陆地上完成的。然而,此次火星飞行任务是不切实际的,因为在这之间会有20分钟的时差。
这时,将一个服务器或多个服务器资讯/连接到航天飞船上将有助于消除该时差问题,并可作为边缘计算的版本进行有效地运行。
参数
太空计算机项目使用的是标准的现用Apollo x86服务器,在该服务器典型的计算(HPC)基准之上,还添加了一些额外的错误检测,收集和预防软件层。
针对HPE为何会选择使用这一特别的硬件,Fernandez说:“我们选择Apollo 40系列服务器的原因有三,一是密集,二是性能高,三是它们非常大众化,任何人都可以获得,而且其销售量很高。”
“我们并不会采用任何特殊的新硬件,这一款简单的双插槽 x86 基础服务器任何人都可以拥有,因为如果我们能让这些人正常运行,那么我们就可以让一切保持正常运行。”
当完成前往ISS的使命之后,这些服务器还将返回地球。如果失败,它们需要进行标准故障分析,以确定哪一个组件或哪些组件出现了故障,并找出终原因。
Fernandez说:“我们计划进行任何必要的工程变更,从而提高服务器的可靠性,让其在空间站无碍工作,这几乎可以提高我们在销售的所有类似系统的可靠性。”
实际上这是该试验的另一个重要因素。虽然实现火星的载人任务可能还要等上几十年,但HPE可以学习并借鉴从中汲取的经验,从而快速调整和改进其战略。
特别是,该公司希望这三点可以被反馈到非航天技术中来:BIOS、CPU和内存系统中一组稳定可靠的参数; 提供可靠性的电压和热能物理操作系统; 并优化控制其他两个的软件堆栈。
Fernandez总结说:“它不仅对太空之旅带来了好处,还对地球计算带来益处,当然这也有利于我们的客户发现这些安全功能,从而为我们提供了更为正确的答案。