超算界的明争暗斗

英特尔SSF是一种高级架构和互联技术，用于支持可扩展性更强、更灵活和更均衡的HPC系统。英特尔SSF将帮助简化HPC系统的采购、部署和管理，使HPC能够应用于包括数据驱动的分析、可视化和机器学习等在内的更多行业和更广泛的工作负载。英特尔宣布试产的英特尔至强融核处理器（代号为 Knights Landing）正在多个超级计算系统上运行。Cray当前有一款系统正在运行多个用户应用，它们正为在美国洛斯阿拉莫斯国家实验室（Los Alamos）部署的Trinity 系统，以及在美国国家能源研究科学计算中心（NERSC）部署的Cori 系统开展准备工作。此外，Atos和Penguin Computing还分别在法国新能源与原子能委员会（CEA）和Sandia国家实验室部署了类似系统。英特尔预计在产品发布时，将会有超过50个系统提供商推出基于英特尔至强融核产品家族的系统。

IBM这款超级计算机被称为Summit。Summit超级计算机原定计算性能是150petaflops，交付性能将达到200petaflops。而中国的 TaihuLight超级计算机性能指标是93 petaflops，峰值性能是124.5petaflops。IBM这款超级计算机交易据说价值3.25亿美元。Summit超级计算机采用IBM Power9微处理器和NVIDIA Volta GPU进行数学协同处理。Summit的前身Titan超级计算机，拥有超过18000个节点，而Summit将有约3400个节点。每个节点将拥有至少 500GB相干内存，以及800GB非易失性内存。为了给客户提供很高的I/O吞吐量，节点将使用Mellanox公司的双轨InfiniBand EDR连接以无阻塞胖树架构互联。看来超算领域还是拼钱拼爹，山姆大叔还是钱多~

惠普 Apollo 8000系统：推进超级计算科学的发展作为散热媒介，液体的制冷效率是空气的1000倍。然而，液冷技术的设计复杂性以及损毁风险让企业对昂贵的高性能计算系统望而却步。惠普通过采用全新的专利技术解决这些问题，从而保障液冷无风险运行。
　　惠普 Apollo 8000系统是世界上第一个100%液冷超级计算机，拥有内置的硬件保护技术。这个系统采用每机架最多144个服务器的可扩展机架设计，每机架的浮点运算次数是风冷设计的四倍，其高能效设计还可帮助企业的数据中心每年减排高达3800吨的碳氧化合物废气。
　　客户还可以回收利用系统散热产生的热水作为设施的热源。美国国家可再生能源实验室(NREL)曾利用超级计算机的独特设计打造了世界上最环保的数据中心之一，利用超级计算机产生的废热加热邻近的办公室和实验室。

戴尔全新HPC产品组合更“快”的选择和部署本次全球推出的戴尔HPC系统产品组合，和数据分析系列解决方案既可提供定制的HPC系统的灵活性，又具备预配置型系统的速度、简便性和可靠性。针对特定的科学、制造和分析类工作负载，戴尔工程师和领域专家设计并优化了这些全新的HPC系统，不仅为之配备了经过全面测试和验证的构建块，还跨解决方案的整个生命周期提供单点的硬件支持和额外的服务选项。

深腾X8800是一套方案，核心是联想智能超算平台LiCO(Lenovo Intelligent Computing Orchestration)。它是联想推出的HPC平台级产品，集成了计算库、调度软件、计费软件、集群管理软件、集群监控软件和报警软件、分布式文件软件，并通过集成Web界面，降低用户的使用门槛。与此同时，通过开放的接口，为二次开发和定制化提供支持。
　　据悉，LiCO可以有效提升HPC硬件节点管理水平，配合具有国际品质保障的联想x86服务器产品，能够为E级超级计算机提供可靠性的保障，从而确保上万以上节点所需要的可靠性和稳定性。
　　在功耗方面，联想NeXtScale SystemM5服务器采用WCT水冷技术，可以帮助排放85%～90%的热量，而且独有的温水冷却技术，允许入口水温达到45℃，如此就可以通过空气进行冷却，不需要热交换器，从而可以有效应对超级计算机功耗的难题。

星河SDC1000，是曙光面向云计算应用的一款服务器，采用弹性、异构、按需简约的设计理念，具备软件定义、模块化设计、高密度、高可扩展、高性能功耗比和高性能价格比等特点，是一款继机架式、刀片式服务器后的融合架构服务器标志性产品。 “M-Pro”服务器以应用为核心设计，通过Multi-Host网络芯片连接多个处理器，采用了新型服务器架构，实现了更均衡的网络I/O,提升了服务器对高性能计算、大数据和云计算各项要求的解决能力。
　　经过测试，“M-Pro”架构服务器相比普通双路计算节点实测应用性能显著提高，如计算化学、材料模拟、气象预报等多个领域的应用测试数据都展现了近150%的性能提升。

浪潮NF5568M4采用Intel最新Haswell处理器与GPU加速计算技术的协同，CPU主要承担其更擅长的逻辑选择、判断跳转和IO通信方面的职责，而GPU则专职计算密集型、高度并行的计算工作，使得计算资源合理的分配，计算力被充分释放，计算性能达到从几倍到几十倍的增长。
　　作为一款面向高性能计算的创新型产品，NF5568M4搭载2颗Intel E5-2600v3处理器，在4U空间内支持4个双宽GPU/MIC扩展，满足高密度并行计算需求。NF5568M4可同时执行数千个线程，系统能同时处理更多的信息流。
　　在内存容量方面，NF5568M4板载16根DDR4 内存插槽，带宽提升50%的同时功耗却降低35%，为功耗较高的HPC集群节省较大的电力支出。
　　浪潮NF5568M4为GPU提供高速PCI-E3.0连接，确保所有板卡在全速IO速率运行。相对于传统PCI总线在单一时间周期内只能实现单向传输，PCI-E的双单工连接能提供更高的传输速率和质量，带宽达到32GB/s！并且提供7个PCIE槽位，提供完美的扩展支持。另外，NF5568M4 的4U机箱也给功耗较大的GPU留有足够的散热空间，保障GPU服务器整机寿命。

华为FusionServerX6800是面向高性能计算的一款全新架构服务器，采用4U结构设计，在4U空间里集成8台1U服务器或4台2U服务器，相比传统1U机架服务器密度提升1倍，能耗节省10%，整体拥有成本（TCO）降低20%。在不改变原生态系统的前提下，针对高性能计算应用实现服务器架构的极致化创新与优化。

“天河2号”副总设计师卢宇彤

超级计算机的应用是跨学科项目，需要各个领域交叉学科人才来支撑。相对应的，超算人才的培养也不应该仅仅局限于计算机学科。超算教学应该推广到全校的理工科甚至医科院系，培养学生的高性能计算思维。开设一些如“高性能计算”、“并行算法和编程模型”等的课程，将超算课程体系的建设与各个领域、各个专业的教学体系相联通，帮助学生掌握可计算建模和并行计算方法。

中国工程院院士王恩东

超算要取得更长远发展需要解决架构难题。如何开发更加创新的系统架构从而突破性能瓶颈，使超算性能从千万亿次上升到百亿亿次，这是全球超级计算机专家都关心的话题之一。目前有一种CPU+GPU+MIC的创新技术架构，这种架构被被认为是突破P级到艾级最有可能的方法。

中国计算机协会秘书长张云泉

我国超算领域正处于高速发展的上升阶段，未来前景十分看好。因为超算和国家的创新能力、综合国力直接相关，对国家转型发展有重要意义。国家需要转型发展，首先是需要中国创造，其中很大的部分要依赖计算科学。基于超算的计算科学、计算模拟的设计、模拟、优化，对工业界提高竞争力有很大的帮助，所以很多企业和单位都在持续投入。

“天河2号”副总设计师 卢宇彤

中国工程院院士 王恩东

中国计算机协会秘书长 张云泉

“天河2号”副总设计师卢宇彤

中国工程院院士王恩东

中国计算机协会秘书长张云泉