首页 | 登录 注册
超算的应用
超算被称为“经济转型和科学研究加速器”,它的应用往往带动一些行业的颠覆发展
下雨的关键是看云层运动,没有超算之前,观测云层的精度是按照经纬度。有了超算之后,就可对云层运动进行精确模拟与观测。观测的精度越高,天气预报也就越准。“天河一号”的精度为10万公里“神威蓝光”为1万公里;而今,“神威·太湖之光”的精度达到9公里,假如我们的超算运算能力足够强,能盯住每一朵云,未来的天气预报就将万无一失。
建一栋楼对周边的环境到底有什么影响?如何建设风道便于污染物扩散?通过超算模拟,可以根据目前污染物的情况,通过超级计算机计算出未来一段时间的大气污染物浓度和分布,进行空气质量预报。从预报结果还可以计算出哪些污染 源“贡献”最大,了解污染的来龙去脉,为污染防控提供决策指导。据称,在超算的帮助下,未来将能够实现每个小区、每个居民点空气质量的准确预报。
模拟血流、模拟心脏、模拟人体任何一个部分,有了超级计算机,这些都不再是梦想。美国科学家利用超级计算机,选取一名真人扫描其血管系统,通过3D建模技术建立动脉系统模型,成功地再现了整个人体的动脉系统。任何直径或宽度在1毫米以上的动脉血管都会出现在模型中,而且模型的分辨率达到了9微米。
超级计算机运行速率更快,处理分析能力更强,让医疗工作者的诊断和治疗水平将大大提升,治疗手段也更容易让患者接受。例如可以及时有效地判定一个病人是否会发生脑梗塞的风险。过去,对一个可能发生脑梗塞病人,医院难以判断是否要进行支架手术,一般都会通过从大腿动脉处放进测压导丝进行测量,如今,经过模拟计算,只要血流储备分数如果小于0.8,就要做手术。这种方式既减轻痛苦,又节约成本,减小危险系数,是医疗诊断的一大进步。
天气预报 环保预测 人体建模 医疗诊断
全球范围内搜寻失踪物,比如寻找MH370,这是世界科技角力的战场。大量的卫星雷达集中对准南印度洋,当这些高科技眼睛采集到信息后,一个必经的环节是数据处理,担当这一环节的角色即是超级计算机。通过超算对这些大量的数据进行准确分析、处理,就能得到失踪物的信息,进而搜寻到失踪物。
研究飞机在高空飞行时,机翼等迎风面结冰现象及其防冰除冰技术的特种风洞设备。其中存在制冷系统、喷雾系统和高度模拟系统等多个关键技术难题,为扫清结冰风洞建设的技术障碍。该中心新建成的每秒千万亿次计算机系统投入运行后,极大提升了我国计算空气动力学能力,攻克了特种风动的种种难题,完成实验。
超算能力与网络安全系统是紧密相连的。他人超算能力一旦领先,意味着有能力匹配破解自家安全门锁的钥匙,甚至可以打开任何锁,等于自己家里所有东西都将处于不设防状态。原来能破解64位的密码,现在一升级,就能破解128位的。如果不升级安全系统,整个密钥就失效了,用超级计算机就能强行攻破,拿到对方的情报。所以超算的运算能力在网络安全方面相当关键。
自己究竟是什么样的人?超级计算机在认识自己方面可以派上用场。该功能的正式名称叫“个性特征服务”。美国的IBM超级计算机“沃森”通过对每个人2300条最新社交网络推文的解读,应用语言学分析方法归纳总结你的社交特性,然后将你与其他几十万甚至数百万用户进行比较,从而勾勒出你与众不同的个性。进而分析你适合的工作,职业,以及自身的长处、缺点,帮助人们更好地认识自己。
寻找失踪物 军事 网络安全 计算“个性”
超算面临的挑战
超算在开发制造、实践应用方面还存在着许多“拦路虎”:
软件开发困难 利用率不足 资源耗费惊人 体积巨大
维护复杂
人才稀缺
超算的不同结构
超算的两大阵营:同构计算、异构计算两种结构
同构计算:采用同构计算架构的超算只需要单纯使用一种处理器,在同一类型的处理器上执行计算任务。 异构计算:使用不同类型的处理器来处理不同类型的计算任务。采用异构计算架构的超算会使用至少2种类型的处理器,其中异构计算架构中通用CPU负责逻辑复杂的调度和串行任务,加速器负责并行度高的任务,实现计算加速。
日本超算“京”采用的处理器是富士通的Sparc64-VIIIfx
国产超算神威蓝光采用了申威1600
美国的Mira采用了PowerPC-A2处理器
美国的Sequoia采用了PowerPC-A2处理器
泰坦有18688个运算节点,每个运算节点由1个16核心AMD-Opteron-6274处理器和1个NVIDIA-Tesla-K20加速器组成,共计299008个运算核心
天河2号有16000个计算节点,每个节点由2片Intel-E5-2692和3片Xeon-Phi组成,共使用了32000片Intel-E5-2692和48000片Xeon-Phi。
曙光6000
天河一号
总结:两种架构的比较
同构计算编程方便,效率高,通用性强。 异构计算可以获得很高的浮点性能和性能功耗比,而编程较复杂,通用性较差。
各厂商的“代表作”
不同的历史,侧重点、凭借自身优势,各厂商打造了不同的产品。

英特尔SSF是一种高级架构和互联技术,用于支持可扩展性更强、更灵活和更均衡的HPC系统。英特尔SSF将帮助简化HPC系统的采购、部署和管理,使HPC能够应用于包括数据驱动的分析、可视化和机器学习等在内的更多行业和更广泛的工作负载。英特尔宣布试产的英特尔至强融核处理器(代号为 Knights Landing)正在多个超级计算系统上运行。Cray当前有一款系统正在运行多个用户应用,它们正为在美国洛斯阿拉莫斯国家实验室(Los Alamos)部署的Trinity 系统,以及在美国国家能源研究科学计算中心(NERSC)部署的Cori 系统开展准备工作。此外,Atos和Penguin Computing还分别在法国新能源与原子能委员会(CEA)和Sandia国家实验室部署了类似系统。英特尔预计在产品发布时,将会有超过50个系统 提供商推出基于英特尔至强融核产品家族的系统。

IBM这款超级计算机被称为Summit。Summit超级计算机原定计算性能是150petaflops,交付性能将达到200petaflops。而中国的 TaihuLight超级计算机性能指标是93 petaflops,峰值性能是124.5petaflops。IBM这款超级计算机交易据说价值3.25亿美元。Summit超级计算机采用IBM Power9微处理器和NVIDIA Volta GPU进行数学协同处理。Summit的前身Titan超级计算机,拥有超过18000个节点,而Summit将有约3400个节点。每个节点将拥有至少 500GB相干内存,以及800GB非易失性内存。为了给客户提供很高的I/O吞吐量,节点将使用Mellanox公司的双轨InfiniBand EDR连接以无阻塞胖树架构互联。看来超算领域还是拼钱拼爹,山姆大叔还是钱多~

惠普 Apollo 8000系统:推进超级计算科学的发展作为散热媒介,液体的制冷效率是空气的1000倍。然而,液冷技术的设计复杂性以及损毁风险让企业对昂贵的高性能计算系统望而却步。惠普通过采用全新的专利技术解决这些问题,从而保障液冷无风险运行。
  惠普 Apollo 8000系统是世界上第一个100%液冷超级计算机,拥有内置的硬件保护技术。这个系统采用每机架最多144个服务器的可扩展机架设计,每机架的浮点运算 次数是风冷设计的四倍,其高能效设计还可帮助企业的数据中心每年减排高达3800吨的碳氧化合物废气。
  客户还可以回收利用系统散热产生的热水作为设施的热源。美国国家可再生能源实验室(NREL)曾利用超级计算机的独特设计打造了世界上最环保的数据中心之一,利用超级计算机产生的废热加热邻近的办公室和实验室。

戴尔全新HPC产品组合更“快”的选择和部署本次全球推出的戴尔HPC系统产品组合,和数据分析系列解决方案既可提供定制的HPC系统的灵活性,又具备预配置型系统的速度、简便性和可靠性。针对特定的科学、制造和分析类工作负载,戴尔工程师和领域专家设计并优化了这些全新的HPC系统,不仅为之配备了经过 全面测试和验证的构建块,还跨解决方案的整个生命周期提供单点的硬件支持和额外的服务选项。

深腾X8800是一套方案,核心是联想智能超算平台LiCO(Lenovo Intelligent Computing Orchestration)。它是联想推出的HPC平台级产品,集成了计算库、调度软件、计费软件、集群管理软件、集群监控软件和报警软件、分布式文件软件,并通过集成Web界面,降低用户的使用门槛。与此同时,通过开放的接口,为二次开发和定制化提供支持。
  据悉,LiCO可以有效提升HPC硬件节点管理水平,配合具有国际品质保障的联想x86服务器产品,能够为E级超级计算机提供可靠性的保障,从而确保上万以上节点所需要的可靠性和稳定性。
  在功耗方面,联想NeXtScale SystemM5服务器采用WCT水冷技术,可以帮助排放85%~90%的热量,而且独有的温水冷却技术,允许入口水温达到45℃,如此就可以通过空气进行冷却,不需要热交换器,从而可以有效应对超级计算机功耗的难题。

星河SDC1000,是曙光面向云计算应用的一款服务器,采用弹性、异构、按需简约的设计理念,具备软件定义、模块化设计、高密度、高可扩展、高性能功耗比和高性能价格比等特点,是一款继机架式、刀片式服务器后的融合架构服务器标志性产品。 “M-Pro”服务器以应用为核心设计,通过Multi-Host网络芯片连接多个处理器,采用了新型服务器架构,实现了更均衡的网络I/O,提升了服务器对高性能计算、大数据和云计算各项要求的解决能力。
  经过测试,“M-Pro”架构服务器相比普通双路计算节点实测应用性能显著提高,如计算化学、材料模拟、气象预报等多个领域的应用测试数据都展现了近150%的性能提升。

浪潮NF5568M4采用Intel最新Haswell处理器与GPU加速计算技术的协同,CPU主要承担其更擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几十倍的增长。
  作为一款面向高性能计算的创新型产品,NF5568M4搭载2颗Intel E5-2600v3处理器,在4U空间内支持4个双宽GPU/MIC扩展,满足高密度并行计算需求。NF5568M4可同时执行数千个线程,系统能同时处理更多的信息流。
  在内存容量方面,NF5568M4板载16根DDR4 内存插槽,带宽提升50%的同时功耗却降低35%,为功耗较高的HPC集群节省较大的电力支出。
  浪潮NF5568M4为GPU提供高速PCI-E3.0连接,确保所有板卡在全速IO速率运行。相对于传统PCI总线在单一时间周期内只能实现单向传 输,PCI-E的双单工连接能提供更高的传输速率和质量,带宽达到32GB/s!并且提供7个PCIE槽位,提供完美的扩展支持。另外,NF5568M4 的4U机箱也给功耗较大的GPU留有足够的散热空间,保障GPU服务器整机寿命。

华为FusionServerX6800是面向高性能计算的一款全新架构服务器,采用4U结构设计,在4U空间里集成8台1U服务器或4台2U服务器,相比传统1U机架服务器密度提升1倍,能耗节省10%,整体拥有成本(TCO)降低20%。在不改变原生态系统的前提下,针对高性能计算应用实现服务器架构 的极致化创新与优化。

国内外超算PK
“神威”速度完胜对手,而国产实用性仍欠缺
国外超算专注于应用:
IBM的超级计算机“沃森”曾经参加了知识问答节目并战胜人类,它还被送入大学深造以磨练“学习能力”,被花旗银行和医疗机构“雇佣”帮助金融决策和诊断 IBM的“蓝色基因”超级计算机在欧盟十亿欧元的巨资资助下正在尝试复制人类意识 美国印第安纳大学日前获得了世界上第一台千万亿次级别“大学专用资源”超级计算机,帮助学生和工作人员研究各个学科。
国内超算空闲率高:
天河2号有21个机柜,再加上服务区的机柜,一共有200多个机柜,目前都可以正常工作,天河二号的利用率基本稳定在40%左右,还有60%是闲置状态。
神威问鼎TOP500榜单,而另一份Graph500榜单侧重的是实际应用,代表超算对大数据的吞吐和处理能力。与计算速度本身相比,在以易用性和耗电量等指标评价超级计算机的性能时,中国超级计算机的存在感仍然淡薄。
对于超算,他们有话要讲
 

“天河2号”副总设计师 卢宇彤

超级计算机的应用是跨学科项目,需要各个领域交叉学科人才来支撑。相对应的,超算人才的培养也不应该仅仅局限于计算机学科。超算教学应该推广到全校的理工科甚至医科院系,培养学生的高性能计算思维。开设一些如“高性能计算”、“并行算法和编程模型”等的课程,将超算课程体系的建设与各个领域、各个专业的教学体系相联通,帮助学生掌握可计算建模和并行计算方法。

中国工程院院士 王恩东

超算要取得更长远发展需要解决架构难题。如何开发更加创新的系统架构从而突破性能瓶颈,使超算性能从千万亿次上升到百亿亿次,这是全球超级计算机专家都关心的话题之一。目前有一种CPU+GPU+MIC的创新技术架构,这种架构被被认为是突破P级到艾级最有可能的方法。

中国计算机协会秘书长 张云泉

我国超算领域正处于高速发展的上升阶段,未来前景十分看好。因为超算和国家的创新能力、综合国力直接相关,对国家转型发展有重要意义。国家需要转型发展, 首先是需要中国创造,其中很大的部分要依赖计算科学。基于超算的计算科学、计算模拟的设计、模拟、优化,对工业界提高竞争力有很大的帮助,所以很多企业和 单位都在持续投入。

关于我们  联系我们  ENI服务
Copyright (C) enicn.com, All Rights Reserved