取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 服务器 > 高性能计算 > 正文
软硬兼施两翼齐飞 解码戴尔HPC新策略
来源:戴尔企业级解决方案微信公众号   :佚名 2016-11-17 11:42:15
中国高性能计算的发展,如今已进入一个新的阶段,由此产生了更多的新机遇和新挑战。具体来说,从原本的科学计算已经逐渐延伸到了商业化领域中,发展的潜力更为巨大;与此同时,互联网重新发现了HPC的价值,以数据分析和机器学习为主的新应用带给了新的想象空间。 从这个角度来看,中国高性能计算市场演进的新趋势,也正和戴尔所提的HPC“民众化”价值新主张一脉相承,它证明了戴尔对HPC市场超前的判断力和洞察力。更为关键的是,在此过程中,戴尔始终坚持HPC软硬兼施的两翼齐飞战略,也给它未来的发展带来了新的驱动力。

中国高性能计算的发展,如今已进入一个新的阶段,由此产生了更多的新机遇和新挑战。具体来说,从原本的科学计算已经逐渐延伸到了商业化领域中,发展的潜力更为巨大;与此同时,互联网重新发现了HPC的价值,以数据分析和机器学习为主的新应用带给了新的想象空间。 从这个角度来看,中国高性能计算市场演进的新趋势,也正和戴尔所提的HPC“民众化”价值新主张一脉相承,它证明了戴尔对HPC市场超前的判断力和洞察力。更为关键的是,在此过程中,戴尔始终坚持HPC软硬兼施的两翼齐飞战略,也给它未来的发展带来了新的驱动力。

解码高性能计算新变化

HPC市场已经走进了一个新的十字路口。这种变化可以从三个维度来看,具体而言:

第一,是HPC技术和产品层面的变化,除了处理器之外,包括GPU和众核加速器、高性能网络设备以及高性能SSD都进一步得到了广泛的应用。

- 从架构方式看,Cluster(集群)正在替代MPP(大规模并行处理)分布式架构成为市场主流,这是因为集群分布式架构更为通用,更能有效承载的应用范围更广。 - 从计算方式看,高性能数据分析(HPDA)应用成为了超算的下一个爆点。数据显示,目前67%的超算资源用于HPDA,这其中欺诈检测、机器学习、人工智能等需求是其中较为典型的应用。

第二,是HPC全球市场的变化。这其中,中国成为了高性能计算应用的新战场,如今在超算TOP500榜单中,中国超算在性能、技术排名上都全球领先。 第三,HPC得到了中国政府的高度重视,无论早前政府工作报告中提及的“互联网+行动计划”、“大数据发展行动纲要”还是今年提出的“新经济”以及旨在调整经济结构的“供给侧改革”等新举措,都将对高性能计算的发展起到有力的推动作用。 随着戴尔中国4.0新战略的起航,其“在中国,为中国”的理念将使得它未来的发展计划与中国经济发展和国家政策紧密结合。同时,戴尔不断融入中国本土的IT生态系统,这都对戴尔HPC在中国的发展,起到了重要的助推作用。 例如,去年11月份,戴尔和中国科学院自动化研究所合作共同建设“人工智能与先进计算联合实验室”,就是戴尔中国4.0发展战略的具体体现,而戴尔助力中国人工智能领域的科技创新,也获得外界的认可。在HPC China 2016上,中国计算机协会高性能计算专业委员会为戴尔,颁发了“人工智能技术实践创新奖”。

“开箱即用”HPC新理念

值得一提的是,秉承高性能计算“民众化”价值新主张,戴尔向HPC市场推出了一系列的“HPC Systems”家族,希望在生命科学、制造及教育科研领域向用户提供“开箱即用”的HPC系统,也可以称之为“HPC即服务”。

面向行业和新一代超算应用的"3+2"解决方案: 第一,针对生命科学行业需求而设计的戴尔HPC系统,可帮助生物信息学中心和遗传学中心,根据临床要求的时限交付结果并确定治疗方案,同时确保合规并保护机密数据。 它完全集成式的HPC解决方案,包括了戴尔的Networking、PowerEdge 和 PowerVault产品组合,支持研究人员和临床人员利用易于部署、基于开放标准的架构,更快地获得洞察力。 第二,针对制造行业设计的戴尔HPC系统,可帮助制造和工程客户运行复杂的设计仿真软件,包括结构分析和计算流体力学分析。 在这套HPC系统中,戴尔与众不同之处在于它预先调整了为特定应用程序集的系统优化设计,众多专业应用软件都在这套系统上提到做了验证,包括ANSYS力学、CD-Adapco、电子设计自动化(EDA)。 第三,针对科研教育行业设计的戴尔HPC系统,这是一套可帮助科研、教育机构根据各种工作负载的独特需求快速开发的HPC系统,以方便用户开展复杂的科学分析。 在这套HPC系统中,戴尔的独特优势体现在提供了同类最佳解决方案,包含在性能、密度、能效和功能方面处于业界领先地位的产品;模块化设计可根据用户的具体工作负载自定义系统。 除此之外,戴尔还强化了超算在存储环节的产品力度。我们知道,在HPC中,计算部分的能力越来越强,存储也必须与时俱进。所以,HPC如今最关心的问题往往是处理器算得这么快,存储是不是能跟得上?同时,数据量越来越大,IO往往成为瓶颈,这都需要一套可靠的存储架构来做支撑。 基于此,戴尔推出了高可用的Dell HPC NFS存储方案,全套NFS解决方案构建在久经考验的戴尔硬件基础之上;在单个命名空间,可从最小48TB扩展至480TB的原始容量;配置100GB Intel OPA网络,可实现1.85 GB/s的写性能,6.5 GB/s的读性能;同时,戴尔还调整和配置最佳做法,实现了30%的性能提高。 不仅如此,戴尔还提供了Intel Lustre的Dell HPC高性能存储方案。Intel Lustre是一种开源的分布式文件系统,同时也是并行文件系统。它的优势包括提供单一命名空间;可增加节点数来扩展容量和性能,并支持在线扩展;支持多个客户端并发读/写,通过分布式锁机制保障数据一致性等。 在这套分布式文件系统上,戴尔借助Intel Lustre动态存储扩展功能,让“每构建块”的峰值达到 18.5GB/s 读取速率和 15.1 GB/s 写入速率。

软硬两翼齐飞新策略

当然,戴尔除了在HPC硬件层面不断发力之外,在软件层面同样坚持“开源、开放、融合”的策略,由此实现了HPC“软硬兼施”的两翼齐飞,具体表现在:

其一,不断打磨高性能计算运维管理软件,和硬件投入相比,HPC日常管理也属于“刚需”。特别是对于大部分商业化机构来说,实现HPC时时监控与日常系统运维,都是摆在上述用户面前的关键性问题。 在这方面,戴尔和Bright Computing展开深入合作,通过Cluster Manager单一易用的图形用户界面进行超算系统的管理。此外Cluster Manager集群管理平台,以极高的效率和单守护进程,最大限度地降低了超算管理的成本,最大限度地提高系统的吞吐量,提升了系统的整体性能。 其二,为满足用户对开源软件的新需求,戴尔继续强化了和Bright Computing公司的合作,在大数据Hadoop、私有云管理平台Openstack以及深度学习领域的共同研发合作。特别是戴尔分布式深度学习方案,可选的机器学习框架就有Caffe、Torch、Tensorflow、Theano;可选的机器学习库包括MLPython、cuDNN、DIGITS和CaffeOnSpark。 其三,戴尔对OpenHPC项目同样非常重视,这不仅是因为戴尔是OpenHPC创始成员之一,更为关键的是,戴尔相信开源的普及不仅流行于企业级市场的今天,也将是HPC市场的明天,由此戴尔必须对此有所准备。 最后,戴尔在北京建立了高性能计算创新实验室,可帮助中国的用户实现软硬件的测试、验证和创新,迄今为止安装测试过的平台软件包括:CentOS、Redhat Linux、Altair PBSworks、Intel Enterprise Lustre、联科集团的CHESS、并行科技的Paraplus、蓝海彤翔的COMS以及OpenHPC。

编辑:郑絮娟
关键字:       Dell 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。