取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
浪潮信息陈臻淞:共创多元算力应对AI时代算力挑战
来源:ENI经济和信息化网  作者: ENI 2024-02-21 13:57:04
本文整理自浪潮信息广东区资深架构师陈臻淞在东莞制造业CIO数字峰会上的主题演讲。通过深入剖析数字化建设面临的未来算力挑战,陈臻淞详细介绍了“多样化、专用化、异构化、系统化和绿色化”的多元化算力架构提供的应对方案及价值。

统一算力中心并非应对未来算力挑战的最优解

随着数据智能推动下的数字化转型深入发展,数字政府、工业互联网等数字经济以及数字社会的数字化建设呈现了“融合、智能、敏捷”的发展趋势。

而在人工智能快速发展的时代,相较于传统应用算力支撑的需求更加多元。比如以往AI的功能集中于模仿和交互,现在已经发展到了分析、预测,也就是AI的认知阶段。未来还将进一步发展到学习和演绎的阶段,慢慢实现通过预训练模型实现AI的自主创新,帮助各位企业家解决生产过程中的问题。

人工智能的发展趋势带动了用于处理海量数据的基础模型的迭代和创新,其最终目的是为了创造一个基础创新模型,让它适应更多的行业,能解决很多通用的问题。与此同时,还有一些专有行业模型以及技能模型也在不断的推出。

以上一系列的创新趋势需要比较大当量的算力去支持,这使得未来算力面临以下两种挑战:

挑战一:性能。大模型不同阶段算力需求非常大,但是处理器性能的增长变的缓慢,对存储的性能要求会越来越高,数据搬运的功耗也会有很大的提升。这就形成了未来数智化转型对基础设施的更高诉求。

挑战二:复杂场景。随着数智化建设的推进,企业会基于“线边计算”、“工业数据中心”、“云中心”落地一系列复杂场景。这已经超出传统IT应用的范畴,需要多部门的协同。复杂场景的落地以及对于协同的要求都对算力提了比较大的诉求。

应对这些挑战,以往的建设方案是通过虚拟化或者云化的方式满足算力的需求。但是,所有业务包括分析决策的智能系统都构建在统一的云上,使用通用算力,貌似实现了基础设施的智能化,但是对于业务端可能会有一点苦不堪言,我们建设的单一算力中心并不足以支撑全部业务。

多元算力架构满足不同业务场景算力需求

所以,我们提出要“系统化设计企业多元算力架构”。多元算力强调的主要内涵包括多样化、专用化、异构化、系统化和绿色化。

\

系统化设计企业多元算力架构(图片源自陈臻淞演讲PPT)

多元算力的多样化是能够满足不同的业务场景,其中包括云模式的通用业务,比如财务、生产等,这一类系统可以通过通用算力来满足;如果涉及到一些AI分析决策类,有模型训练需求的,可以通过专门的AI算力去支撑;对于一些关键业务,强调的是业务的可靠性,比如在金融行业还在用的Power服务器,基于业务可靠性的高要求更强调高性能、高稳定、高安全、强一致;而对于现在大家都比较熟知的边缘计算,随着数据的快速增长,以及数据的多样化导致的大数据量,采用以往传送至数据中心处理的方式,成本非常高,这种场景就可以通过边缘计算来支撑,在前端直接对边缘数据进行处理。比如智慧城市建设、企业质检等场景。

关于专用化。现在处理器的种类已经非常多了,英伟达关于算力的区分有好几种,比如现在人工智能很强调的数据中心级别的卡,用于游戏的桌面级别的卡,工作站级别的卡,边缘级别的卡。处理器其实也是一样,每个处理器诞生之初,它都是应对不同的场景去设计的,像英特尔、AMD,或者国产化的处理器,都是处理一些通用的业务。 另外一类是针对特定问题领域定制的结构,像英伟达GPU,谷歌TPU等等。

另外一个关于异构型。以往我们在数据中心的设计和建设中,一般会采用以处理器为中心的计算或者是以数据为中心的计算架构。这种方式往往因为计算融合造成内存通信的成本增高,或因内存的统一增加了计算和网络开销。我们提的融合架构强调个性化、异构化。即在数据处理对应提供相应的内存和网络支撑,改变各种处理器(如CPU和AI加速卡)和内存之间的连接架构,构建内存池,多算力共享内存池。

系统化的方式就是刚才提到的,我们做了大数据,打造了一套云之后,类似于铺了张地毯,地毯上放的就是我们的业务,地毯下的我们可能就不关心了。但如果涉及到异构、支撑多样化的场景,对于通用云的平台诉求就更多样了,通用云的能力略有不足,还需要一些算力的调度,基础设施的管理,这种管理是基于到达人工智能层级之后,创立的多元化的管理。除此之外,还应提供模型化的工具,能够支持快速产出所需要的AI模型。

最后要提到的是绿色化,关健指标是PUE,也就是数据中心能耗的问题,国家发改委已经多次强调,并且划出了数值指标。在节能降耗方面,以往是通过采用增加液冷等多种方式去节省非算力部分的供电。我们现在提的绝对能耗是另外一种方法,就是在可以选GPU的地方尽量用GPU,不用通用的CPU计算。例如,全部采用CPU算力需要1万瓦的电,通过GPU跟CPU混合的方式,可以让总电力降到9千或者8千,这是一个绝对值的降低,这也是多元算力实现的绿色化成果。

浪潮信息落地多元算力的方案及场景

最后关于制造企业构建多元算力的试点,我相信未来会有相应的平台将算力往边缘端、终端侧不断延伸。浪潮信息在这方面也做了一些方案,其中智能质检方案更多强调的是在算力侧,通过提供多元的算力去支撑智能质检,让更多智能质检系统商可以快速应用到这方面的算力。

\

浪潮信息智能质检解决方案(图片源自陈臻淞演讲PPT)

另外,企业IoT等应用沉淀下来的数据怎么用是一个很大的课题。这方面浪潮信息提供的方案可以从多层数据保存的方法去实现企业数据全生命周期的管理。

与此同时,还有机台数据热温冷分级存储的方案,针对不同场景,包括前端采集数据怎么去存到后方,后方怎么样让存储的成本更省。这方面浪潮信息可以提供一个存储分层的解决方案。

最近大家也看到Vmware被收购之后产品线的合并。浪潮信息是VMware全球七家OEM联盟合作伙伴之一,中国首家合作伙伴,最高合作级别。所以相关产品我们可以持续有供给的,其中inMerge1100是基于VMware vSAN架构的自有品牌超融合系统。SRDC整柜解决方案可以实现对集团性企业各分支机构的设备进行统一管理。

最后介绍一下SAP HANA解决方案,因为现在SAP软件在做一体机,所以我们会提供支持SAP HANA的一体机解决方案,这个浪潮信息已经做了七八年,在全国有数百个案例。

让我们“共同开启数字经济很局面,创造算力时代新机遇”,谢谢各位专家。

编辑:刘婧
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。