取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 存储 > 存储系统 > 正文
富士通24控、400万IOPS新高端存储DX8000 S3架构点评
来源:高端存储知识  :西瓜哥 2015-07-10 13:01:23
7月1日,党的生日,中国股市下跌的日子。富士通也在那天向全球发布了其高端存储第三代领导集体ETERNUS DX8000 S3。

7月1日,党的生日,中国股市下跌的日子。富士通也在那天向全球发布了其高端存储第三代领导集体ETERNUS DX8000 S3。

其最大的领导DX8900 S3最令人惊讶的参数是最大支持24控,为目前所有的高端之最。EMC VMAX3,HDS VSP G1000,包括一向以硬件规格自豪的华为OceanStor 18000 V3都是16控。一向低调的日系厂商,终于也高调了一回。至于400万随机IOPS,其实在24控的情况下,绝对值虽然最高,但平均到每一控也不算高。因此倒是没有令西瓜哥太惊讶。

\

至于供货时间,这个月底这两个产品就可以供货,但大于8控的DX8900 S3,供货时间推迟到11月底了。

\

富士通S3如何做到24控?其架构比S2到底有哪些改进,又有哪些trade-off(取舍)呢?

\

其实,架构最大的变化就是从紧耦合转向了松耦合。如果大家熟悉EMC VMAX的架构,一眼就看懂了富士通的DX8000 S3架构。几乎是一模一样的,只是EMC采用两台Infiniband交换机,而富士通采用了4台PCIe交接机。也就是说,每个控制框是一个2控的类中端存储,每个类中端存储有自己的CPU、内存和接口卡和硬盘框。12个类中端存储通过四个交换机连接起来,就是富士通的新架构——四星架构(Quad Star Architecture)。

\

对比DX8700 S2的架构,我们发现,最大的变化就是后端路由器BRT没有了。

\

没有了BRT,也就是没有了后端的全连接。系统的可靠性下降。因为不是所有的控制框都看到所有的控制器了,如果同一个控制框里面的两个控制器都失效,系统将不可用。

但是采用和VMAX一样的松耦合架构以后,扩展性更好了,这也是为什么富士通直接可以做到24控的原因。

由于富士通采用PCIe的交换机,西瓜哥记得Avago刚刚不久前才发布了25端口的PCIe交换芯片,这个芯片就可以用来制作24口PCIe交换机(其中有一个端口做管理用)。不知道富士通采用谁家的芯片?我们看到其到11月底才能交付8控以上的版本,不知道是否也是等24口的芯片量产?

而EMC VMAX采用Infiniband,市场上100口的交换机都有,应该是EMC认为目前高端存储16控完全够用了,因此没有拉高这个参数。

而华为OceanStor 18000 V3也是采用PCIe交换机,指标也是紧跟EMC,保持在16控。但华为的控制框采用4控紧耦合的方式,可靠性上克服了原来双控控制框出现一个控制器故障时引起的性能下降(因为要关闭写cache),减低故障期间再出现故障就会造成系统不可用的风险。因为一般大城市上门时间都需要4小时,如果偏远地方时间会更长。

而HDS VSP G1000,每个控制框是8个控制器紧耦合,可靠性又高了一些。但这种设计,扩展起来不太方便,目前支持2个控制框通过PCIe连接在一起,也是最大16控。

至于为什么富士通采用4个交换机而不是两个,西瓜哥认为主要考虑带宽的影响。因为S3的架构取消了后端的BRT,所有的数据交换都需要通过FRT进行,而目前PCIe单端口的带宽比Infiniband还是要小一些,因此富士通采用4个交换机主要是为了增加节点间的带宽。原来EMC VMAX 40K也是采用4个Rapid IO交换机,也是为了增加带宽,现在换成Infiniband了后,单端口就56Gbps,因此其最高型号VMAX 400K也是两个交换机就够了。

\

具体到每一个控制模块CM,我们看一下其内部架构和相关连接技术。我们看到,PCIe交换机的连接采用的是PCIe 3.0,后端磁盘框连接采用SAS 3.0。都是目前最新的版本了。

\

为什么S3的性能要比S2要好很多,除了CPU和内存提升外,关键一点是CM多了一个PFM,也就是大容量flash cache,但奇怪的是接口居然采用PCIe 2.0,不知道为什么不采用3.0,可能是这个闪存卡不支持吧?这个PFM作为二级Cache使用,弥补DRAM的不足。富士通说采用PFM性能比不用提高了4倍。而DX8900 S3比DX8700 S2性能只提高了8倍,最大随机IOPS是400万。看来硬件升级和控制器数量的提升才提高2倍性能,关键还是大容量PFM(最大支持60多TB)提高4倍性能,可见这个大容量二级cache的威力。

而华为OceanStor 18000 V3虽然在DRAM上要大于富士通,而且也支持Smart Cache,但需要配置SSD盘,占用SSD槽位,效率上肯定不如PCIe闪存卡。

而EMC VAMX3,虽然DRAM和华为一样是16TB,但目前EMC高端还没有实现SSD cache的机制(中端支持),目前其SSD只能做分层使用。

富士通的CM都有两个BUD(镜像),也就是固态盘,用来保存OS的image文件,配置信息,而且也是作为掉电保护的临时数据区。

由于富士通DX8900 S3支持24控,因此可以支持更多的I/O插卡,最大支持384个FC端口,和华为持平。

\

为了实现掉电保护,每个控制框里面都有BBU电池。这个和富士通的低端产品不同。低端产品由于cache比较小,因此直接采用超级电容的方式。

\

但磁盘框富士通采用和中低端完全一样的低密磁盘框。富士通宣称,DX S3系列只需要更换控制器就可以实现升级。目前,其中低端采用的高密框高端里面并不支持。

\

为了工程方便,富士通把4个PCIe交换机都放在一个机框里,里面还有一个SVC管理模块,统称前端框FE。这个FE是整个系统架构的中枢,控制和数据路径的集中点。这种设计物理上集中在一个框内,容易让人产生单点故障的错觉。不知道里面的电源设计是否各自独立?

\

由于是高端存储,一般情况下都需要配置一个1U的网关服务器来实现call home功能。

\

至于软件方面,DX8000 S3可以看到实时的电源消耗,这个西瓜哥感觉比较直观。很多产品只看到温度,但看不到实时功耗。

\

DX8000也支持自动QoS。这个软件功能也是一大特点。也就是可以根据用户配置的SLA(支持时延和优先级)和自动分层结合起来。

\

当系统通过调整带宽和CPU资源也实现不了用户要求的时延的话,自动分层将自动提高性格卷的高性能容量层的比例,直到时延满足要求。

\

这种机制和EMC的SLO的管理方法已经非常类似了。只是EMC更加会营销,并且采用出厂预配置的方式,易用性更高。但富士通这样做保持了更高的灵活性。

\

在RAID方式上,富士通从S3开始就支持一种特别的RAID方式,叫RAID6-FR,FR表示fast recovery,即快速恢复。其原理和华为的RAID 2.0比较类似,只是华为是全局实现,而富士通是局部实现,因此,还是有一些不同。富士通宣传1TB磁盘的重构时间是90分钟,比华为宣传的30分钟慢一些,但比传统的RAID方式已经快了10倍。具体的原理和局限,西瓜哥将在下一节单独介绍。

\

总结一下,富士通DX8000 S3新高端存储最大的变化就是采用了类似EMC VMAX一样的松耦合架构,扩展到了24控,400万IOPS,另外利用大容量的flash cache,性能比老产品提高了8倍。自动QoS和fast recovery也很有特点。但也有一些trade-off,比如抛弃了后端的全连接,4个PCIe交换机物理打包在一个前端框里,可能会引起部分对极致可靠追求用户的担忧。

估计几乎没有用户能用到24控,但富士通引领这个高端存储非常关键的指标,一改日系厂商低调保守的形象,估计比较受类似中国政府部门这些喜欢拼参数的市场的欢迎。好在富士通在中国主要聚焦运营商市场,其他行业碰到很少。但从新产品的规格和功能来看,其DX8000 S3是一个比较理想的OEM对象,据说已经有中国厂商在洽谈OEM事宜,高端存储市场的混战将不可避免。

编辑:高玉娴
关键字:     富士通  高端存储  架构 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。