取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 存储 > 存储系统 > 正文
4TB硬盘10分钟重构时间,富士通RAID6-FR原理和性能点评
来源:高端存储知识  :西瓜哥 2015-07-10 13:09:03
传统的RAID组重构慢,主要原因是采用了单独的热备盘,重构的时候,这块热备盘的写性能是有限的,因此瓶颈在这块热备盘的写性能上。

昨天我们聊了富士通高端存储有一个fast recovery特性,其实原理很简单的。传统的RAID组重构慢,主要原因是采用了单独的热备盘,重构的时候,这块热备盘的写性能是有限的,因此瓶颈在这块热备盘的写性能上。

而富士通fast recovery的改进就是取消了传统的热备盘,RAID组里面的每个硬盘都保留一部分热备空间,当一块硬盘失效,所有的硬盘都可以写,也就是把单独热备盘的写瓶颈问题给解决了。

\

当然,这样做就必须对硬盘进行切片(CK),就像切西瓜一样(西瓜哥就是用切西瓜的方式来阐述RAID 2.0原理才被网友称为西瓜哥的)。因此,RAID的构建单位也是CK,而不是硬盘。这样的好处就是可以只重构有数据的CK,而不需要整个硬盘的CK都进行重构。

昨天就有网友讲了,这不就是RAID5EE吗?确实很像,但是富士通为了加快重构速度,不只是在一个RAID组里面实现,因为硬盘数太少,重构的速度不够快。富士通把多个RAID组再组合起来,组成一个bigger(逼格)的大RAID组,加快重构的速度。

咦,如果这样,那么不是RAID 2.0了吗?确实也很像,但仔细一看不太一样,因为RAID 2.0是全局块虚拟化了,不是一个bigger的RAID组,而是整个硬盘池。而且,RAID 2.0没有一个数据回拷的过程,而富士通的fast recovery更换故障盘后,数据需要回拷,这个时间也是很长的,因为这个时候,这个新盘的写入就是瓶颈点。

富士通的这种实现,感觉好像不如RAID 2.0,但有一个好处,就是可以继续支持磁盘休眠,因为其fast recovery还是一个比较小的池(bigger raid group),可以针对这个pool进行休眠。而RAID 2.0是全局的,无法实现硬盘休眠。富士通的高端存储也是唯一具有休眠特性的高端存储。虽然高端存储跑的一般是关键业务,全天候运行,但确实也有部分业务可能只需要白天工作,如股票市场。这种情况下休眠还是有一些节能的作用的。

原理虽然简单,但今天我们重点看看富士通RAID6-FR的具体实现和性能表现。

从富士通的技术白皮书,我们看到,由于重构池变大,为了可靠性的原因,富士通只实现了RAID 6的变种。这个思路有点像EMC XtremIO,Moshe Yanai研发的第三代高端Infinibox,都是只支持双盘失效一种情况。因此,少了华为RAID 2.0的灵活性。不过,需要其他RAID级别,富士通还保留传统的RAID方式。

\

我们看到,这个bigger的RAID组,最少包含2个小的RAID组,最大高达6个。这样就可以让整个重构池的硬盘数量更多,重构的数据就更快。(上面最后一行西瓜哥没有看懂,就是RAID组里面用户盘的个数应该是18,这么是24?这个盘的个数是一个容量的概念,不是一个物理的概念,因为都切成CK了。)

至于重构的相对速度,富士通给出的数据还是非常令人惊讶的。假设传统的RAID6(3D+2P)在没有主机负载情况下是1.0,作为基准线。如果正常有业务跑,那么重构速度就是0.5。我们看到,没有主机负载情况下,RAID6-FR最快可以做到比正常的快48倍,有负载可以做到快26.6倍。华为宣传RAID 2.0比传统的RAID快20倍,看来富士通也可以做到。因为华为为了可靠性,人为设置了一个重构域(64个盘),限制了参与重构的磁盘数量。

\

不同的RAID实现,容量使用率不同,保护级别也不同。用户可以根据自己需求选择。

\

富士通还针对各种RAID级别,采用不同的硬盘,对重构性能进行了测试。这个数据更能说明问题,我们没有看到其他厂商公布这么详细的测试对比。

从下图我们看到,在主机几乎没有负载的情况下,这个时候重构速度最快。我们看到,采用传统的方式,不管是何种RAID级别,重构速度只和硬盘类型有关。因为传统的RAID方式,重构的瓶颈在于热备盘的写入速度。300GB/15krpm的重构时间只有大约30分钟,而4TB/7.2krpm的重构时间需要9个多小时。但如果采用RAID6-FR,4TB硬盘的重构时间最快也只需要10分钟。

\

如果是主机有正常负载的情况,传统的RAID方式和RAID6-FR的重构时间都增长,因为阵列需要处理业务,一般重构的优先级会设置比较低。这个数据属于比较接近用户现场的数据。我们看到,4TB SATA盘采用传统方式重构需要18个半小时,而采用RAID6-FR最快只需要37分钟。

\

虽然富士通宣传1TB磁盘的快速重构时间是90分钟,但这个测试结果明显优于富士通的宣传。看来富士通宣传还需要更适合中国国情,从上表看,完全可以宣传4TB 10分钟(理想值)。这样重构性能基本就可以和Infinibox持平了(其重构域是480块盘)。

富士通RAID6-FR重构速度这么快,西瓜哥分析其CK肯定非常细。可能和Infinibox一样,直接采用4K,也就是条带的宽度。华为是64M,3PAR是1G,越大理论上重构越慢。

还有一个疑问就是不知道上面测试的时候硬盘的数据量是多少?因为快速重构可以只重构写过的CK,因此数据量少的时候,重构就更快。这块华为宣传的30分钟是指1TB的数据量,和盘的容量无关。而富士通宣传是1TB的硬盘。

关于富士通的RAID6-FR,我们认为还是一个不错的改进,其优点有:

1、保留传统的RAID组特性,可以支持休眠,支持跨磁盘框保护;

2、可以和传统的RAID组混用;

3、对系统的改造比较小,实现简单。

缺点当然也有,比如:

1、灵活性不够,只支持RAID 6;

2、故障盘更换后数据需要回拷,耗时很长;

而华为的RAID 2.0+,则是完全把底层架构推翻,全新的架构,开发难度比较大。但灵活性更高,没有回拷过程,可以实现数据自动均衡,对应用的性能支撑更好,因为一个卷可以跨越所有的硬盘。但也有不好的地方,就是不再支持传统的RAID方式,而且无法也无法实现硬盘休眠。

编辑:高玉娴
关键字:     富士通  RAID6-FR 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。