取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 存储 > 存储管理 > 正文
知识大串烧!企业存储技术名词温故知新
来源:中关村在线  :佚名 2015-07-07 10:16:49
过去20年,自共享存储引入以来,数据的指数式增长对企业是一个重大管理挑战。人们对于存储的需求难以得到满足,每年对数据增长速度的预测都从50%-100%不等。为了有效管理数据增长,存储供应商们实施了一些能够优化物理存储容量使用的软件功能。这些功能让数据存储变得更加智慧,而企业存储技术名词对于一般用户而言更多比较“高端”,让我们一起去了解一下这些“高富帅”。

过去20年,自共享存储引入以来,数据的指数式增长对企业是一个重大管理挑战。人们对于存储的需求难以得到满足,每年对数据增长速度的预测都从50%-100%不等。为了有效管理数据增长,存储供应商们实施了一些能够优化物理存储容量使用的软件功能。这些功能让数据存储变得更加智慧,而企业存储技术名词对于一般用户而言更多比较“高端”,让我们一起去了解一下这些“高富帅”。

精简配置,这是一种空间节省技术,可以仅存储主机在磁盘上写入的数据。通过仅存储实际写入每个卷的数据,而不是像“厚”配置实施中储备整个卷容量,从而实现空间的节省。虽然精简配置解决方案可以节省 35%-75%的物理磁盘容量(具体取决于数据配置文件),但需要持续不断的清理工作,才能保持效率并达到最优的性能水平。

零页回收,这种空间节省技术可以识别空页或“为零的”数据,并从物理磁盘中将它们删除,保留元数据信息以识别卷中的逻辑页是否为空。大多数解决方案使用后处理零页回收 (ZPR),因为以实时方式识别空页的消耗会影响 I/O 性能。

数据压缩,这种空间节省技术可以识别重复样式或冗余数据并将其删除,保留允许重新创建原始信息的元数据。虽然压缩可以实现大幅空间节省,但对处理器消耗的要求意味着很多供应商都不会选择实施这种技术。

空间高效快照和克隆,并不是一种空间节省技术,但对主数据的快照和克隆可以通过节省空间的方式进行,使用元数据跟踪主卷和快照之间的不同。在一些架构中,使用快照有一些性能隐忧;一些架构还要求保留空间来用于快照池,但一些平台中并没有限制。

在企业存储技术中,除了上面提到的技术名词,最多的应该是—重复数据删除技术。它可以识别物理存储中冗余或重复的数据,删除冗余副本,在磁盘上仅保留一份数据副本。元数据(在内存中保存为查找表)用于将逻辑卷映射到数据的单个实例副本。在包含很多类似或重复数据的系统中,例如虚拟服务器和虚拟桌面环境中,可实现物理磁盘容量的大幅节省。截至目前,重复数据删除已经在磁盘备份系统中广泛使用,实现物理容量节省幅度达到90%-95%或20:1以上。

重复数据删除的一些技术特性包括:

内联/后处理,重复数据删除可在向磁盘传输数据时进行(称为内联),也可以在数据已位于磁盘上时进行(称为后处理)。内联处理要求使用快速高效的算法,将对性能的影响降至最低,从而立即增加空间节省的收益。后处理虽然可以消除任何直接的性能影响,但对物理磁盘空间的使用将有所不同,因为在数据写入磁盘后,重复数据删除仅作为后台任务运行。

固定/可变块大小,重复数据删除技术可识别使用固定或可变数据块技术生成的潜在重复数据。可变块算法通常比固定块解决方案的重复数据删除率更高,但要求的处理消耗也更大。而更小的固定块则倾向于产生更为高效的结果,但在额外元数据查找方面对处理器消耗和系统内存要求的成本也更高。

数据哈希,哈希指通过数据块生成唯一校验和值的过程。每个块的哈希值用作在元数据表中引用该数据且将新数据与重复数据删除相比较的特征。哈希技术在可靠性上有所不同,一些算法可为不同数据生成相同的哈希值,称为“哈希冲突”。哈希算法的复杂性与对性能的影响之间应保持平衡,一些实施方案使用少量哈希,并会在确认重复数据删除前验证所有数据。

数据配置文件,对于访问单个卷的重复数据删除结果更为随机,因为逻辑卷布局尚未决定数据块的原始物理位置。随机数据访问对基于HDD的存储阵列而言更为困难,因为机械磁盘头的转动会使随机I/O结果发生大量延迟。另一方面,闪存存储就不会有这类问题,这使此技术非常适用于管理因重复而被删除的数据。

对于企业存储技术有了概念上的认知,在陆续应用内容上可以进一步结合名词来深入了解企业方案中这些技术所带来的真正效果。

编辑:闫春春
关键字:     名词  知识  企业存储 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。