取消
搜索历史
热搜词
原创
活动
创新2.0
I T
产业
当前位置:首页 >互联网•IT > 存储 > 数据备份 > 正文
备份性能有问题?看EMC技术大牛如何逐个排查原因(下)
来源:搜狐科技  作者:EMC备份恢复支持部 Jim 2017-08-21 09:47:27
之前,EMC技术大神Jim列出了影响备份性能的多种原因,从存储节点到VTL的数据流,各个流程都可能影响备份速度。今天我们把剩下的内容讲完,看看通信协议是否也会影响性能,以及从Data Domain本身找找原因。

DD VTL备份速度慢?也许你错怪它啦。昨天的内容中,EMC技术大神Jim列出了影响备份性能的多种原因,从存储节点到VTL的数据流,各个流程都可能影响备份速度。今天我们把剩下的内容讲完,看看通信协议是否也会影响性能,以及从Data Domain本身找找原因。

文/EMC备份恢复远程支持部 Jim

TCP/IP网络方面,我们可以增加TCP window size 和buffer size来提升数据在网络传输过程中的吞吐量:

∧∧向上滑动浏览∧∧

  • Oracle Solaris

    • tcp_default_mss-recommend is 1500 MTU

    • tcp_sendspace-changed to 16KB or 32KB

    • tcp_recvspace-changed to 16KB or 32KB

    • 设置TCPIPWINDOW SIZE 63k 或者更高

    • 编辑文件in_proto.c 来调整下面的buffer size

  • AIX-no(network option)-我们可以使用’no’命令来调整网络参数

    • § lowclust = 200

    • § lowmbuf = 400

    • § thewall = 131072

    • § mb_cl_hiwat = 1200

    • § sb_max = 1310720

    • § rfc1323 = 1

    • Use no –a to view current settings

    • When using TCP window sizes ≥ 64, set rfc1323 to 1

    • Here are the recommended values for the parameters described in this section

  • Windows Platform

    • WIN2008: [HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesTcpipParameters] Tcp1323Opts,REG_DWORD, 3

    • WINXP/2K3: [HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesTcpipParameters] DefaultSendWindow"=dword:1048576

DefaultReceiveWindow"=dword:1048576

GlobalMaxTcpWindowSize"=dword:1048576

TcpWindowSize"=dword:1048576

Tcp1323Opts"=dword:3

Linux-Check with “cat /proc/sys/net/ipv4/tcp_window_scaling” ,默认值应该大于64K

SAN网络方面:

  1. 首先需要排除的是有没有物理端口或光纤问题。例如我们可以用交换机的命令查看“porterrshow”-是不是哪个SFP有错误,比如’crc error’等物理错误计数。如果你看到哪个口错误比较多的,还可以看看光强度是不是够,这个可以用令’sfpshow’查看(brocade),建议值是大于-7dbm。

  2. 备份服务器和VTL是否跨多个交换机?建议不要超过3台交换机。另外,特别重要的是ISL带宽够不够用,备份数据流就像运矿的车,不但体积大而且源源不断的在跑运输,所以马路宽不宽也很重要。

  3. 长距离传输的话需要增加交换机的B2B credit buffer,这个就相当于tcp window size,一次传的数据大一点,可以免去在路上往返的开销。

  4. 我们建议主机那边的光口只连接到VTL,不能共享,这个也可以避免出现意外的通讯故障。

  5. Slow drain device-我们称之为累赘型设备。比如8G的SAN网络里连接了2G的节点,慢的设备会成为瓶颈所在,因为它处理数据很慢,其他设备都会因为等待它的回应而造成整体性能的下降。

  6. Zoning的配置很重要,多个initiator放在一个zoning 有时候会造成性能问题,因为他们彼此会尝试握手建立连接,但是永远不成功,所以对性能会有些许的影响。

最后,说一下DD本身到底什么情况下会影响性能:

  1. DD本身有硬件问题,比如硬盘或者内存的问题。

  2. 在出现坏的硬盘以后,RAID在数据重建,这个往往会消耗很多系统资源。

  3. 垃圾回收和复制同时运行,因为他们会占用很多资源,导致备份速度下降。我们建议备份窗口不要和它们重叠。

  4. 系统空间是不是超过了85%,系统空间越满,DD会占用约多时间来查找数据唯一性。

  5. VTL 的光口有没有负载均衡。

  6. VTL没有被充分利用,可以增加并发数据流来提高整体吞吐量。

  7. DD过于繁忙,没有过多资源来进行快速IO处理。我们可以用命令’iostat 2’来监控。

本次就聊到这里,对于DD虚拟带库的性能问题概括起来就是先排除DD本身有没有问题,比如硬件问题,空间使用情况,系统资源负载情况,光纤口有没有做到负载均衡。所有其他的瓶颈都是DD以外的,最直接的就是磁带设备的block size是不是大于256k。光纤网络有没有性能和配置问题以及备份主机的压力情况等等。总而言之,顺着单向的数据流一个个节点排查就是了。

编辑:赵津蔓
关键字:     数据备份 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。