取消
搜索历史
热搜词
原创
活动
产业创新
转型理念
ENI专访
当前位置:首页 >文章发布 > 正文
卡斯柯公司核心系统异地灾备建设实践
来源:新工业网  作者: 佚名 2023-05-26 11:19:27
卡斯柯信号有限公司(以下简称“公司”)自 2010 年起,从公司战略出发,借鉴国内外先进的管理思想和管理经验,通过企业信息化建设,在管理制度、管理方法和手段等方面进行成功探索和创新,推动企业管理变革和管理提升,提高企业管理水平。

卡斯柯信号有限公司(以下简称“公司”)自 2010 年起,从公司战略出发,借鉴国内外先进的管理思想和管理经验,通过企业信息化建设,在管理制度、管理方法和手段等方面进行成功探索和创新,推动企业管理变革和管理提升,提高企业管理水平。随着集团化业务发展的需要和管理的不断提升,公司对信息系统的业务连续性要求不断增加,因此,公司准备打造一套可靠的异地灾备系统。

\

灾难恢复策略一般在灾备建设规划阶段制定,起到承上启下的作用。一方面,灾难恢复策略是在公司现有基础架构调研及分析结果的基础上,以国家规范、标准以及企业自身发展战略为依据,同时结合业务影响分析所确定的关键信息系统的现状而得出。另一方面,灾难恢复策略结合公司的 IT 实际状况,指导后续灾备建设的技术方案设计

\

灾备建设规划

一、建设策略分析

根据对既有 IT 架构现状和灾备需求分析(可恢复能力、业务影响分析),公司制定出本次灾备系统建设的范围及策略 :

1. 针对核心业务涉及的系统和数据,包括 SAP ERP、SAP CRM、SAP BW、K2、Project。

2. 灾难恢复指标 :RTO( 恢复时间目标 ) <4 h,RPO( 恢复点目标 )<30 min。

3. 在北京分公司建设异地灾备系统,以便应对更大范围的区域性灾难,形成上海总部生产中心、北京分公司灾备中心的框架。

4. 灾备切换场景设定为异地灾备中心整体切换,即当上海生产中心发生数据中心场所灾难且所有业务中断时,将启动异地灾备中心恢复核心应用。

二、总体架构设计方案

根据完整性、开放性、兼容性性、安全性、稳定性、可管理性、经济性的设计原则,公司进行整体的建设方案设计研究。经过前期的调研,集团化公司核心系统异地灾备建设方案包括如下几个方面 :

1. 数据复制策略

数据复制由关键数据保护出发,从生产端向灾备端对关键数据进行复制,以提供关键数据的保护能力。关键数据通常分为两大类 :静态数据和动态数据。静态数据主要是一些程序文件、程序配置文件、配置参数等信息 ;动态数据通常为随着业务操作而变化的数据,通常是一些与数据库相关的数据。

动态数据可以使用远程复制技术进行同步的数据复制,而静态数据可以使用一些同步数据复制工具进行定时数据同步或者可以由人工发起复制进行数据备份。同时,也有部分的静态数据是比较难通过数据备份的方式将数据直接备份到灾备中心的,如操作系统的升级数据、补丁数据、用户列表、用户密码口令等。对于这部分的数据,可以通过制定变更管理流程,人工方式进行同步更新。

经过分析,可以通过灾备系统进行复制的数据类型

复制的数据类型

\

2. 灾备中心切换方式

灾备系统应在灾难发生后保证两中心业务的顺利切换,应用切换是实现业务接管的关键技术之一。保证应用能够实现切换的前提包括 :

(1)灾备中心的系统数据、业务数据可用。

(2)在灾备中心设置冗余的服务器平台,包括支持该业务的数据库服务器、中间件服务器、应用软件服务器(含接口服务器)等。

(3)客户端或外围系统到灾备中心的网络可以通达。

(4)应用软件在灾备中心服务器平台能够稳定运行。

应用切换技术包括 :自动切换、半自动切换、手动切换。

应用切换技术

\

考虑到生产业务及切换过程的安全性,公司采用手工结合脚本的半自动切换方式完成系统平台及应用软件启停的切换。

3. 逻辑架构

\

灾备中心架构

(1)上海生产中心与北京灾备中心采用两条专线进行连接,用于日常数据复制。

(2)SAP、K2、Project 应用的业务数据通过CDP(持续数据保护)将上海生产中心的数据复制到北京灾备中心。

(3)CDP复制采用异步模式,对 于 SAP、K2、Project 应 用,复制间隔为20 min,RPO 达 到30 min。

(4)上海生产中心与北京灾备中心各新增一台存储设备。上海生产中心的存储作为 CDP 本地镜像存储,加强本地高可用保护,北京灾备中心的存储用于数据存储以及 CDP 复制。

三、制订灾难恢复计划及灾备演练

在灾备系统的建设过程中,必须制订合理的灾难恢复计划和灾备演练方式,以帮助验证整个灾备系统的可用性和完整性。

1. 灾难恢复计划

灾难恢复计划是一套可用于灾难恢复的信息技术计划,包括灾难恢复管理团队、灾难切换流程、以及可用于灾难切换的信息和资料,是灾难事件发生时用于指导灾难恢复的最重要的文件,包含容灾目标及策略、应急响应计划(响应流程 + 人员组织)、详细技术切换 / 回切计划(流程 + 人员 + 步骤)等。

2. 灾备演练

灾备演练是指通过假设某种灾难场景,主动进行应急演练,它的作用包括如下 5 点 :

(1)验证灾备技术方案的有效性,并确保容灾系统的可用性。

(2)确认灾难恢复计划的正确性。

(3)验证 DRP 文档切换及回切流程,为以后的年度演练及灾难切换打好基础。

(4)相关人员熟悉灾难恢复环境和技术步骤,作为灾难恢复和演练的培训。

(5)优化灾难恢复计划流程。

四、建设成果及总结

\

历经 8 个多月的项目实施,公司顺利完成了核心系统异地灾备系统的建设工作,最终的“生产 - 灾备”拓扑“生产 - 灾备”拓扑图

1. 在北京建设完成灾备中心。

2. 数据复制设计生效,满足数据复制间隔设计要求。

3. 经过灾备演练验证后,整个灾备中心满足RPO和 RTO 的要求。

4. 灾备恢复计划和灾备演练计划满足要求。

通过本次公司核心系统的异地灾备系统的建设工作,我们对公司信息系统的业务连续性要求进行了重新梳理,对异地灾备的策略和方式进行了详细的研究和分析,克服了建设过程中的各种技术问题,并最终建设完成整个系统。该系统是整个公司 IT架构的重要组成部分,为公司的正常运营提供有力保障,能够发挥重要作用。

图片来源:新工业网

免责声明:本文系网络转载,版权归原作者所有。本文所用图片、文字如涉及作品版权问题,请联系删除!本文内容为原作者观点,并不代表本网站观点。
编辑:刘婧
关键词:   大数据  卡斯柯  IT  灭灾 
活动 直播间  | CIO智行社

分享到微信 ×

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。