发布时间:2022-09-21 17:00
企业灾难可能是技术、自然或人为层面的。自然灾害包括洪水、龙卷风、飓风、滑坡、地震和海啸。人为和技术灾难涉及的面较广,包括危险物质泄漏、电力或基础设施故障、化学和生物武器威胁、网络攻击、恐怖主义行为、爆炸和内乱。这些都有可能造成企业IT系统的关闭,以及阻碍企业的整体运营。
对于企业来说,停机时间和技术中断就像一个恐怖故事,所以,您需要一个灾难恢复 (DR) 计划。
阅读本文,您将了解现代云平台上,CloudBees CI实施此类灾难恢复计划的效果。
立即联系CloudBees授权合作伙伴——龙智,获得更多关于CloudBees的咨询、试用、服务等信息。
生产环境中部署的关键业务功能,必须有灾备计划,以便在系统意外崩溃时,可以将业务迁移到本地区的其它机房甚至其它地区。
这就是CloudBees决定进行概念验证的原因,能够了解在现代云平台上,为 CloudBees CI实施此类灾难恢复计划的效果如何。
CloudBees专注于以下几种场景: CloudBees CI在Elastic Kubernetes Service (EKS)中运行,对于$JENKINS_HOME卷使用Elastic Block Store (EBS),并由Route 53管理域。它演示了使用常用的OSS Velero项目作为备份系统,对元数据使用简单存储服务(S3),并使用EBS快照来存储主要数据。
为什么CloudBees要选择这一场景?因为采用Kubernetes能使我们关注应用程序本身,而不是基础设施。当在Kubernetes上使用类似Velero的工具时,不仅会备份和恢复数据卷,而且还会备份和恢复所有元数据。这意味着我们可以通过一些简单、可移植的命令来运行主要的操作。
除了Velero,我还能使用其他工具吗?是的,当然可以。这篇文章中展示的概念可以用其他开源或商业的备份工具来实现,不管是在Kubernetes上还是其他地方,只要它们能够跨区域同步数据。例如,Google Cloud (GCP) 正在为Google Kubernetes Engine (GKE)提供一个原生的集成备份系统。
能剧透一下结果吗?能,但继续阅读,您能收获更多有趣的信息和背景。CloudBees进行了测试,测试规模约100个在用的托管控制器,能够达成RPO(Recovery Point Objective)和RTO(Recovery Time Objective)目标。更具体地说,CloudBees可以在每15分钟安排一次备份的基础上实现较低的RPO,而RTO则在同一范围内。
一般来说,CloudBees CI的跨区灾难恢复有以下几个要求:
备注: