「记者爆料」您能确保您的IT系统稳定高效运行吗?提高韧性是前提

在当前数字经济快速发展的时代,企业数字化转型不仅是顺应时代潮流的战略选择,也是在激烈的竞争中保持创新活力、增强核心竞争力、实现可持续发展的必然路径。IT系统作为数字化转型的重要基石,为企业运营、管理和创新提供重要的技术支撑和保障。


但同时,随着企业业务需求快速演变、系统不断扩展,传统的IT系统架构已经无法应对日益增长的数据处理需求和系统调用。例如,远程系统调用的持续增加、系统日益复杂和分布式以及系统功能的频繁更新增加了系统中断的风险。每当系统出现故障时,负面影响不仅仅是表面的经济损失,还会对品牌形象和客户产生负面影响。


因此,保证IT系统的稳定、高效运行已成为企业运营中必须解决的关键题。云服务提供商大规模的运营方式可以提供更加高效、可靠的计算和存储资源,使得越来越多的企业考虑将IT系统迁移到云端,以满足不断增长的业务需求。


如何提高IT弹性


亚马逊高级副总裁兼工程师JamesHamilton强调,为了提高在其基础设施上运行的应用程序的弹性,客户应该关注三个方面


一、尽可能扩大自动化范围


根据UptimeInstitute发布的数据,高达70%的数据中心故障和服务中断是由人为错误造成的。这凸显了提高自动化程度的重要性。因此,为了保证系统的弹性和稳定性,从数据备份到系统测试的所有步骤都必须尽可能自动化。


以医疗机构CalvertHealth为例。过去,电子健康记录的数据备份是依靠企业数据中心服务器手动管理的,恢复时间目标RTO为48至72小时。CalvertHealth将其应用程序恢复系统迁移到Amazon云技术后,RTO降低了97%至不到2小时。


同时,在代码部署之前及时发现并解决潜在题对于创建高可用性和弹性的应用程序同样重要。传统的手工代码审查可能依赖于审查者深厚的专业知识和敏锐的洞察力,但随着软件项目变得越来越复杂,代码量不断增加,这种模式的局限性也越来越明显。在这种背景下,公司可以使用机器学习增强的代码审查工具不仅可以自动化此过程,还可以进一步提高应用程序性能。


其次,我们继续测试解决未知题。


持续测试是工程师了解系统如何应对未知情况的方式。实现这一目标的一种方法是故意进行“破坏”。这种方法允许公司进行故障注入实验,帮助创建发现分布式系统中难以检测的隐藏错误、盲点和性能瓶颈所需的现实条件。


JamesHamilton指出,自21世纪初以来,亚马逊一直在不影响客户体验的情况下故意注入缺陷。詹姆斯汉密尔顿说“这增强了我们的应变能力,并确保我们为最坏的情况做好准备。如果我们能够触发罕见事件并更频繁地调整我们的应对措施,我们就准备好了。”


另一种流行的测试方法是弹性“日”,它模拟故障或其他事件来测试系统、流程和团队响应。这种方法的目标是尽可能现实地练习如果发生异常事件,团队将采取什么行动。公司可以使用AmazonCloud上生产环境的完整副本进行比赛日培训。


第三,我们纳入可观察性指标。


了解系统性能对于实现卓越运营和弹性至关重要。通过不断收集和分析应用程序数据,公司可以更快地检测和解决应用程序可用性和性能题,从而改善最终用户体验。然而,随着应用程序变得越来越复杂,出现题时快速发现并解决题变得困难。为此,企业必须建立一体化、高效的题发现、定位和解决机制。


以全电子学习技术提供商Docebo为例,当开发团队遇到题时,通常需要几天的时间才能解决。使用亚马逊云技术的多重分析服务,Docebo统一所有日志和跟踪数据以创建单一事实来源,将题解决时间缩短高达90%,并将纠错率从原来的70%显着降低到80%。15或更少。


随着越来越多的企业将关键工作负载迁移到云端,云服务的可靠性和连续性变得越来越重要,这也凸显了云弹性的关键作用。


将弹性集成到您的服务中


作为全云计算的先行者,亚马逊云技术深知这一点,始终将弹性理念融入到基础设施、服务设计和部署中,保障构建机制,将基础弹性融入到模型和机制的各个方面。致力于为我们的客户提供强大且可靠的云基础设施来构建和运行各种应用程序。


亚马逊云技术最大限度地减少了全基础设施之间的互连,避免了单点故障的风险。全基础设施地理分布布局,分布在33个地区的105个可用区。每个可用区都有独立的电源、冷却和物理安全设施,可用区通过冗余超低延迟网络连接。同一区域中的可用区之间有足够的距离(最多约100公里),可以实现毫秒级延迟的同步复制,同时防止相关错误。


Amazon云技术还考虑了系统依赖性,并确保您的系统即使在这些依赖性受到影响时也能保持弹性。这种弹性归功于静态稳定性设计,它允许系统在出现错误或依赖失败的情况下继续正常运行而无需任何更改。例如,在AmazonElasticComputeCloudAmazonEC2中,一旦启动实例,就可以像数据中心中的物理服务器一样使用它。其他Amazon云技术资源(例如VirtualPrivateCloudVPC、AmazonSimpleStorageServiceAmazonS3存储桶和AmazonElasticBlockStoreAmazonEBS卷)也具有相同的特征。


不断强化企业能力


JamesHamilton表示,亚马逊云技术提供了一套全面的专用服务、策略和架构实践,用户可以使用它们来提高自己业务的弹性。


亚马逊云技术弹性生命周期框架概述了这些服务、政策和实践,分五个阶段,包括目标设定、设计和实施、评估和测试、运营、响应和学习。弹性生命周期框架模仿标准软件开发生命周期,使客户能够轻松地将弹性集成到现有流程中。


例如,您可以使用AmazonResilienceHub设定目标、根据这些目标评估您的弹性状态,并根据AmazonWell-ArchitectedFramework和AmazonTrustedAdvisor的建议实施改进。在ResilienceHub中,用户可以创建并运行Amazon故障注入服务实验,从而允许客户测试其应用程序如何响应特定类型的中断。AmazonBackup、AmazonElasticDisasterRecovery、AmazonDRS和AmazonRoute53应用程序恢复控制器Route53ARC等其他服务可以帮助您快速响应中断并从中恢复。


值得一提的是,全数百万用户已选择亚马逊云技术作为他们的云服务提供商。这些用户中不乏对数据安全要求非常高的机构,比如纳斯达克、道琼斯、默克等公司。


写在最后


在不断变化的技术浪潮中,亚马逊云技术始终与时俱进,积极应对日益复杂的网络安全威胁和不断发展的商业模式带来的挑战。我们通过不断改进基础设施、服务设计、运营模式和机制,不断增强和发展云设施的弹性。


我们相信,亚马逊云技术将继续提供广泛而深入的架构和运营实践服务、工具和指导,帮助更多企业在云中构建和运行灵活的应用程序,并坚信它能够实现持续稳定的业务增长。做完了。


除非特别注明,本站所有文字均为原创文章,作者:admin

No Comment

留言

电子邮件地址不会被公开。 必填项已用*标注

感谢你的留言。。。