译者 | 李睿 审校 | 孙淑娟 希望升级云计算战略的企业正在转向CloudOps这一新兴框架,以优化性能,并管理在云中开展业务的成本。 任何参与创建软件产品的人都应该非常熟悉DevOps,这是一套结合软件开发和IT运维的实践,旨在缩短开发生命周期并提供持续交付和高质量的产品。 随着企业越来越多地将应用程序开发和工作负载转移到云中,并且这些云支出变得更加复杂,出现了一个相关的概念,即“云运维”(CloudOps)。 本文将研究CloudOps是什么,它如何使企业受益,以及在企业中实施CloudOps时应牢记的关键问题。
1.什么是CloudOps?
CloudOps是一种运营实践,用于管理在云计算运营环境中运行的IT服务和工作负载的交付、优化和性能。 无论企业是采用多云、混合云还是私有云战略,CloudOps都旨在为基于云计算的流程建立程序和最佳实践,这与DevOps为应用程序开发和交付所做的方式非常相似。
2.CloudOps云运维的多层框架
咨询机构凯捷美洲公司副总裁兼云卓越中心负责人Jason Hatch表示:“整体云运维是一个具有多个层次的框架,可以帮助企业管理其云生态系统的各个方面。” 其中一个是治理层,包括财务运营(也称为FinOps)等活动,以控制成本和管理云预算。Hatch说,“治理层还应该包含关于如何以及在云中部署什么的架构标准,并有办法以编程方式执行这些标准。” 其他框架层包括:云应用层,该层涵盖了企业如何在云中部署和管理/监控应用程序和特定于应用程序的服务;云运维层,主要用于云计算服务的部署、管理、监控和运营;云基础层,包括身份、网络管理、日志记录、中央备份管理、基础设施即代码和中央监控功能等核心服务。 Hatch说,“跨越所有这些层的是‘安全层’,其中包括漏洞和威胁管理、工作负载保护以及与企业更大的网络安全管理功能的集成。”
3.CloudOps在企业中的应用
CloudOps模型与应用程序交付特别相关,许多企业都在关注旨在增加销售额和增强客户体验的数字计划。 云计算服务提供商Replicon负责工程和运营的执行副总裁Suresh Kuppahally说:“CloudOps将构建、部署、运营、监控和管理云中(Web)应用程序交付功能的五项首要职责结合在一起。” Kuppahally指出,网络、计算、安全和存储是在初始构建和设计阶段必须牢记的四个关键组件。他说,“从那里,企业或者自动部署他们的应用程序,或者通过持续集成和持续交付部署他们的应用程序。” Kuppahally说,企业的CloudOps团队还应明确区分职责和独立于工程或产品团队,这样做使CloudOps能够带来企业内部的透明度和服务质量[QoS] 责任制。
4.CloudOps的好处
凯捷美洲公司的Hatch表示,CloudOps的商业利益是相当可观的,首先是企业对云服务的整体部署。 他说,“CloudOps有助于推动企业内部进一步采用和使用云计算服务。如果企业能够有效地部署、管理和保护他们的云环境,它应该增加他们对云计算的使用,并提供对新服务和技术进行试验和创新的能力,这反过来又可以使他们更加敏捷,提供更快的上市时间,并有助于推动创新。” Hatch补充说,利用CloudOps的企业还可以对他们使用的越来越多的云计算服务实现更好的管理和财务控制。 Hatch说,“我们不断从客户那里听到他们超出了他们的云预算,他们或者不知道为什么,或者无法实施控制来管理它。有效的CloudOps有助于缓解这种情况。在治理层,我们可以实施更好的预算和财务跟踪和优化。这在运维层也得到了促进,部署和管理方面的自动化程度更高。” 咨询机构Protiviti公司的客户引用的另一个最大好处是能够在云中自动释放授权资源,该公司总经理Will Thomas说,该公司帮助客户管理云计算日益复杂的问题。 Thomas说,增强的安全性是CloudOps的另一个关键优势,因为该模型确保与安全控制、标准或框架保持一致,并建立可以限制不合规行为的策略,同时报告云中的健康和活动。 Thomas还认为,实施CloudOps的企业能够更好地优化其云环境,因为CloudOps工程师将专注于利用云中的授权资源,通过最新和最优质的服务实现应用程序的现代化。 此外,部署CloudOps的企业可以根据性能和成本考虑制定适当的资源分配时间表;持续报告和审查有关云健康状况的指标;支持主动配置资源,同时保持云中的合规性。 Replicon公司的Kuppahally指出,CloudOps能够在不影响QoS的情况下经济有效地扩展云服务。他说,“使QoS目标和CloudOps投资保持一致是非常具有战略意义的,因为可以激励专门的CloudOps团队来管理运营成本,因此将在降低运营成本方面获得既得利益。”
5.CloudOps的实践
Stretto公司是一家受益于采用CloudOps的公司。该公司首席技术官George Tsounis说,这家服务于企业和消费者破产部门的破产服务和技术公司很早就确定了对CloudOps实践的需求,并将关键原则纳入其在云中运行的应用程序和系统中。 Tsounis说,“例如,我们制定了严格、快速的规则,我们只会将基础设施即代码[IaC]实践用于任何部署。我们通过决定所有的应用程序/系统将始终跨两个可用性区域运行来实现冗余,因此我们利用了云计算提供商的内置高可用性功能。” Tsounis表示,Stretto公司战略的关键部分是利用CloudOps实践来确保对其技术运营采取更积极主动的方法。他说,“我们更愿意授权我们的架构师和工程师为我们的内部和外部客户创建高性能、自我修复和弹性的云原生解决方案,而不是继续以被动的方式运营。” Tsounis表示,云服务的引入甚至是向无服务器功能过渡的过程,都带来了独特的挑战。他说,“CloudOps是帮助我们应对这些挑战的战略。” CloudOps最终为Stretto公司带来的好处包括降低成本、可扩展性、自动化、简化的灾难恢复以及随着基础设施成为应用程序的一部分而无缝集成。 Tsounis说:“我们的团队受益于应用程序的全面改进,这些CloudOps理念已被采用。CloudOps实践也提高了质量。这可以通过利用基础设施即代码方法使云计算基础设施的部署和配置可重复来实现。随着我们在各种环境中推出应用程序,减少了配置错误,现在利用基础设施即代码拥有一致的基础设施配置。” Tsounis表示,Stretto公司通过取消对其云计算基础设施的人工配置,质量问题减少了大约20%。 他说,“利用CloupOps实践为工程师提供了他们需要知道的应用程序/系统行为在预生产环境中发布到生产环境时的成功信心。此外,由于我们的应用程序质量改进,服务台和内部票证减少,我们看到了整体IT运营的改进。”
6.跟上不断发展的方法
在云服务及其使用方式方面,没有什么是一成不变的,因此采用CloudOps的企业需要定期调整他们的方法以跟上变化。 对于许多企业来说,这仍然是一个需要克服学习曲线的新领域。凯捷美洲公司的Hatch 说,“随着越来越多的企业采用真正的多云部署,他们的CloudOps实施也需要成熟和扩展。许多客户在孤岛中管理他们的云环境,使用不同的工具和流程管理每个云计算环境,而从整体上查看整个云环境。 为了更加高效和有效,企业需要开发他们的CloudOps框架,以便能够轻松插入新的云提供商和服务,同时仍然提供适当级别的管理、监控和运营严谨性。” Kuppahally表示,企业在云中处理事件管理的方式也可以得以改进。 他说,“这是大多数CloudOps团队都在陷于困境的领域,他们充斥着内部和外部事件,并且无法有效管理它们。拥有专门的项目管理流程来简化事件管理分类和优先级排序是降低风险的方法之一。 与此同时,企业需要降低事件误报率。当CloudOps团队无法跟上高误报率时,他们就会不堪重负。制定有效的策略和计划来减少或消除误报是非常关键的成功因素。” 研究和教育服务提供商Wiley公司的执行副总裁兼首席技术官Aref Matin表示,CloudOps可以从人工智能(AI)和机器学习等技术中受益。 Matin说,“通过机器学习,CloudOps工具可以帮助定义企业范围的策略,检测和报告异常情况,并以自动化的方式采取纠正措施,以维护云计算最佳实践策略。”
7.CloudOps文化
与DevOps一样,CloudOps的成功很大程度上取决于培养一种旨在充分利用框架和工具的文化。随着越来越多的企业将更多的工作和流程转移到云端,他们需要专注于构建CloudOps专业知识。 Protiviti公司的Thomas说,“大多数客户在处理云计算服务时处于反应状态,无法响应事件、更改或对新服务的请求。CloudOps通过自动化启用的部署建立了结构,允许监控、审查和优化现有资源,并检查企业政策以与云计算保持一致。” Stretto公司的Tsounis对此表示认同。他指出 ,企业需要更广泛地了解适当的组织结构、专业知识和协作的适当协调,CloudOps才能真正发挥作用。 Tsounis说,“CloudOps不是一个单独的团队或部门。IT、安全、架构和应用程序团队需要协作并在常见的CloudOps实践上保持一致。如果这些团队在孤岛中工作,CloudOps就不能很好地工作。” 根据将CloudOps付诸实践的经验,Tsounis认为,企业还需要更好地定义CloudOps所需的基本技能才能取得成功,而不是重新发明轮子。 他说,“技术团队需要了解基于云的架构、网络、安全和自动化。如果没有基础技能,团队可能会冒险在已经存在云服务的情况下实施解决方案。”
转载请注明:IT运维空间 » 运维技术 » CloudOps:优化云运维的新兴框架
发表评论