让云工作负载“可观察”:业内领袖与Sumo Logic的Bruno Kurtic的问答


确保应用程序的最佳执行一直是很重要的。然而,由于COVID-19大流行,许多组织加快了他们的云计划,现在依赖于新的工具来确保他们基于云的应用程序以适当的可用性、性能和安全级别运行。布鲁诺·库尔蒂克,产品管理和战略的创始副总裁相扑逻辑最近,他讨论了云工作负载管理的当前趋势以及如何实现新的工具可以改善连续云应用的可观测性

相扑逻辑提供了什么?

布鲁诺·库尔蒂克,相扑逻辑布鲁诺Kurtic:Sumo Logic提供了一个持续的智能平台,我们覆盖了运营领域- ITOps, DevOps,安全,分析,安全运营-以及商业智能。我们专注于现代应用程序、现代基础设施和云,以帮助我们的客户提供更可靠的数字服务,最终提供更好的客户体验。对我们和我们的客户来说,可靠性是三件事:可用性、性能和数字服务的安全性。

云与数据中心的区别就像数据中心与大型机的区别一样。

自COVID-19大流行以来,IT企业发生了什么变化?
汉堡王:许多企业现在更认真地更快地采用云计算,因为他们正试图应对新的需求高峰,这也迫使他们采用更多的SaaS服务,以专注于帮助他们管理远程工作场所的事情。因此,云计算的采用速度大大加快。数字商业模式正在加速发展,因为企业看到了买家行为的转变。SaaS服务的采用速度也在加快,以支持内部业务。

这将如何影响公司维护对其构建和服务于客户的应用程序的控制能力?
汉堡王:人们重新关注正在产生收入的系统的可靠性、可伸缩性和性能。“可观测性”是提供可靠性的新进化步骤。系统的可观测性是一个属性,应用程序本身的性质,使外部观察,一个人的监测和故障诊断,能够实时了解发生了什么应用程序即使条件导致它是未知的。

这是如何实现的呢?
汉堡王:需要更多的数据,深入分析和情报是必需的,为了能够从知道事情不对劲,正在违反SLA尽快确定这是为什么发生这样系统才能恢复,应用程序可以带回来,组织可以避免激怒其用户群。我们最新产品发布的可观察性和相关技术专注于帮助我们的客户以一种经济的方式获取所有数据,并使他们能够对这些数据进行分析,以理解应用程序的深层行为和原因。

从根本上说,云是一种完全不同的操作模型,在如何管理云工作负载方面的转变必须是全面和完整的。

为什么组织需要积极主动地管理这些云环境?
汉堡王:事实上,我认为云与数据中心的区别就像数据中心与大型机的区别一样。我认为这是一种完全不同的运营模式,在如何管理这些云工作负载方面的转变必须是全面和完整的。组织必须采用新方法、新流程、新工具、新技能,团队必须重新组合成不同类型的团队——跨功能团队——因为云环境是不断变化的。云交付给硬件,就像敏捷开发交付给软件一样:快速发展和变化。

这些新流程有何帮助?
汉堡王:您现在可以像构建软件一样采用硬件。您可以迭代它,使它随着您的软件以您需要的速度发展。您需要考虑如何以不同的方式管理这些云环境。单是亚马逊就有近200个企业云服务,谷歌也有同样的数量,Azure、阿里巴巴和IBM也一样,这意味着要管理成百上千种新类型的组件。当你有一个基础设施和microservices环境绝对将是不同的一个星期从今天,你觉得你的可用性的称之为“新硬件栈”——必须在比以前更敏捷的方法。

为了帮助客户更好地管理云环境,您在平台中添加了哪些内容?
汉堡王:我们已经宣布了一系列平台功能,这些功能跨越了我们认为需要跨越的可观测性和可靠性。它必须从软件交付过程开始,这意味着你的开发和CI/CD(持续集成/持续开发)管道。DORA [DevOps Research & Assessment LLC]发布kpi来管理软件交付过程的效率和有效性。一些kpi是关于您向生产环境发布破坏应用程序的更改的频率,以及您能够多快地从这些破坏中恢复。

下一个是什么?
汉堡王:从那里,您转入生产环境,您必须管理您的应用程序和应用程序组件,如数据库、web服务器等,但您不能就此止步。要管理云基础设施,还必须管理应用程序平台,包括Kubernetes基础设施和微服务层。而且它也不会止步于此,因为你还必须管理边缘——边缘本身,CDN(内容交付网络)指标——向你的客户交付内容和应用程序的最后一英里。这就是需要分析的范围,为了实现这一点,我们添加了两个新的解决方案和一个更新。

多年来,c级高管和数据架构师都表示,他们的战略是“多云”,但迄今为止没有证据支持这一说法。

他们是什么?
汉堡王:第一个是软件交付可观察性,它本质上是一个集成了端到端软件开发管道的解决方案,并允许您通过DORA度量范式监视它、管理它,以帮助您改进流程——更敏捷,导致更少的错误。这是我们与Atlassian合作的一个新解决方案。我们集成了他们所有的工具集,以及开源工具,如Jenkins和其他供应商的工具。这是解一。

其他的是什么?
汉堡王:第二个解决方案是对我们的微服务解决方案的更新。去年秋天我们宣布Kubernetes解决方案在我们的会议,我们已经宣布一个解决方案的更新,扩展其功能通过引入我们的跟踪功能,允许您监控microservices-based应用程序从应用程序到它的底层平台通过日志指标和痕迹,深度分析和上下文导航,从信号一直到应用程序问题的根源。这是第二个,它是对现有解决方案的更新。

第三个吗?
汉堡王:在云管理堆栈中,我们引入了一个新的端到端AWS可观察性解决方案,它从本质上收集数据、日志度量、事件和元数据,跨越一组关键服务——AWS中的计算、数据库、网络和其他服务。我们在其中内置了一个复杂的、机器学习辅助的异常检测和根本原因搜索引擎,它查看来自AWS的数据,并试图自动确定原因和结果。它可以从问题的开始和结束位置导航用户,这样用户可以更有效地确定应用程序中问题的根本原因可能在哪里。

是否有将可观测性解决方案扩展到其他云平台的计划?
汉堡王:我们将扩展到其他云提供商,并在其他地方复制这种模式。我们从AWS开始,因为它仍然是占主导地位的云,而且大多数企业都在那里——所以我们想从AWS开始。我们自己也在AWS上运行,并在我们自己的平台上使用这些功能,以便我们自己的内部团队可以利用它。所以这对我们的客户和我们的业务都是一种补充。

混合和多云场景是否使云运营管理更具挑战性?它不再只是一个平台。
汉堡王:正确的。事实上,我们每年做的分析称为“持续的情报报告,”我们从我们的客户了解分析遥测在云中人们采用各种技术,它是如何今年不同往年,以及它是如何不同于他们所做的内部。对于企业来说,主导的云迁移策略一直是多云。所有c级的高管和架构师都告诉我,云计算是他们的战略。

Kubernetes已经成为云之间的隔离物,并使企业能够跨任何环境或在云中实际拥有可移植的工作负载。

原因是什么?
汉堡王:第一个原因是,没有人愿意受制于单一的供应商。没有人喜欢上世纪90年代的微软,当时微软主宰了一切,所以现在所有人都认为微软就是亚马逊。他们想要选择。他们也想拥有最好的技术堆栈。他们希望能够从谷歌中选择机器学习工具,从亚马逊或其他供应商中选择计算工具。这些跨国公司也希望能够为特定地区挑选最好的供应商。这就是他们在过去5年里告诉我们的——但我们真的没有看到多少证据证明这是真的。他们会这么说,但他们会告诉我们,他们从一个云平台开始只是为了学习如何去做,直到去年。

变了吗?
汉堡王:当我们去年更新报告时,我们发现,对我们来说,增长最快的客户群体是拥有多云的客户——这意味着客户积极地向我们发送运行在多个云提供商上的应用程序的生产遥测仪,基本上每年增长超过50%。这意味着,去年,这一谈话轨道终于成为现实。

为什么?
汉堡王:Kubernetes和多云的关系近乎完美。从本质上讲,那些严格在本地而不是在云上的客户运行Kubernetes的概率是个位数,在一个云上的人,大约是20%,在两个云上的人,大约是40%到50%,而运行三个云的人运行Kubernetes的概率超过80%。Kubernetes似乎已经成为云之间的隔离,使企业能够跨任何环境或云中实际拥有可移植的工作负载。

展望未来,你看到了什么?
汉堡王:我们期望看到的,也是我们所依赖的,是持续的,加速采用云技术——采用kubernetes风格的,基于微服务的应用程序,服务网格和相关的微服务技术的多云技术。而且我认为,还将更多地依赖现代方法来实际交付可靠、安全和高性能的应用程序。这种方法体现在这种可观察性的构造中,你需要让外部观察者看到什么,以便能够交付。

我们还认为,更多管理可靠性的团队将继续带来更复杂的安全性,因为用于可靠性能和可用性的相同数据将用于构建安全的应用程序。这种工具和例程的跨功能方法将继续下去,我们将用一组工具对相同的数据提供越来越多的见解。

由乔伊斯·威尔斯主持和编辑的采访。