您的位置: 网界网 > 行云之路 > 正文

AWS性能及成本监控没有“万能方”

2015年04月15日 20:57:34 | 作者:Ofir Nachmani | 来源:TechTarget中国 | 查看本文手机版

摘要:云是个高度动态的环境,因为服务器来来去去,自动扩展改变着环境的构造,以及拓扑结构的不断进化。此外,公有云是由配置管理系统来支持的,这催生了更多的日志和系统事件。

标签
APM
成本监控
AWS性能

云创造了一个复杂的IT环境,所以在监控基础架构,应用性能及成本方面,我们需要十八般兵器,一应俱全。

对于AWS,企业只需为他们使用的部分付费,而这影响了管理员对使用的监控方式。云是个高度动态的环境,因为服务器来来去去,自动扩展改变着环境的构造,以及拓扑结构的不断进化。此外,公有云[注]是由配置管理系统来支持的,这催生了更多的日志和系统事件。

为了能理解这一切,你需要学会掌控AWS监控的功能。云监控工具通常分为以下的三大类:

基础架构和实时监控;

应用性能监控(APM);及

成本分析和监控。

云基础架构和实时监控

自下而上的方式是从底层数据库-计算监控开始,一直到上层的应用监控。

CloudWatch,即AWS的监控层,允许你查看诸如CPU使用,内部的数据传输,磁盘使用和日志这样的指标并可以用来创建警报。管理员可以使用CloudWatch来取得实时数据指标,或者可以使用更传统的监控工具,例如Nagios、Zabbix和Cacti。

使用这些监控工具的挑战在于,找出一个可以根据环境的改变进行自动配置的方法。

比如说,当你在使用Nagios时,环境的每个改动都需要一次重启。而虽然它是个开源工具,它并不是为了支持不断变化的环境而打造的。有些云用户为了支持环境的自动变更,在这些工具的API之上又开发了一个层级。

云计算[注]的不断变化的环境几乎压垮了Nagios时,Sensu相比之下则显得更为简单,更可扩展。Sensu的配置功能跟Nagios和Zabbix的几乎一模一样,但在实例增加或删除的时候,Sensu的客户端会自动连上Sensu服务器。当新的实例开始运行时,Sensu客户端会自动与相应的Sensu服务器同步。

专用工具类别除了Google最近才收购的Stackdriver之外还包括了如DataDog、Sysdig和BigPanda这样的综合工具。除了聚集信息来表现云环境里发生的事件以外,这些工具也使用综合性的用户界面(UI)来支持快速的修复行动。

使用传统的工具,通常很难判断一个事件或者一个警报是否是真的。当提到这种类型的专有工具,他们事实上提供了更全面的开箱即用的功能,比如一个应用程序拓扑结构的自动显示,正在发生的不同类型的警报之间的关联发现。

使用这些方法降低了“噪音”,让你能够快速的采取必要的措施。同样重要的是要注意这些系统有强壮的API和开箱即用的集成技术支持,这将它们同上述的开源工具区别开来。

应用性能监控

监控应用程序同样很重要。除了基础架构层,CloudWatch还监控如DynamoDB这样的数据库和关系型数据库服务。它还支持自定义监控选项,这样就可以从栈的更高层获得更多的指标。然后你可以监控日志并设置警报来创建动作触发器。

商业工具更广泛的是和APM一起使用。他们能够追踪诸如应用交易这样的指标(比如,处理的交易量和响应次数),并最终对用户体验透明。

当涉及到云的应用管理和监控时,特别是对AWS,传统技术厂商远远落后于像New Relic,AppDynamics和Compuware这样的专业技术公司,根据2014年APM Gartner Magic Quadrant的研究表明。

成本分析和监控

由于云的动态性(+本站微信networkworldweixin),AWS的成本监控也发生了演变。AWS的环境是通过一个API构建的,Amazon的应用程序开发者通过其API来扩展使用AWS,使得成本难以控制。比如说,一个小的应用程序bug,就可能让一个月的AWS帐单翻倍—或者甚至变成三倍。

AWS Trusted Advisor,作为亚马逊的支持计划的一部分,提供了你的环境中最近的包括成本,性能和安全方面的变化通知。与此类似的一个工具Ice,是一个由Netflix工程师开发的开源工具。Ice提供给用户一个大的视图可以看到一个环境中有多少资源正在被使用(和被谁用)。它还可以通过使用AWS Programmatic Billing Access来根据用户的帐号,区域,服务等追踪支出,使得预算分配成为可能。另外,AWS成本监控能够帮你找到正确的采购计划,比如有效利用一个适当的预留实例计划。

成本监控不光是监控最近的变更。它还意味着在时间推移的基础上识别趋势和异常状况。这使得成本监控变成主要是大数据[注]的问题,涉及到追踪你的历史来评估当前的状态并作出成本预测。只有这样云计算的消费者才能规划预算,退款,以及成本配置过程。在成本监控这一类别上,除了老牌厂商Cloudyn和Cloudability之外还有新兴的厂商,如CloudCheckr和CloudHealth Technologies的加入。

参考资料

1.云计算:(Cloud Computing)描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云计算是继1980年代大型计算机到...详情>>

2.公有云:(Public Cloud)是第三方提供一般公众或大型产业集体使用的云端基础设施,拥有它的组织出售云端服务,系统服务提供者借由租借方式提供客户有能力部署及使用云端服务。它能...详情>>

3.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

[责任编辑:行云之路 yu_xiang@cnw.com.cn]