查看服务和角色实例级别健康检查的结果,并通过图表显示,有助于诊断问题。如果健康检查发现某个组件的状态需要特别关注甚至已经出现问题,系统会对管理员应该采取的行动提出建议。同时,系统管理员还可以查看上的服务或角色上操作的执行历史,也可以查看配置更改的审计日志。
监控群集内所有主机的有关信息,包括:哪些主机上线或下线,主机上目前消耗的内存,主机上运行的角色实例分配,不同的机架上的主机分配等等。汇总视图中显示了所有主机群集,并且可以进一步查看单个主机丰富的细节,包括显示主机关键指标的直观图表。
Ambari提供了列表以及图表的方式来查看集群上进行的活动,不仅显示当前正在执行的任务行为,还可以通过仪表盘查看历史活动。同时提供了各个作业所使用资源的许多统计,系统管理员可以通过比较相似任务的不同性能数据以及比较查看同一任务中不同执行的性能数据来诊断性能问题或行为问题。
监控界面可以查看事件,并使它们用于报警和搜索,使得系统管理员可以深入了解发生集群范围内所有相关事件的历史记录。系统管理员可以通过时间范围、服务、主机、关键字等字段信息过滤事件。
通过配置Ambari可以对指定的事件产生警报。系通过管理员可以针对关键事件配置其报警阈值、启用或禁用报警等,并通过电子邮件或者通过SNMP的事件得到制定的警报通知。系统也可以暂时抑制报警事件,此限制可以基于个人角色、服务、主机、甚至整个集群配置,使得进行系统维护/故障排除时不会产生过多的警报流量。
Ambari记录了有关服务、角色和主机的生命周期的事件,如创建角色或服务、修改角色或服务配置、退役主机和运行Ambari管理服务命令等等。系统管理员可以通过管理员终端查看,界面提供了按时间范围、服务、主机、关键字等字段信息来过滤审计事件条目。
系统管理员可以通过搜索度量数据,系统将根据指定规则创建数据,组(方面)数据的图表,并把这些图表保存到用户自定义的仪表板。
介绍如何访问日志中的各种考虑到你正在查看当前上下文的方式。例如,监控服务时,你可以轻松地点击一个链接,查看相关的特定服务的日志条目,通过相同的用户界面。当查看关于用户的活动信息,您可以方便地查看了作业运行时所用的作业的主机上发生的相关日志条目。