加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 服务器 > 安全 > 正文

聊聊什么叫做监控系统之后续

发布时间:2022-07-22 09:21:32 所属栏目:安全 来源:互联网
导读:什么是指标 传统监控系统认为指标是附属物,但指标实际上用来反映环境的状态、可用性、性能。 指标是软件或硬件组件属性度量,为了让指标有价值,我们会跟踪其状态,通常就是记录一段时间内的数据点,数据点包含值、时间戳、其他一些属性,数据点的集合就是
  什么是指标
 
  传统监控系统认为指标是附属物,但指标实际上用来反映环境的状态、可用性、性能。
 
  指标是软件或硬件组件属性度量,为了让指标有价值,我们会跟踪其状态,通常就是记录一段时间内的数据点,数据点包含值、时间戳、其他一些属性,数据点的集合就是时间序列。
 
  以固定时间(颗粒度)间隔收集数据,颗粒度越大就容易错过细节,时间序列是这些数据点按时间顺序排列的集合。
 
  1:指标类型
 
  测量型,这种类型是上下增减的数字,比如CPU负载。
  计数型,这种类型随着时间增加而不会减少的数字,比如uptime运行时间。
  直方图,数据分组,比如某个桶中的数值大小。
  2:指标聚合
 
  指标有的时候需要经过一些数学转换,通常指标聚合在一起才有意义,更能识别趋势,比如单台web流量下降的趋势比不上所有web流量的下降幅度。
 
  (1)平均值
 
  平均值不能反映真实情况,比如高峰和低谷会被平均值掩盖。
 
  (2)中间数
 
  中间数处在所有数值的正中心,50%的数值位于它前面,而另外50%位于它后面。它的缺点和平均值一样,不能反映真实情况。
 
  这个最有意义,比如99% API响应时间小于100毫秒,代表整体性能不错,而我们要解决的就是剩余的1%。
 
  监控方法论
 
  1:USE:侧重于主机监控
 
  概括为每个资源(比如CPU),检查使用率(资源忙于工作的平均时间,一般是百分比)、饱和度(资源排队工作的指标,无法再处理额外的工作,通用用队列长度表示)、错误(资源错误时间的计数)。
 
  2:Google四个黄金指标
 
  专注于应用程序级的监控。
 
  延迟,服务请求花费的时间
  流量,比如QPS
  错误,请求失败的速率
  饱和度,应用程序受限的资源(比如IO)
  每个指标都可用于监控,延迟大报警,QPS超过阈值报警,错误率太高报警,受限的资源越高报警。
 
  警报和通知
 
  警报在达到阈值时会触发,但触发不代表通知,所以这是两个过程。

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读