IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    Prometheus Metrics精简优化

    ike‘s blog发表于 2023-04-04 00:00:00
    love 0

    Prometheus的TSDB Status里可以查看TOP10的指标:Top 10 series count by metric names,参考这个来优化指标吧!

    筛选

    推荐使用metric_relabel_configs

    #保留
      metric_relabel_configs: 
      - source_labels: [__name__]
        regex: etcd_disk_backend_commit_duration_seconds_bucket|up
        action: keep   
    #去除
      metric_relabel_configs:
      - source_labels: [__name__]
        regex: nginx_filter_.*
        action: drop 
    

    或者使用whitelist_regex或者blacklist_regex 举例:

    # 只监控以http开头的指标
    whitelist_regex: ^http.*
    
    # 不监控以http开头的指标
    blacklist_regex: ^http.*
    

    合并

    kube-apiserver的apiserver_request_duration_seconds_bucket指标数量太多尝试进行合并:

    将0.1、0.2、0.5、1、2、5、10、30和+Inf的桶(bucket)合并为0.1的桶(bucket),将0.3、0.6、1.5、3、6、15、30、60、120、300、600、1800、3600和+Inf的桶(bucket)合并为0.3的桶(bucket),以此类推。

        relabel_configs:													
          - source_labels: [le]
            regex: "0\\.1|0\\.2|0\\.5|1|2|5|10|30|\\+Inf"
            action: replace
            target_label: le
            replacement: "0.1"
          - source_labels: [le]
            regex: "0\\.3|0\\.6|1\\.5|3|6|15|30|60|120|300|600|1800|3600|\\+Inf"
            action: replace
            target_label: le
            replacement: "0.3"
          - source_labels: [le]
            regex: "0\\.4|0\\.7|2\\.5|4|7|25|50|100|250|500|1000|1800|3600|\\+Inf"
            action: replace
            target_label: le
            replacement: "0.4"
          - source_labels: [le]
            regex: "1\\.5|5|15|30|60|300|1800|3600|\\+Inf"
            action: replace
            target_label: le
            replacement: "1.5"
    


沪ICP备19023445号-2号
友情链接