grafana-dashboards
创建并管理生产环境的Grafana仪表板,用于实时可视化系统和应用指标。适用于构建监控仪表板、可视化指标数据或创建运维可观测性界面的场景。
作者
分类
开发工具安装
热度:42
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-grafana-dashboards&locale=zh&source=copy
Grafana 仪表板配置技能
技能概述
创建和管理生产级 Grafana 监控仪表板,实现系统与应用指标的实时可视化。
适用场景
1. API 服务监控
构建 RED 方法(Rate 请求率、Errors 错误率、Duration 延迟)仪表板,实时追踪 HTTP 请求、P95/P99 延迟和错误百分比,支持配置告警阈值。
2. 基础设施监控
设计 USE 方法(Utilization 利用率、Saturation 饱和度、Errors 错误)仪表板,监控 CPU、内存、磁盘 I/O、网络流量及 Kubernetes 集群状态。
3. 业务 KPI 可视化
将业务指标转化为时间序列图表、统计面板和热力图,支持多维度变量查询和自动刷新,构建运营决策所需的实时数据大屏。
核心功能
1. 仪表板结构设计
提供层级化信息架构设计原则,从关键指标大数字到趋势时间序列,再到详细数据表格。包含生产就绪的 JSON 配置模板,支持 API 监控、基础设施监控和数据库监控三种常见模式。
2. 面板类型配置
涵盖 Stat 单值面板、Time Series 时间序列图、Table 表格面板、Heatmap 热力图等常见面板类型的完整配置示例,包括阈值颜色、单位格式、数据转换等细节。
3. 仪表板即代码
通过 Terraform、Ansible 或 Grafana Provisioning 实现仪表板的版本控制和自动化部署,支持 dashboards.yml 配置和 YAML/JSON 格式的仪表板定义。
常见问题
Grafana 仪表板如何创建和使用变量?
变量功能允许动态过滤查询结果。支持 Query 变量从 Prometheus 数据源动态获取标签值(如 namespace、service),可在查询表达式里用
$variable 语法引用,实现跨服务、跨集群的灵活监控视图。RED 方法和 USE 方法有什么区别?
RED 方法针对服务监控,关注 Request(请求率)、Error(错误率)、Duration(延迟)。USE 方法针对资源监控,关注 Utilization(利用率)、Saturation(饱和度)、Error(错误)。两者互补,共同构成完整的可观测性体系。
如何实现 Grafana 仪表板的自动化管理?
可通过 Grafana Provisioning 配置
dashboards.yml 实现文件自动加载,或使用 Terraform 的 grafana_dashboard 资源进行基础设施即代码管理。Ansible 也支持通过 copy 模块批量部署仪表板文件,推荐将仪表板 JSON 纳入版本控制。