performance-engineer
资深性能工程专家,专注于现代可观测性体系、应用性能优化与可扩展系统架构。精通OpenTelemetry标准、分布式链路追踪、负载压力测试、多级缓存策略、核心网页指标与性能监控体系。擅长端到端性能调优、真实用户行为监控及可扩展架构设计。可为各类性能优化、可观测性建设与系统扩展性挑战提供前瞻性解决方案。
作者
分类
开发工具安装
热度:2
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-performance-engineer&locale=zh&source=copy
性能优化工程师 (Performance Engineer)
技能概述
Performance Engineer 是一款专注于现代应用可观测性、性能优化和可扩展系统的专业 AI 技能,帮助开发者诊断性能瓶颈、设计负载测试策略、构建多层缓存架构,并实施端到端的性能监控方案。
适用场景
当应用出现响应缓慢、资源占用异常或用户体验下降时,使用该技能进行系统性的性能分析。通过分布式追踪、CPU/内存分析、I/O 性能剖析等手段,快速定位后端、前端或基础设施层面的性能问题根源。
在新建系统或优化现有系统时,帮助构建完整的可观测性体系。包括 OpenTelemetry 分布式追踪集成、Prometheus/Grafana 监控面板搭建、APM 平台配置、以及核心业务指标的 SLI/SLO 定义和告警规则设置。
在系统上线前或进行重大变更前,设计并执行专业的负载测试方案。使用 k6、JMeter、Gatling 等工具进行 API 压测、浏览器性能测试、可扩展性验证,基于测试结果进行容量规划和性能瓶颈预测。
核心功能
涵盖前端 Core Web Vitals 优化(LCP、FID、CLS)、资源加载优化、JavaScript/CSS 优化;后端 API 响应时间优化、数据库查询优化、连接池调优;以及分布式系统的服务间通信优化、消息队列性能调优等端到端性能优化能力。
精通 OpenTelemetry 分布式追踪、DataDog/New Relic/Dynatrace 等 APM 平台、Prometheus/Grafana 监控体系、Real User Monitoring (RUM) 用户体验追踪,以及结构化日志和分布式日志关联,提供完整的可观测性解决方案。
提供从浏览器缓存、CDN 边缘缓存、应用层内存缓存、分布式缓存(Redis/Memcached)到数据库查询缓存的完整多层缓存架构设计,包含缓存失效策略、缓存预热、缓存穿透/雪崩防护等实战方案。
常见问题
Performance Engineer 技能适合什么场景使用?
该技能适用于任何涉及应用性能优化、可观测性建设或系统可扩展性挑战的场景。无论是排查性能瓶颈、设计负载测试方案、搭建监控系统,还是优化数据库查询、构建缓存架构,都可以主动使用此技能。
如何诊断应用程序的性能瓶颈?
首先建立性能基线,收集分布式追踪、性能剖析数据和负载测试结果。通过火焰图分析 CPU 热点、堆分析检测内存泄漏、I/O 分析定位磁盘/网络瓶颈,结合用户旅程映射找出影响用户体验的关键路径,然后按影响优先级进行优化。
生产环境可以进行负载测试吗?
不建议直接在生产环境进行负载测试。该技能遵循安全原则,要求在生产环境负载测试前获得明确批准并采取防护措施,包括使用测试环境、设置资源限制、准备回滚方案、采用分阶段发布策略等,确保测试不影响业务正常运行。