database-migrations-migration-observability

迁移监控、疾病控制中心与可观测性基础设施

作者

安装

热度:0

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-database-migrations-migration-observability&locale=zh&source=copy

数据库迁移监控与可观测性

技能概述


专为数据库迁移设计的实时监控和可观测性解决方案,集成 CDC 变更数据捕获、Prometheus 指标收集和 Grafana 可视化仪表板。

适用场景

  • 大规模数据迁移监控

  • 跟踪数百万行数据的迁移进度,实时监控吞吐量、延迟和数据一致性,及时发现迁移瓶颈和异常。

  • 零停机在线迁移

  • 通过 CDC 实时同步源库变更,确保增量迁移期间数据持续一致,支持增量切换和快速回滚。

  • 生产环境迁移可观测性

  • 提供 Prometheus 指标、Grafana 仪表板和多渠道告警,让团队全面掌控迁移状态。

    核心功能

  • CDC 实时数据同步

  • 集成 Debezium 和 Kafka 实现 Change Data Capture,自动捕获源库的 INSERT/UPDATE/DELETE 操作,实时同步到目标系统,支持 MongoDB、PostgreSQL、MySQL 等主流数据库。

  • Prometheus 指标收集

  • 内置迁移时长、处理行数、复制延迟、错误率等核心指标,支持自定义 Histogram、Counter 和 Gauge,便于长期趋势分析和容量规划。

  • 智能异常检测与告警

  • 基于统计模型检测吞吐量下降、错误率飙升、延迟异常等问题,通过 Slack、Email、PagerDuty 多渠道实时告警。

    常见问题

    如何监控数据库迁移进度和延迟?

    该技能提供 Prometheus 指标来跟踪迁移进度,包括 migration_rows_total(已处理行数)、migration_data_lag_seconds(源目标延迟)和 migration_duration_seconds(迁移耗时)。Grafana 仪表板会自动展示这些指标的趋势图,你可以实时查看迁移是否按预期进行。

    Debezium CDC 如何保证数据不丢失?

    Debezium 通过 Kafka 的持久化和消费者组机制保证数据不丢失。该技能配置了心跳机制(heartbeat.interval.ms)和消费偏移量管理,即使消费者重启也能从上次位置继续处理。同时,错误计数器和告警系统会及时通知你处理失败的事件。

    迁移失败如何回滚和恢复?

    该技能提供了完整的会话管理和事务支持。对于 MongoDB 迁移,使用 withTransaction 确保原子性;对于 CDC 管道,可以通过 Kafka 消费者重置偏移量来重新处理事件。告警系统会在迁移失败时立即通知,便于快速介入恢复。