Debezium e CDC: quando conectores, offsets e schemas derrubam a réplica lógica
Debezium é a porta de entrada para muitos pipelines event-driven, mas a manutenção do CDC não termina no “conector verde” no Kafka Connect. Em produção, equipes enfrentam falhas silenciosas, atraso crescente na captura e recuperações longas após incidentes.
Cenários reais
Snapshot inicial em tabelas enormes sem estratégia de chunking ou sem alinhamento com janelas de manutenção pode travar o banco de origem. Offsets corrompidos ou apagados após migração de cluster Connect exigem decisão arriscada: re-snapshot ou reconstrução manual — sempre com impacto em negócio.
Schema Registry com compatibilidade BACKWARD vs FORWARD mal definida quebra consumidores downstream no primeiro ALTER agressivo. Em Oracle/SQL Server, particularidades de redo/archive e permissões mínimas geram horas de troubleshooting que não aparecem no guia de início rápido.
Linha de defesa
Documentar versão exata do conector e do banco, testar mudanças de schema em pipeline de homologação, monitorar lag de CDC separadamente do lag de consumo, e ter runbook para “conector vermelho” com checklist de WAL/binlog, conectividade e disco. A LASS apoia times a amarrar isso a SLAs e a governança de dados.