Ao vivo · Terças, 19h-21h · engenheiros pleno+

Observabilidade

Do primeiro span ao projeto em produção: um treinamento ao vivo de 8 semanas para operar observabilidade de verdade, com OpenTelemetry, Kafka, ClickHouse, Kubernetes, RCA e IA aplicada.

Terças
19h-21h ao vivo
8 semanas
turma guiada
1 projeto
pipeline completo em PR

Para quem já vive produção

Observabilidade sem slide bonito e dashboard inútil.

Observabilidade real nasce em produção, não em tutorial. O curso parte de problemas que você já conhece: cardinalidade fora de controle, contexto perdido entre serviços, Collector subdimensionado, Kafka segurando pico e time tentando fazer RCA no escuro.

A promessa é prática: sair com repertório para desenhar uma stack, defender trade-offs e operar sinais confiáveis em cloud native, com revisão ao vivo durante a jornada.

01

Instrumente com critério

Use OTel sem explodir cardinalidade, custo ou ruído operacional.

02

Modele para query real

ClickHouse, retenção, TTL e schema pensados para investigação.

03

Opere sob pressão

Pipeline com buffer, retry, health checks e sinais do próprio sistema.

04

Use IA com contexto

MCP, RCA assistido e limites claros para automação em produção.

Currículo

Uma trilha semanal, do primeiro span ao projeto final.

Semana 1 · Terça, 19h

Fundamentos de Observabilidade

Monitoramento vs observabilidade, métricas, traces, logs, SLI, SLO, SLA, Error Budget e ODD.

Semanas 2-3 · Terças, 19h

OpenTelemetry do Zero à Produção

SDK, API, Collector, exporters, processors, semantic conventions, Java, Go, contexto e sampling.

Semana 4 · Terça, 19h

ClickHouse como Backend

MergeTree, particionamento, compressão, schema design, queries analíticas, retenção e custo.

Semana 5 · Terça, 19h

Infraestrutura e Ambiente

Collector, Kafka, ClickHouse, kind/minikube, DaemonSet, HPA com KEDA, Helm, Strimzi e Altinity.

Semana 6 · Terça, 19h

Resiliência e Escala em Produção

Retry, queue, persistent storage, multi-cluster, alertas do pipeline e capacity planning.

Semana 7 · Terça, 19h

IA e MCP em Observabilidade

Agentes consultando traces e logs, RCA assistido, runbooks gerados e limites do que automatizar.

Semana 8 · Terça, 19h

Revisão do Projeto Final

Arquitetura, PRs, trade-offs e feedback ao vivo sobre a stack completa entregue pelos alunos.

Formato ao vivo

Ao vivo. Toda terça. Das 19h às 21h.

Cada sessão combina teoria aplicada, terminal aberto, decisões de arquitetura e tempo real para dúvidas. A turma é guiada semana a semana para manter ritmo, profundidade e troca entre pessoas que já vivem produção.

Aulas ao vivo

Terças, 19h-21h, durante 8 semanas, com foco em problemas reais de engenharia.

Dúvidas em tempo real

Interação direta durante cada aula, com espaço para casos reais trazidos pela turma.

Exercícios via PR

Entrega no GitHub para validar prática, raciocínio técnico, documentação e trade-offs.

Projeto final

Stack completa revisada ao vivo: Collector, Kafka, ClickHouse, dashboard e README de arquitetura.

$ observabilidade360 stack plan

signals:
  traces: context propagation, sampling, span naming
  metrics: SLIs, SLOs, error budget, pipeline health
  logs: structured events, RCA, high-cardinality queries

pipeline:
  app -> otel-collector -> kafka -> collector -> clickhouse

ops:
  kubernetes: daemonset, deployment, keda
  storage: retention, ttl, compression
  review: pull request + live architecture review

Pegada dev

Você aprende olhando para arquitetura, código, terminal e query.

A abordagem combina implementação, leitura crítica de sinais e decisões de operação. Não é uma coleção de ferramentas: é um sistema mental para diagnosticar produção com dados reais, contexto e automação onde ela faz sentido.

Projeto final

Entregue uma stack completa de observabilidade.

O fechamento do curso é um PR com serviços instrumentados, pipeline completo, backend analítico e dashboard funcional. A revisão acontece ao vivo para transformar cada decisão em aprendizado coletivo.

Instrutores

Aprenda com quem opera engenharia em escala.

O curso é conduzido por profissionais que vivem arquitetura, confiabilidade, plataforma, busca e observabilidade em ambientes de alta exigência.

Luis Vinhali

Staff Engineer · PicPay

Luis Vinhali

Experiência em plataforma, observabilidade e arquitetura em ambientes de alta escala. Passou por IBM, C6 Bank e Bradesco.

LinkedIn
Rafael Gumiero

Principal Engineer · PicPay

Rafael Gumiero

Ex-AWS principal specialist em OpenSearch para LATAM. Foco em busca, analytics e workloads críticos em produção.

LinkedIn

FAQ

Antes de entrar na lista.

É para iniciante?

Não. O curso assume que você já lida com deploys, incidentes e decisões de produção. Se você nunca viu um span, uma métrica ou um pipeline de logs, vale estudar fundamentos antes.

Preciso saber OpenTelemetry?

Não precisa dominar. O curso começa do zero em OTel, mas assume maturidade de engenharia para entender trade-offs.

Vou conseguir acompanhar ao vivo?

As aulas acontecem às terças, das 19h às 21h. A proposta é aprender junto, tirar dúvidas e discutir trade-offs no momento em que eles aparecem. Se houver gravação, ela será apoio para revisão, não o centro da experiência.

Vai ter mão na massa?

Sim. Cada módulo tem lab, exercício ou estudo de caso, e as entregas principais acontecem via PR no GitHub.

É SaaS ou self-hosted?

Os dois aparecem. A base prática foca self-hosted com ClickHouse, Kafka e Collector, mas as decisões SaaS entram nos comparativos.

Próxima turma

Vagas limitadas para uma turma realmente acompanhada.

A turma é ao vivo e terá tamanho controlado para preservar qualidade nas discussões, revisão de PRs e acompanhamento do projeto final. Entre na lista para receber data de abertura, preço e pré-requisitos.

Entrar na lista de espera