Otimizacao e Monitoramento
Metricas, ajuste fino de prompts e ciclo de melhoria continua
Metricas Essenciais
Voce nao pode melhorar o que nao mede
Para otimizar seu AI Workflow, voce precisa medir 4 metricas fundamentais que vao guiar suas decisoes de ajuste e investimento.
Taxa de Acerto
% de classificacoes corretas
Tempo de Processamento
Segundos do trigger a acao
Custo por Execucao
Tokens + infra por item
Taxa de Escalacao
% enviado para humano
Medindo Taxa de Acerto
A metrica mais importante
Como medir:
- 1. Pegue uma amostra de 100+ classificacoes recentes
- 2. Revise manualmente cada uma (ou use spot-check de 20%)
- 3. Marque corretas vs incorretas
- 4. Calcule: (corretas / total) ร 100
90%+ Excelente
Workflow maduro, pronto para escalar. Foco em custos e velocidade.
80-89% Bom
Funciona mas precisa de ajustes. Analise erros frequentes.
70-79% Regular
Prompt precisa de revisao seria. Adicione mais exemplos.
<70% Ruim
Pare e revise completamente. Pode precisar de novas categorias.
Dica:
Crie uma planilha de tracking. Registre: data, email original, classificacao da IA, classificacao correta, tipo de erro. Isso vai guiar suas melhorias.
Ajuste Fino de Prompts
A alavanca mais poderosa
1. Analise os erros frequentes
Agrupe os erros por tipo. Perguntas a fazer:
- ? Quais categorias sao mais confundidas entre si?
- ? Ha palavras-chave que estao confundindo a IA?
- ? As definicoes das categorias estao claras?
2. Adicione exemplos (few-shot)
Inclua 2-3 exemplos de cada categoria no prompt:
Exemplos:
"Nao consigo fazer login" โ suporte_tecnico
"Quanto custa o plano pro?" โ comercial
"Quero cancelar" โ cancelamento
3. Refine as definicoes
Se duas categorias estao sendo confundidas, deixe a diferenca mais explicita:
Antes: "comercial: assuntos de vendas"
Depois: "comercial: APENAS duvidas sobre precos, planos e upgrade. NAO inclui problemas tecnicos mesmo que mencionem planos."
A/B Testing de Prompts
Decisoes baseadas em dados
Como fazer A/B test:
- 1. Crie duas versoes do prompt (A = atual, B = novo)
- 2. Separe um conjunto de teste (50+ emails reais)
- 3. Execute ambos prompts nos mesmos emails
- 4. Compare taxa de acerto de cada versao
- 5. Implemente o vencedor em producao
Importante:
Mude apenas uma coisa por vez. Se mudar varias coisas, voce nao sabera qual causou a melhoria (ou piora).
Logs e Debugging
Encontre problemas rapidamente
O que logar em cada execucao:
- โ Timestamp de inicio e fim
- โ Input enviado para a IA
- โ Output da IA (JSON completo)
- โ Categoria e confianca
- โ Rota escolhida
- โ Acoes executadas
- โ Erros (se houver)
- โ Tokens consumidos
Onde armazenar:
- โข Google Sheets (simples)
- โข Airtable (visual)
- โข Banco de dados (escala)
- โข Logs do n8n (basico)
Por quanto tempo:
- โข Minimo: 30 dias
- โข Recomendado: 90 dias
- โข Erros: 1 ano
- โข Agregados: Sempre
Otimizacao de Custos
Mais eficiencia, menos gastos
Use modelos menores
Para classificacao simples, GPT-4o-mini ou Claude Haiku funcionam tao bem quanto modelos maiores por uma fracao do custo.
Pre-filtre com regras
Use regras simples para casos obvios antes de chamar a IA. Se email contem "unsubscribe", e spam - nao precisa de IA.
Limite o input
Nao envie o email inteiro se 500 caracteres sao suficientes. Menos tokens = menos custo.
Cache respostas similares
Emails muito parecidos podem usar classificacao em cache ao inves de chamar a IA novamente.
Calculadora de custos:
1.000 emails/dia
~$3/mes
10.000 emails/dia
~$30/mes
100.000 emails/dia
~$300/mes
Estimativas usando GPT-4o-mini, ~500 tokens/email
Ciclo de Melhoria Continua
PDCA para AI Workflows
P - Plan (Planejar)
- โข Defina meta de precisao
- โข Identifique areas de melhoria
- โข Planeje ajustes no prompt
D - Do (Executar)
- โข Implemente as mudancas
- โข Teste em ambiente controlado
- โข Documente alteracoes
C - Check (Verificar)
- โข Meca os resultados
- โข Compare com baseline
- โข Analise desvios
A - Act (Agir)
- โข Padronize o que funcionou
- โข Corrija o que nao funcionou
- โข Reinicie o ciclo
Frequencia recomendada:
Parabens!
Voce completou a Trilha de Implementacao
O que voce aprendeu:
- โ Conceitos de AI Workflows
- โ Classificacao inteligente
- โ Construir workflows do zero
- โ Roteamento e acoes
- โ Otimizacao e monitoramento
- โ Melhoria continua
Pronto para o proximo nivel?
Comecar Trilha 3: MaestriaResumo do Modulo
Trilha Concluida!
Agora voce sabe construir e otimizar AI Workflows