MODULO 2.5 - IMPLEMENTACAO

Otimizacao e Monitoramento

Metricas, ajuste fino de prompts e ciclo de melhoria continua

4
Metricas-chave
95%
Meta de Precisao
PDCA
Ciclo Continuo
๐Ÿ“Š

Metricas Essenciais

Voce nao pode melhorar o que nao mede

Para otimizar seu AI Workflow, voce precisa medir 4 metricas fundamentais que vao guiar suas decisoes de ajuste e investimento.

Taxa de Acerto

% de classificacoes corretas

Meta: 90%+

Tempo de Processamento

Segundos do trigger a acao

Meta: <10s

Custo por Execucao

Tokens + infra por item

Meta: <$0.01

Taxa de Escalacao

% enviado para humano

Meta: <10%
๐ŸŽฏ

Medindo Taxa de Acerto

A metrica mais importante

Como medir:

  1. 1. Pegue uma amostra de 100+ classificacoes recentes
  2. 2. Revise manualmente cada uma (ou use spot-check de 20%)
  3. 3. Marque corretas vs incorretas
  4. 4. Calcule: (corretas / total) ร— 100

90%+ Excelente

Workflow maduro, pronto para escalar. Foco em custos e velocidade.

80-89% Bom

Funciona mas precisa de ajustes. Analise erros frequentes.

70-79% Regular

Prompt precisa de revisao seria. Adicione mais exemplos.

<70% Ruim

Pare e revise completamente. Pode precisar de novas categorias.

Dica:

Crie uma planilha de tracking. Registre: data, email original, classificacao da IA, classificacao correta, tipo de erro. Isso vai guiar suas melhorias.

๐Ÿ“

Ajuste Fino de Prompts

A alavanca mais poderosa

1. Analise os erros frequentes

Agrupe os erros por tipo. Perguntas a fazer:

  • ? Quais categorias sao mais confundidas entre si?
  • ? Ha palavras-chave que estao confundindo a IA?
  • ? As definicoes das categorias estao claras?

2. Adicione exemplos (few-shot)

Inclua 2-3 exemplos de cada categoria no prompt:

Exemplos:

"Nao consigo fazer login" โ†’ suporte_tecnico

"Quanto custa o plano pro?" โ†’ comercial

"Quero cancelar" โ†’ cancelamento

3. Refine as definicoes

Se duas categorias estao sendo confundidas, deixe a diferenca mais explicita:

Antes: "comercial: assuntos de vendas"

Depois: "comercial: APENAS duvidas sobre precos, planos e upgrade. NAO inclui problemas tecnicos mesmo que mencionem planos."

๐Ÿงช

A/B Testing de Prompts

Decisoes baseadas em dados

Como fazer A/B test:

  1. 1. Crie duas versoes do prompt (A = atual, B = novo)
  2. 2. Separe um conjunto de teste (50+ emails reais)
  3. 3. Execute ambos prompts nos mesmos emails
  4. 4. Compare taxa de acerto de cada versao
  5. 5. Implemente o vencedor em producao

Importante:

Mude apenas uma coisa por vez. Se mudar varias coisas, voce nao sabera qual causou a melhoria (ou piora).

๐Ÿ”

Logs e Debugging

Encontre problemas rapidamente

O que logar em cada execucao:

  • โœ“ Timestamp de inicio e fim
  • โœ“ Input enviado para a IA
  • โœ“ Output da IA (JSON completo)
  • โœ“ Categoria e confianca
  • โœ“ Rota escolhida
  • โœ“ Acoes executadas
  • โœ“ Erros (se houver)
  • โœ“ Tokens consumidos

Onde armazenar:

  • โ€ข Google Sheets (simples)
  • โ€ข Airtable (visual)
  • โ€ข Banco de dados (escala)
  • โ€ข Logs do n8n (basico)

Por quanto tempo:

  • โ€ข Minimo: 30 dias
  • โ€ข Recomendado: 90 dias
  • โ€ข Erros: 1 ano
  • โ€ข Agregados: Sempre
๐Ÿ’ฐ

Otimizacao de Custos

Mais eficiencia, menos gastos

1.

Use modelos menores

Para classificacao simples, GPT-4o-mini ou Claude Haiku funcionam tao bem quanto modelos maiores por uma fracao do custo.

2.

Pre-filtre com regras

Use regras simples para casos obvios antes de chamar a IA. Se email contem "unsubscribe", e spam - nao precisa de IA.

3.

Limite o input

Nao envie o email inteiro se 500 caracteres sao suficientes. Menos tokens = menos custo.

4.

Cache respostas similares

Emails muito parecidos podem usar classificacao em cache ao inves de chamar a IA novamente.

Calculadora de custos:

1.000 emails/dia

~$3/mes

10.000 emails/dia

~$30/mes

100.000 emails/dia

~$300/mes

Estimativas usando GPT-4o-mini, ~500 tokens/email

๐Ÿ”„

Ciclo de Melhoria Continua

PDCA para AI Workflows

P - Plan (Planejar)

  • โ€ข Defina meta de precisao
  • โ€ข Identifique areas de melhoria
  • โ€ข Planeje ajustes no prompt

D - Do (Executar)

  • โ€ข Implemente as mudancas
  • โ€ข Teste em ambiente controlado
  • โ€ข Documente alteracoes

C - Check (Verificar)

  • โ€ข Meca os resultados
  • โ€ข Compare com baseline
  • โ€ข Analise desvios

A - Act (Agir)

  • โ€ข Padronize o que funcionou
  • โ€ข Corrija o que nao funcionou
  • โ€ข Reinicie o ciclo

Frequencia recomendada:

Diario: Monitorar erros
Semanal: Revisar metricas
Mensal: Ajustar prompts
Trimestral: Revisar categorias
๐ŸŽ‰

Parabens!

Voce completou a Trilha de Implementacao

O que voce aprendeu:

  • โœ“ Conceitos de AI Workflows
  • โœ“ Classificacao inteligente
  • โœ“ Construir workflows do zero
  • โœ“ Roteamento e acoes
  • โœ“ Otimizacao e monitoramento
  • โœ“ Melhoria continua

Pronto para o proximo nivel?

Comecar Trilha 3: Maestria

Resumo do Modulo

โœ“ 4 metricas essenciais: acerto, tempo, custo, escalacao
โœ“ Ajuste prompts com base em analise de erros frequentes
โœ“ Use A/B testing para validar mudancas
โœ“ Log tudo para debugging e auditoria
โœ“ Aplique PDCA para melhoria continua

Trilha Concluida!

Agora voce sabe construir e otimizar AI Workflows

Anterior: Roteamento Trilha 3: Maestria