Pontuação de entregabilidade para email frio: decida quais segmentos escalar
Crie uma pontuação de entregabilidade para email frio a partir de taxas de rejeição, denúncias e respostas, para identificar segmentos seguros para escalar e pausar os arriscados.

O que uma pontuação por entregabilidade por segmento resolve
Entregabilidade é simples: seus emails chegam a um lugar onde uma pessoa real pode ler? O melhor caso é a caixa de entrada. Pior é spam. Pior ainda é não entregar nada porque o endereço é inválido, o domínio rejeita você ou você foi bloqueado.
A maioria das equipes se engana porque olha para um número único e ignora a mistura de sinais por trás dele. Uma baixa taxa de rejeição pode parecer “saudável” enquanto denúncias sobem silenciosamente e prejudicam sua reputação de remetente. Uma alta taxa de resposta pode parecer justificativa para escalar, mesmo que grande parte do volume esteja indo para spam e apenas as pessoas mais motivadas estejam encontrando você.
Uma pontuação de entregabilidade é útil quando força a pergunta certa: esse recorte de outbound está ajudando nossa entrega na caixa de entrada ou arrastando-a para baixo?
A peça que falta é segmentação. Resultados raramente são uniformes na sua lista. Um recorte pode estar limpo e responsivo, enquanto outro está cheio de dados antigos ou de pessoas que odeiam seu ângulo. A pontuação deve ser calculada por segmento que você realmente possa agir, como:
- Fonte da lista (por exemplo, Apollo vs indicações)
- Tipo de domínio do destinatário (domínios corporativos vs provedores gratuitos)
- Grupo de audiência (founders vs SDRs)
- Região (EUA vs UE)
- Ângulo da oferta (pedido de demo vs conteúdo primeiro)
Uma vez que você pontue segmentos separadamente, para de tomar decisões “pela média” que te prejudicam.
Essa pontuação não é para relatório. É uma ferramenta de decisão com três desfechos: escalar, corrigir ou parar.
- Escalar segmentos que entregam, geram respostas e continuam limpos.
- Corrigir segmentos que podem funcionar mas têm um problema específico (frequentemente qualidade da lista).
- Parar segmentos que provavelmente danificam a entregabilidade mesmo que eventualmente gerem respostas.
Exemplo: seu segmento “Founders SaaS EUA” recebe respostas constantes com quase nenhuma denúncia, enquanto seu segmento “todos os cargos de vendas” tem respostas parecidas mas mais denúncias e mais bounces. Sem pontuação por segmento, você poderia escalar ambos. Com ela, você escala founders e limpa, reformula ou pausa o segmento de cargos de vendas.
Como definir segmentos que você realmente pode agir
Um segmento só é útil se uma mudança clara melhoraria ele. Se você não consegue nomear a ação que tomaria com base na pontuação, não é um segmento útil.
Comece simples. Segmentos com uma regra são mais fáceis de entender e corrigir. “Prospects do Apollo” é acionável: se pontuar mal, você pode apertar filtros, validar emails ou mudar a fonte. Segmentos com várias regras funcionam quando representam um movimento real de GTM, mas evite empilhar regras só para fazer o número parecer melhor. Isso geralmente cria ruído.
Bons cortes de segmento levam a decisões óbvias, como:
- Fonte do lead
- Indústria
- Senioridade
- Tipo de domínio
- Ângulo da oferta
Escolha de 2 a 4 tipos de segmento e mantenha-os por um mês. Se definir 20 segmentos, você não terá tempo para consertar nenhum.
Volume mínimo (para não agir sobre ruído)
Números precisam de volume suficiente para serem confiáveis. Não julgue um segmento por uma amostra pequena onde alguns bounces ou uma reclamação mudam tudo.
Um mínimo prático antes de agir:
- Pelo menos 300 emails entregues no segmento
- Ou pelo menos 10 respostas totais se a taxa de resposta for parte da decisão
Recalcule numa frequência que combine com sua velocidade de envio. Semanal é um padrão sólido: suaviza oscilações diárias e ainda pega problemas cedo. Recalcular diariamente só faz sentido se você envia muito por segmento e realmente vai pausar ou ajustar em 24 horas.
Um detalhe importante: defina segmentos por quem você direcionou, não por como responderam. A pontuação deve ajudar a corrigir o direcionamento e a saúde do envio, não apenas perseguir as respostas da semana passada.
Os três insumos: bounces, denúncias, respostas
Uma pontuação por segmento funciona só se os insumos forem simples, confiáveis e ligados ao que prejudica entregabilidade. Três métricas fazem a maior parte do trabalho: taxa de rejeição, taxa de denúncias e taxa de resposta.
Taxa de rejeição (falha de entrega)
Bounces dizem se você está alcançando caixas reais. Uma alta taxa de rejeição geralmente não é problema de copy. Aponta para qualidade de lista ruim como enriquecimento incorreto, dados antigos ou domínios arriscados.
Como regra prática para outbound frio:
- Abaixo de 2% geralmente é aceitável.
- 2% a 5% é um sinal de aviso de que os dados do segmento estão ficando bagunçados.
- Acima de 5% é um sinal de parar e consertar antes de escalar.
Mesmo com respostas, bounces podem prejudicar a reputação rapidamente, especialmente em segmentos grandes.
Taxa de denúncias (denúncias de spam)
Denúncias são poucas em número mas pesadas em impacto. Uma pessoa clicando em “Report spam” pode prejudicar mais que dez pessoas te ignorando.
Para a maioria das equipes, o objetivo é simples: mantenha denúncias perto de zero. Se um segmento gera denúncias repetidas, trate como sinal vermelho mesmo que outras métricas pareçam boas.
Taxa de resposta (entregabilidade + relevância)
Respostas são um sinal combinado útil. Você só recebe respostas se os emails chegam e a mensagem faz sentido para a audiência.
Mas leia a taxa de resposta com cuidado. Um segmento com 6% de respostas composto majoritariamente por “não tenho interesse” pode ser entregável, só que mal direcionado. Se você consegue separar respostas reais de respostas automáticas (como out-of-office), faça isso. Caso contrário, a taxa de resposta fica inflada e perde comparabilidade.
Onde encaixam os descadastramentos
Descadastramentos funcionam melhor como um limitador, não como parte da pontuação. Acompanhe a taxa de descadastro separadamente e defina um teto rígido. Se ultrapassar, não escale esse segmento até ajustar direcionamento e mensagem.
Um modelo simples de pontuação que você explica em um minuto
Uma pontuação por segmento deve ser sem graça: um número de 0–100 que se mantenha consistente ao longo do tempo. Se a fórmula ficar mudando, você vai acabar perseguindo o número em vez de consertar o problema subjacente.
Esse modelo mantém prioridades claras: denúncias recebem a maior penalidade, bounces uma penalidade forte, respostas adicionam um impulso limitado.
A pontuação (0-100)
Use taxas como decimais (então 2% é 0.02):
score = 100
- 800 * bounce_rate
- 2000 * complaint_rate
+ 100 * reply_rate
Clamp score to 0-100.
Por que esses pesos?
- Denúncias são raras mas sérias, por isso a penalidade é acentuada.
- Bounces importam porque podem derrubar reputação rápido, e frequentemente são corrigíveis limpando a lista.
- Respostas são positivas, mas não deveriam “comprar” sua saída do risco de denúncias.
Antes de calcular, mantenha definições consistentes:
- Taxa de rejeição: somente hard bounces (mailbox inválida), não soft bounces
- Taxa de denúncia: denúncias de spam, não descadastramentos
- Taxa de resposta: respostas a partir de emails entregues, idealmente excluindo out-of-office
Guardrails e proteção para amostras pequenas
Mesmo uma pontuação razoável pode esconder um problema real se o segmento for pequeno. Adicione algumas regras para não escalar por ruído:
- Auto-falha: se a taxa de denúncias > 0,30%, defina pontuação como 0 e pause o segmento
- Teto de bounce: se a taxa de rejeição > 5%, limite a pontuação a 30 até consertar a lista
- Volume mínimo: só pontue segmentos com pelo menos 200 emails entregues na janela
- Teto de impulso por resposta: limite o bônus de respostas a +15 pontos para que um segmento muito “falante” não esconda risco
Exemplo: denúncias 0.10% (0.001), bounces 1.5% (0.015), respostas 6% (0.06).
Score = 100 - 800(0.015) - 2000(0.001) + 100(0.06) = 100 - 12 - 2 + 6 = 92.
Se denúncias subissem para 0.4% (0.004), o segmento auto-reprovaria independentemente das respostas.
Passo a passo: calcular a pontuação para cada segmento
Escolha uma janela de tempo e mantenha-a. Para a maioria das equipes, os últimos 7 dias pegam problemas rápido, enquanto 14 dias suavizam ruído. Seja qual for sua escolha, mantenha consistente para que a pontuação seja comparável semana a semana.
Para cada segmento, puxe contagens brutas da mesma janela:
- Enviados
- Entregues (enviados menos hard bounces)
- Hard bounces
- Denúncias de spam
- Respostas humanas
- Descadastramentos (rastrear separadamente)
Depois calcule as taxas:
- Taxa de rejeição = hard bounces / enviados
- Taxa de denúncia = denúncias de spam / entregues
- Taxa de resposta = respostas humanas / entregues
Sobre respostas: exclua respostas automáticas como out-of-office se puder. Elas inflacionam a taxa de resposta mas não significam que sua mensagem foi bem-vinda.
Aplique a fórmula, depois rotule cada segmento com um próximo passo simples:
- Escalar: pontuação 80–100 e estável ou melhorando
- Observar: pontuação 60–79 ou tendência flat
- Corrigir: pontuação 40–59 ou caída semana a semana
- Parar: pontuação abaixo de 40, ou qualquer pico de denúncias inexplicável
Não trate o número mais recente como a história completa. Acompanhe a tendência para cada segmento (esta semana, semana passada, duas semanas atrás). Um segmento em 72 e subindo costuma ser mais seguro para escalar que um em 82 que está caindo rápido.
Como usar a pontuação para decidir o que escalar
Uma pontuação só é útil se leva a ações consistentes. Trate a pontuação do segmento como um semáforo: segmentos verdes ganham mais volume, amarelos são observados e testados com cuidado, e vermelhos são corrigidos antes de enviar outro lote.
Mantenha regras estáveis para não renegociar toda semana:
- 80 a 100 (escalar): aumente volume em pequenos passos e mantenha direcionamento e copy basicamente iguais.
- 60 a 79 (observar): mantenha volume e rode um teste de baixo risco (qualidade da lista, ajuste de mensagem ou oferta).
- Abaixo de 60 (corrigir): pare de escalar, conserte a causa raiz e só retome quando a pontuação subir.
Quando um segmento está na faixa de escala, evite dobrar volume da noite para o dia. Aumente gradualmente (por exemplo, 10% a 20% por semana) e reavalie depois de cada mudança. Picos súbitos podem elevar bounces e denúncias, o que prejudica todas as suas caixas.
Alguns sinais devem sobrepor a pontuação e disparar uma pausa imediata:
- Um aumento súbito em hard bounces geralmente significa lista obsoleta ou muito ampla.
- Um aumento na taxa de denúncias é ainda mais sério e deve ser tratado como freio de emergência.
Use a pontuação para escolher onde os experimentos são seguros. Segmentos fortes são onde você pode testar ideias mais ousadas porque tem uma almofada. Segmentos fracos são onde focar em reduzir risco primeiro.
Exemplo: pontuando segmentos para escolher o vencedor de escala
Imagine que você faz outbound para um produto, com duas fontes de lista (Apollo e participantes de evento), três indústrias (SaaS, agências de marketing, saúde) e duas ofertas (um teardown curto ou um case study relevante). Você não quer escalar tudo. Quer um ou dois vencedores claros.
Depois dos primeiros 1.000 envios em cada (mesma configuração de envio, assunto de tamanho similar, mesmo pool de caixas), você calcula a pontuação por segmento:
| Segmento (fonte + indústria + oferta) | Bounce | Denúncias | Respostas | O que significa |
|---|---|---|---|---|
| Evento + SaaS + Teardown | 1.2% | 0.02% | 3.8% | Forte candidato a escala |
| Apollo + SaaS + Teardown | 2.8% | 0.04% | 2.4% | Lista limpa, então escale |
| Evento + Agências + Case study | 1.0% | 0.03% | 1.6% | Seguro, mas oferta pode estar fraca |
| Apollo + Agências + Teardown | 4.6% | 0.08% | 1.9% | Corrigir bounces primeiro |
| Evento + Saúde + Case study | 1.4% | 0.06% | 0.9% | Entregável, não persuasivo |
| Apollo + Saúde + Teardown | 6.2% | 0.12% | 0.6% | Parar e reconstruir segmento |
Duas coisas saltam:
- A lista de eventos é consistentemente mais saudável (menos bounces e denúncias).
- Saúde não está respondendo ao teardown, e a versão Apollo é ativamente arriscada.
Ações baseadas nisso:
- Escale “Evento + SaaS + Teardown” primeiro adicionando volume devagar, e mantenha separado para que não masque problemas em outros segmentos.
- Para “Apollo + SaaS”, limpe a lista antes de aumentar volume (remova cargos arriscados, valide emails, aperte filtros de empresas) e então rode um pequeno lote.
- Para “Evento + Saúde”, mantenha a entregabilidade estável mas mude a oferta e a mensagem já que o problema é respostas.
- Para “Apollo + Saúde”, pause e conserte direcionamento e higiene da lista antes de queimar reputação de remetente.
Erros comuns que tornam a pontuação inútil
Uma pontuação por segmento só ajuda se for consistente e apontar para uma causa real. A maioria das falhas vem de misturar sinais que significam coisas diferentes, ou confiar em dados muito finos.
Formas comuns de estragar a pontuação:
- Tratar taxa de resposta como único sinal. Respostas podem cair por oferta, timing ou direcionamento. Problemas de entregabilidade aparecem mais rápido em bounces e denúncias.
- Misturar caixas novas com aquecidas. Novos remetentes se comportam diferente e normalmente precisam de menor volume. Se você mistura, a pontuação não explica nada.
- Confiar em amostras minúsculas. Defina um volume mínimo antes de pontuar. Caso contrário, uma reclamação pode causar decisões aleatórias.
- Mudar os pesos toda semana. Se a fórmula se mexe, você não consegue comparar esta semana com a passada.
- Ignorar domínios de envio ou grupos de caixa. Entregabilidade costuma ser específica por domínio. Um domínio ruim pode puxar uma visão combinada para baixo e fazer você pausar o segmento errado.
Se um segmento “melhora” só porque você reclassificou respostas ou mudou definições, isso não é entregabilidade. Mantenha definições estáveis para que a pontuação reflita saúde do remetente, não rótulos móveis.
Checagens rápidas antes de escalar um segmento
Antes de aumentar volume, reserve cinco minutos para um check de sanidade. Uma pontuação pode parecer ótima no papel, mas uma questão escondida pode prejudicar a entrega quando você escala.
Cheque esses sinais na mesma janela de pontuação (por exemplo, últimos 7 dias) e compare com a janela anterior:
- Composição dos bounces: se bounces são majoritariamente hard (endereço ruim, domínio inexistente), escalar só vai causar mais dano.
- Qualquer denúncia: se denúncias apareceram na janela mais recente e não na anterior, trate o segmento como instável e segure.
- Tendência de respostas: estável é bom, em alta é melhor. Se respostas caem semana a semana, escalar tende a piorar a queda.
- Mudanças recentes: novas regras de segmento, nova fonte de lista ou novo copy podem redefinir desempenho. Espere envios suficientes para julgar ou volte atrás.
- Mudanças súbitas de volume: se você dobrou envios nas últimas 48 horas, a pontuação pode estar defasada. Rame em passos.
Exemplo: seu segmento “Agências EUA” pontua bem, mas o volume subiu após adicionar uma nova fonte de prospect e hard bounces aumentaram. Mesmo que a pontuação ainda pareça saudável, escalar agora é arriscado. Conserte a qualidade da lista primeiro e re-pontue depois de uma janela limpa.
Próximos passos: torne a pontuação parte da sua rotina semanal
Trate sua pontuação de entregabilidade como um check-up semanal. Escolha um dia e hora, reveja os mesmos segmentos toda semana e faça uma ou duas mudanças que você consiga rastrear.
Proteja a qualidade da lista em primeiro lugar. Se um segmento mostra bounces ou denúncias maiores, não force com mais volume. Pause, remova inválidos óbvios (contas de função, padrões ruins, exports antigos) e seja cuidadoso com fontes que você não consegue verificar.
Mantenha mudanças de volume graduais. Aumente por domínio e por caixa, não só no total, para não gerar picos de bounces ou denúncias.
Uma rotina semanal simples:
- Recalcule a pontuação de cada segmento usando os últimos 7 dias (ou últimos 1.000 envios).
- Pare envios para qualquer segmento que ultrapasse suas linhas vermelhas de bounce ou denúncia.
- Aperte o direcionamento ou reescreva a oferta para segmentos com baixas respostas que estão limpos.
- Escale no máximo um segmento vencedor por semana e limite o aumento.
- Registre o que mudou (fonte da lista, copy, oferta, volume) para aprender.
Se quiser facilitar a manutenção, ajuda ter bounces, denúncias e tipos de resposta visíveis em um só lugar. LeadTrain (leadtrain.app) é construído em torno desse fluxo, combinando setup de envio, warm-up, sequências e classificação de respostas para você revisar segmentos rapidamente e agir sem pular entre ferramentas.
Perguntas Frequentes
Por que uma pontuação por segmento é melhor do que uma pontuação geral?
Uma pontuação por segmento impede que você tome decisões “por média”. Em vez de um número agregado, você vê exatamente qual fatia do outreach está ajudando a colocação na caixa de entrada e qual está somando bounces ou denúncias.
Como escolho segmentos que realmente sejam acionáveis?
Comece com segmentos onde uma ação clara pode melhorar o resultado — por exemplo, fonte do lead, tipo de domínio, indústria, senioridade ou ângulo da oferta. Se você não souber o que mudaria depois de ver a pontuação, o segmento não é útil.
Qual é o volume mínimo antes de confiar na pontuação de um segmento?
Como referência prática, espere por pelo menos 300 emails entregues em um segmento, ou 10 respostas totais se a taxa de resposta fizer parte da decisão. Amostras menores oscilam demais por uma ou duas interações.
O que exatamente deve contar como taxa de rejeição, taxa de denúncia e taxa de resposta?
Use bounces permanentes (hard bounces) apenas para taxa de rejeição, conte denúncias de spam para a taxa de reclamação, e meça a taxa de resposta a partir de emails entregues. Mantenha as definições estáveis para que mudanças semana a semana reflitam a realidade.
Qual é uma fórmula simples que posso usar agora mesmo?
Use uma fórmula simples de 0–100 que puna denúncias com mais peso, penalize bounces fortemente e dê um bônus limitado para respostas. O objetivo é decisões consistentes ao longo do tempo, não um número perfeito.
As descadastramentos devem fazer parte da pontuação de entregabilidade?
Melhor tratá-las como uma proteção separada. Acompanhe a taxa de cancelamento isoladamente e defina um limite rígido; se um segmento ultrapassar esse limite, não escale até ajustar o direcionamento ou a mensagem.
Como usar a pontuação para decidir “escalar, corrigir ou parar”?
Escale segmentos limpos e estáveis, corrija segmentos que mostram um problema específico (frequentemente qualidade da lista ou direcionamento), e pare segmentos que continuam gerando denúncias ou muitos bounces. Trate a pontuação como um semáforo, não como um relatório definitivo.
Um segmento pode ter boas respostas e ainda assim ser arriscado de escalar?
Sim — pause rapidamente. Uma regra prática é auto-reprovar um segmento se a taxa de denúncias passar de 0,30%, mesmo que as respostas pareçam boas, porque denúncias podem danificar a reputação com rapidez.
Com que rapidez posso aumentar o volume em um segmento com boa pontuação?
Aumente volume em passos pequenos (por exemplo, 10% a 20% por semana) e reavalie após cada alteração. Picos súbitos podem elevar bounces e denúncias e prejudicar a entregabilidade de todas as suas caixas.
Quais são os erros mais comuns que tornam a pontuação por segmento inútil?
Os erros mais comuns são confiar em amostras pequenas demais, usar apenas taxa de resposta como sinal, misturar caixas novas com aquecidas, mudar os pesos da fórmula toda semana e ignorar diferenças por domínio ou grupo de caixa. Qualquer um desses faz a pontuação enganar.