Score de délivrabilité des e-mails à froid : décider quels segments développer
Construisez un score de délivrabilité pour vos e-mails à froid à partir du taux de rebond, du taux de plaintes et du taux de réponse, afin d'identifier les segments sûrs à développer et de mettre en pause les segments risqués.

Ce que résout un score de délivrabilité par segment
La délivrabilité, c'est simple : vos e-mails arrivent-ils quelque part où une vraie personne peut les lire ? Idéalement la boîte de réception. Pire : le spam. Le pire : pas de livraison du tout parce que l'adresse est mauvaise, le domaine vous rejette ou vous tombez sur un blocage.
La plupart des équipes se font piéger en regardant un seul chiffre et en ignorant le mélange de signaux qui le compose. Un faible taux de rebond peut sembler « sain » tandis que les plaintes augmentent discrètement et abîment votre réputation d'expéditeur. Un fort taux de réponse peut donner l'impression qu'il faut développer, alors qu'une grande partie du volume atterrit en spam et que seules les personnes les plus motivées vous trouvent.
Un score de délivrabilité est utile quand il force la bonne question : cette tranche d'outbound améliore-t-elle notre placement en boîte de réception, ou l'enfonce-t-elle en douce ?
La pièce manquante, c'est la segmentation. Les résultats sont rarement uniformes sur toute votre liste. Une tranche peut être propre et réactive, tandis qu'une autre est pleine de données anciennes ou de personnes qui n'apprécient pas votre angle. Le score doit être calculé par segment sur lequel vous pouvez réellement agir, par exemple :
- Source de la liste (par exemple Apollo vs parrainages)
- Type de domaine destinataire (domaines corporate vs fournisseurs de boîtes gratuites)
- Groupe d'audience (fondateurs vs SDRs)
- Région (États-Unis vs UE)
- Angle de l'offre (demande de démo vs contenu d'abord)
Une fois que vous notez les segments séparément, vous arrêtez de prendre des décisions “moyennes” qui vous nuisent.
Ce score n'est pas fait pour le reporting. C'est un outil décisionnel avec trois issues : développer, corriger, ou arrêter.
- Développer les segments qui délivrent, reçoivent des réponses et restent propres.
- Corriger les segments qui pourraient fonctionner mais ont un problème précis (souvent la qualité de la liste).
- Arrêter les segments qui risquent d'endommager la délivrabilité même s'ils répondent parfois.
Exemple : votre segment « US SaaS founders » obtient des réponses régulières avec presque aucune plainte, tandis que votre segment « all sales titles » obtient des réponses similaires mais plus de plaintes et plus de rebonds. Sans scoring par segment, vous pourriez développer les deux. Avec lui, vous développez founders et nettoyez, reformulez ou mettez en pause le segment sales-titles.
Comment définir des segments sur lesquels vous pouvez agir
Un segment n'est utile que si une action claire améliorerait ses résultats. Si vous ne pouvez pas nommer l'action que vous prendriez en fonction du score, ce n'est pas un segment utile.
Commencez simple. Les segments à règle unique sont plus faciles à comprendre et à corriger. « Prospects depuis Apollo » est actionnable : si le score est mauvais, vous pouvez resserrer les filtres, valider les e-mails ou changer la source. Les segments à règles multiples sont acceptables quand ils représentent un vrai mouvement go-to-market, mais évitez d'empiler les règles juste pour embellir le chiffre. Ça crée du bruit.
Les bons découpages de segment sont ceux qui mènent à des décisions évidentes, comme :
- Source des leads
- Secteur
- Niveau de seniorité
- Type de domaine
- Angle de l'offre
Choisissez 2 à 4 types de segments et tenez-vous-y pendant un mois. Si vous définissez 20 segments, vous n'aurez pas le temps d'en corriger un seul.
Volume minimum (pour ne pas agir sur du bruit)
Les chiffres ont besoin de volume suffisant pour être fiables. Ne jugez pas un segment sur un petit échantillon où quelques rebonds ou une plainte peuvent faire varier fortement le taux.
Un minimum pratique avant d'agir :
- Au moins 300 e-mails délivrés dans le segment
- Ou au moins 10 réponses totales si le taux de réponse fait partie de la décision
Recalculez selon un rythme adapté à votre vitesse d'envoi. Hebdomadaire est une bonne valeur par défaut : ça lisse les variations quotidiennes et permet de détecter les problèmes tôt. Un recalcul quotidien n'a de sens que si vous envoyez beaucoup par segment et que vous allez réellement mettre en pause ou ajuster en 24 heures.
Un détail important : définissez les segments par qui vous avez ciblé, pas par comment ils ont répondu. Le score doit vous aider à corriger le ciblage et la santé d'envoi, pas juste à courir après les réponses de la semaine précédente.
Les trois entrées : rebonds, plaintes, réponses
Un score par segment ne fonctionne que si les entrées sont simples, fiables et liées à ce qui nuit à la délivrabilité. Trois métriques font la plupart du travail : taux de rebond, taux de plainte et taux de réponse.
Taux de rebond (échec de livraison)
Les rebonds vous disent si vous atteignez de vraies boîtes. Un taux de rebond élevé n'est généralement pas un problème de message. Il pointe vers la qualité de la liste : enrichissement défaillant, données anciennes ou domaines risqués.
Comme règle empirique pour l'outbound à froid :
- Sous 2% c'est généralement acceptable.
- 2% à 5% est un signal d'alerte que le segment se salit.
- Au-delà de 5% c'est un signal d'arrêter et corriger avant de développer.
Même si vous obtenez des réponses, les rebonds peuvent abîmer la réputation d'expéditeur rapidement, surtout sur des segments volumineux.
Taux de plainte (signalements spam)
Les plaintes sont rares en nombre mais lourdes en impact. Une personne qui clique sur « Signaler comme spam » peut nuire plus que dix personnes qui vous ignorent.
Pour la plupart des équipes, l'objectif est simple : maintenir les plaintes proches de zéro. Si un segment produit des plaintes répétées, traitez-le comme un drapeau rouge même si d'autres métriques semblent bonnes.
Taux de réponse (délivrabilité + pertinence)
Les réponses sont un signal combiné utile. Vous n'obtenez des réponses que si les e-mails arrivent et que le message correspond à l'audience.
Mais lisez le taux de réponse attentivement. Un segment à 6% de réponses composé majoritairement de « pas intéressé » peut être délivrable mais mal ciblé. Si vous pouvez séparer les vraies réponses des autos-réponses (ex. absence du bureau), faites-le. Sinon, le taux de réponse s'infléchit et il devient difficile de comparer.
Où placer les désabonnements
Les désabonnements servent mieux de garde-fou que de composante du score. Suivez le taux de désabonnement séparément et définissez un plafond strict. Si un segment le dépasse, ne le développez pas tant que vous n'avez pas ajusté le ciblage et le message.
Un modèle de scoring simple que l'on peut expliquer en une minute
Un score par segment doit être ennuyeux : un nombre unique sur une échelle 0–100 qui reste cohérent dans le temps. Si la formule change sans arrêt, vous finirez par courir après le score au lieu de corriger le problème sous-jacent.
Ce modèle maintient les priorités : les plaintes reçoivent la plus grosse pénalité, les rebonds une pénalité forte, les réponses apportent un bonus limité.
Le score (0–100)
Utilisez les taux comme décimales (donc 2% = 0.02) :
score = 100
- 800 * bounce_rate
- 2000 * complaint_rate
+ 100 * reply_rate
Clamp score to 0-100.
Pourquoi ces pondérations ?
- Les plaintes sont rares mais graves, donc la pénalité est forte.
- Les rebonds comptent car ils peuvent rapidement tirer la réputation vers le bas, et ils sont souvent réparables en nettoyant la liste.
- Les réponses sont positives, mais elles ne doivent pas « racheter » le risque de plaintes.
Avant de calculer, gardez les définitions cohérentes :
- Taux de rebond : hard bounces uniquement (boîte invalide), pas les soft bounces
- Taux de plainte : plaintes pour spam, pas les désabonnements
- Taux de réponse : réponses humaines parmi les e-mails délivrés, idéalement sans les absences du bureau
Garde-fous et protection contre les petits échantillons
Même un score apparemment correct peut cacher un vrai problème si le segment est petit. Ajoutez quelques règles pour ne pas développer sur du bruit :
- Échec automatique : si le taux de plaintes > 0,30%, mettre le score à 0 et mettre le segment en pause
- Plafond de rebond : si le taux de rebond > 5%, plafonner le score à 30 jusqu'à correction
- Volume minimum : ne scorer que les segments avec au moins 200 e-mails délivrés sur la fenêtre
- Plafond du boost réponse : limiter le bonus réponse à +15 points pour qu'un segment bavard ne masque pas le risque
Exemple : plaintes 0,10% (0.001), rebonds 1,5% (0.015), réponses 6% (0.06).
Score = 100 - 800(0.015) - 2000(0.001) + 100(0.06) = 100 - 12 - 2 + 6 = 92.
Si les plaintes montaient à 0,4% (0.004), le segment échouerait automatiquement quelle que soit la réponse.
Étape par étape : calculer le score pour chaque segment
Choisissez une fenêtre temporelle et tenez-vous-y. Pour la plupart des équipes, les 7 derniers jours détectent vite les problèmes, tandis que 14 jours lissent le bruit. Quel que soit votre choix, gardez-le constant pour comparer semaine après semaine.
Pour chaque segment, extrayez les comptes bruts sur la même fenêtre :
- Envoyés
- Délivrés (envoyés moins hard bounces)
- Hard bounces
- Plaintes pour spam
- Réponses humaines
- Désabonnements (suivis séparément)
Puis calculez les taux :
- Taux de rebond = hard bounces / envoyés
- Taux de plainte = plaintes pour spam / délivrés
- Taux de réponse = réponses humaines / délivrés
Concernant les réponses : excluez les autos-réponses comme les absences du bureau si vous le pouvez. Elles gonflent le taux de réponse sans signifier que votre message est bien accueilli.
Appliquez la formule, puis attribuez à chaque segment une action simple :
- Scale : score 80–100 et stable ou en amélioration
- Watch : score 60–79 ou tendance plate
- Fix : score 40–59 ou en baisse semaine après semaine
- Stop : score en dessous de 40, ou toute montée inexpliquée des plaintes
Ne traitez pas le dernier chiffre isolé comme toute l'histoire. Suivez la tendance pour chaque segment (cette semaine, la semaine dernière, il y a deux semaines). Un segment à 72 et en hausse est souvent plus sûr à développer qu'un segment à 82 qui chute rapidement.
Comment utiliser le score pour décider quoi développer
Un score n'est utile que s'il conduit à des actions cohérentes. Traitez votre score par segment comme un feu de circulation : les segments verts obtiennent plus de volume, les jaunes sont surveillés et testés prudemment, les rouges sont corrigés avant d'envoyer un autre lot.
Gardez des règles stables pour ne pas renégocier chaque semaine :
- 80 à 100 (développer) : augmentez le volume par petites étapes et gardez le ciblage et le copy principalement inchangés.
- 60 à 79 (surveiller) : maintenez le volume et lancez un test à faible risque (qualité de liste, adéquation du message, ou offre).
- En dessous de 60 (corriger) : arrêtez de développer, traitez la cause racine et ne reprenez que quand le score remonte.
Quand un segment est dans la bande « développer », évitez de doubler le volume du jour au lendemain. Augmentez progressivement (par exemple 10% à 20% par semaine) et revérifiez après chaque changement. Les pics soudains peuvent augmenter rebonds et plaintes, ce qui peut tirer vers le bas toutes vos boîtes.
Certains signaux doivent outrepasser le score et déclencher une pause immédiate :
- Une montée soudaine des hard bounces signifie souvent que la liste est périmée ou trop large.
- Une hausse du taux de plaintes est encore plus sérieuse et doit être traitée comme un frein d'urgence.
Utilisez le score pour choisir où tester. Les segments forts sont des zones sûres pour tester des idées plus audacieuses parce que vous avez une marge. Les segments faibles sont ceux où vous devez d'abord réduire le risque.
Exemple : scorer des segments pour choisir un gagnant à développer
Imaginez que vous exécutez de l'outbound pour un produit, mais que vous avez deux sources de liste (Apollo et participants à un événement), trois secteurs (SaaS, agences marketing, santé), et deux offres (un court teardown ou une étude de cas pertinente). Vous ne voulez pas tout développer. Vous voulez un ou deux gagnants clairs.
Après les 1 000 premiers envois pour chacun (même setup d'envoi, longueur de sujet similaire, même pool de boîtes), vous calculez le score par segment :
| Segment (source + industrie + offre) | Rebond | Plaintes | Réponses | Ce que ça signifie |
|---|---|---|---|---|
| Event + SaaS + Teardown | 1.2% | 0.02% | 3.8% | Candidat solide pour développer |
| Apollo + SaaS + Teardown | 2.8% | 0.04% | 2.4% | Liste propre, puis développer |
| Event + Agencies + Case study | 1.0% | 0.03% | 1.6% | Sûr, mais l'offre peut être faible |
| Apollo + Agencies + Teardown | 4.6% | 0.08% | 1.9% | Corriger les rebonds d'abord |
| Event + Healthcare + Case study | 1.4% | 0.06% | 0.9% | Délivrable, peu persuasif |
| Apollo + Healthcare + Teardown | 6.2% | 0.12% | 0.6% | Arrêter et reconstruire le segment |
Deux choses ressortent :
- La liste « event » est constamment plus saine (moins de rebonds et de plaintes).
- Le secteur santé ne répond pas bien à l'offre teardown, et la version Apollo est activement risquée.
Actions basées sur cela :
- Développer d'abord « Event + SaaS + Teardown » en ajoutant du volume progressivement, et gardez-le séparé pour ne pas masquer les problèmes ailleurs.
- Pour « Apollo + SaaS », nettoyez la liste avant d'ajouter du volume (retirez les titres à risque, validez les e-mails, resserrez les filtres entreprise), puis relancez un petit batch.
- Pour « Event + Healthcare », maintenez la délivrabilité mais changez l'offre et le message puisque le problème est le taux de réponses.
- Pour « Apollo + Healthcare », mettez en pause et corrigez le ciblage et l'hygiène de la liste avant de risquer la réputation d'expéditeur.
Erreurs courantes qui rendent le score inutile
Un score de segment n'aide que s'il reste cohérent et pointe vers une cause réelle. La plupart des échecs viennent du mélange de signaux différents, ou de la confiance dans des données trop faibles.
Façons courantes de rendre le score inutile :
- Ne regarder que le taux de réponse. Les réponses peuvent chuter pour l'offre, le timing ou le ciblage. Les problèmes de délivrabilité apparaissent souvent d'abord dans les rebonds et les plaintes.
- Mélanger des boîtes toutes neuves avec des boîtes chauffées. Les nouveaux expéditeurs se comportent différemment et ont besoin de volumes plus bas. Les moyenner ne sert à rien.
- Se fier à de petits échantillons. Définissez un volume minimum avant de scorer.
- Changer les pondérations chaque semaine. Si la formule bouge, vous ne pouvez pas comparer d'une semaine sur l'autre.
- Ignorer les domaines d'envoi ou les groupes de boîtes. La délivrabilité est souvent spécifique à un domaine. Un domaine mauvais peut tirer vers le bas une vue combinée et vous faire mettre en pause le mauvais segment.
Si un segment « s'améliore » seulement parce que vous avez reclassé des réponses ou changé des définitions, ce n'est pas de la délivrabilité. Gardez les définitions stables pour que le score reflète la santé d'expéditeur, pas des étiquettes mouvantes.
Vérifications rapides avant de développer un segment
Avant d'augmenter le volume, prenez cinq minutes pour une vérification de sanity. Un score peut sembler parfait sur le papier, mais un problème caché peut nuire au placement en boîte de réception quand vous scalez.
Parcourez ces signaux sur la même fenêtre d'analyse (par ex. les 7 derniers jours), puis comparez à la fenêtre précédente :
- Mix de types de rebond : si les rebonds sont surtout des hard bounces, développer ne fera qu'empirer le problème.
- Présence de plaintes : si des plaintes sont apparues dans la dernière fenêtre mais pas avant, considérez le segment instable.
- Tendance des réponses : stable c'est bien, en hausse c'est mieux. Si les réponses déclinent semaine après semaine, développer aggrave souvent la chute.
- Changements récents : nouvelles règles de segment, nouvelle source de liste ou nouveau copy peuvent réinitialiser la performance. Attendez suffisamment d'envois pour juger, ou revenez en arrière.
- Sauts de volume récents : si vous avez doublé les envois dans les dernières 48 heures, le score peut être en retard sur la réalité. Montez progressivement.
Exemple : votre segment « US agencies » a un bon score, mais le volume a augmenté après l'ajout d'une nouvelle source et les hard bounces ont monté. Même si le score semble sain, développer maintenant est risqué. Corrigez la qualité de la liste puis rescorez après une fenêtre propre.
Étapes suivantes : faites du score une routine hebdomadaire
Traitez votre score de délivrabilité comme un bilan de santé hebdomadaire. Choisissez un jour et une heure, révisez les mêmes segments chaque semaine, et effectuez un ou deux changements mesurables.
Protégez la qualité des listes en priorité. Si un segment montre plus de rebonds ou de plaintes, ne forcez pas le volume. Mettez en pause, retirez les invalides évidents (comptes de type role, motifs connus, exportations anciennes) et soyez prudent avec les sources non vérifiables.
Augmentez le volume graduellement. Faites-le par domaine et par boîte, pas seulement sur le total d'envois, pour éviter des pics de rebonds ou de plaintes.
Une routine hebdo simple :
- Recalculez le score pour chaque segment sur les 7 derniers jours (ou les 1 000 derniers envois).
- Arrêtez les envois vers tout segment qui dépasse vos lignes rouges de rebond ou de plainte.
- Resserrez le ciblage ou réécrivez l'offre pour les segments à faible réponse mais propres.
- Développez un seul segment gagnant par semaine et limitez l'augmentation.
- Consignez les changements (source de liste, copy, offre, volume) pour apprendre.
Si vous voulez que ce soit simple à maintenir, c'est utile d'avoir rebonds, plaintes et types de réponses visibles au même endroit. LeadTrain (leadtrain.app) est construit autour de ce workflow, combinant configuration d'envoi, warm-up, séquences et classification des réponses pour que vous puissiez revoir les segments rapidement et agir sans sauter entre plusieurs outils.
FAQ
Why is a segment-level deliverability score better than one overall score?
Un score par segment vous évite de prendre des décisions «moyennes». Au lieu d'un chiffre agrégé, vous voyez quelle tranche de votre outreach aide le placement en boîte de réception et laquelle ajoute silencieusement des rebonds ou des plaintes.
How do I pick segments that are actually actionable?
Commencez par des segments où une action claire peut améliorer les résultats, comme la source des leads, le type de domaine, le secteur, le niveau de seniorité ou l'angle de l'offre. Si vous ne pouvez pas dire ce que vous feriez après avoir vu le score, le segment n'est pas utile.
What’s the minimum volume I should have before trusting a segment score?
À titre pratique, attendez d'avoir au moins 300 e-mails délivrés dans un segment, ou 10 réponses au total si le taux de réponse fait partie de votre décision. Les échantillons plus petits varient trop avec une ou deux erreurs.
What exactly should count as bounce rate, complaint rate, and reply rate?
Utilisez seulement les hard bounces pour le taux de rebond, comptez les plaintes pour spam pour le taux de plainte, et mesurez le taux de réponse à partir des e-mails délivrés. Gardez ces définitions stables pour que les variations hebdomadaires reflètent la réalité.
What’s a simple scoring formula I can use right away?
Utilisez une formule simple de 0–100 qui punit les plaintes le plus fortement, pénalise les rebonds et accorde un bonus limité pour les réponses. L'important est la cohérence dans le temps, pas la perfection du nombre.
Should unsubscribes be part of the deliverability score?
Les désabonnements servent mieux de garde-fou que de composante du score. Surveillez le taux de désabonnement séparément et définissez un seuil maximal ; si un segment le dépasse, ne l'évoluez pas tant que vous n'avez pas resserré le ciblage ou le message.
How do I use the score to decide “scale, fix, or stop”?
Évoluez les segments propres et stables, corrigez ceux qui montrent un problème spécifique (souvent la qualité de la liste) et stoppez ceux qui produisent des plaintes ou des rebonds élevés. Traitez le score comme un feu tricolore, pas comme un rapport figé.
Can a segment be “good” on replies but still too risky to scale?
Oui. Un segment peut générer des réponses tout en étant risqué pour la réputation. Une règle pratique : auto-fail si le taux de plaintes dépasse 0,30%, même si les réponses semblent bonnes, car les plaintes abîment la réputation très vite.
How fast can I safely increase volume on a high-scoring segment?
Augmentez le volume progressivement (environ 10% à 20% par semaine) et vérifiez après chaque changement. Les hausses soudaines peuvent provoquer des rebonds et des plaintes qui détériorent la délivrabilité sur toutes vos boîtes.
What are the most common mistakes that make segment scoring useless?
Les erreurs les plus courantes sont : se fier à de petits échantillons, ne regarder que le taux de réponse, mélanger des boîtes neuves et des boîtes «warmed», changer les pondérations chaque semaine, et ignorer les différences par domaine ou groupe de boîtes. Ces pratiques rendent le score trompeur.