Оценка доставляемости холодных писем: решите, какие сегменты масштабировать
Постройте оценку доставляемости холодных писем на основе отказов, жалоб и ответов, чтобы быстро находить безопасные сегменты для масштабирования и приостанавливать рискованные.

Что решает оценка доставляемости на уровне сегмента
Доставляемость — это просто: достигают ли ваши письма места, где их может прочитать реальный человек? Лучшее — это папка «Входящие». Хуже — «Спам». Самое плохое — письмо вообще не доставлено из‑за неверного адреса, отклонения домена или блокировки.
Большинство команд вводит себя в заблуждение, глядя на одно число и игнорируя совокупность сигналов. Низкий процент отказов может выглядеть «здоровым», в то время как жалобы тихо растут и портят вашу репутацию отправителя. Высокий reply rate может казаться подтверждением, что нужно масштабироваться, даже если большая часть трафика попадает в спам и вас находят только самые мотивированные люди.
Оценка доставляемости полезна тем, что заставляет задать правильный вопрос: помогает ли эта часть рассылки попаданию во входящие или тихо тянет его вниз?
Отсутствующий элемент — сегментация. Результаты редко одинаковы по всему списку. Один фрагмент может быть чистым и отзывчивым, другой — полон старых данных или людей, которым не нравится ваш подход. Оценка должна считаться для тех сегментов, по которым вы реально можете принять решение, например:
- Источник списка (например, Apollo vs рекомендации)
- Тип домена получателя (корпоративные домены vs бесплатные почтовые провайдеры)
- Группа аудитории (основатели vs SDR)
- Регион (США vs ЕС)
- Угол предложения (запрос демо vs контент в первую очередь)
Как только вы оцениваете сегменты по отдельности, вы перестаёте принимать «средние» решения, которые вам вредят.
Эта оценка не для отчётов. Это инструмент принятия решений с тремя исходами: масштабировать, исправить или остановить.
- Масштабировать сегменты, которые доставляются, получают ответы и остаются чистыми.
- Исправить сегменты, которые могут работать, но имеют конкретную проблему (часто это качество списка).
- Остановить сегменты, которые вероятно повредят доставляемости, даже если иногда дают ответы.
Пример: ваш сегмент «основатели SaaS в США» стабильно получает ответы практически без жалоб, а сегмент «все по sales‑титулу» получает похожее количество ответов, но больше жалоб и отказов. Без сегментной оценки вы могли бы масштабировать оба. С оценкой вы масштабируете основателей и очищаете, переформулируете или приостанавливаете сегмент «sales».
Как определить сегменты, по которым можно действовать
Сегмент полезен только если одно понятное изменение улучшит его. Если вы не можете назвать действие, которое бы приняли на основе оценки, сегмент бесполезен.
Начните просто. Одно‑правильные сегменты легче понимать и исправлять. «Перспективы из Apollo» — прикладной сегмент: если он показывает плохой результат, вы можете ужесточить фильтры, проверить почты или сменить источник. Много‑правильные сегменты подходят, когда они отражают реальное go‑to‑market‑движение, но избегайте наложения правил только чтобы число выглядело лучше. Обычно это создаёт шум.
Хорошие типы разрезов — те, которые ведут к очевидным решениям, например:
- Источник лидов
- Отрасль
- Уровень должности
- Тип домена
- Угол предложения
Выберите 2–4 типа сегментов и держитесь их месяц. Если вы определите 20 сегментов, у вас не будет времени исправлять ни один.
Минимальный объём (чтобы не действовать по шуму)
Числам нужен объём, чтобы им доверять. Не оценивайте сегмент по крошечной выборке, где пара отказов или одна жалоба может изменить показатель.
Практический минимум перед принятием решения:
- По крайней мере 300 доставленных писем в сегменте
- Или по крайней мере 10 общих ответов, если reply rate важен для решения
Пересчитывайте по расписанию, соответствующему вашей скорости отправки. Еженедельно — надёжный дефолт: это сглаживает суточные колебания и всё ещё ловит проблемы рано. Ежедневный пересчёт имеет смысл только если вы много отправляете по сегменту и готовы останавливать или корректировать в течение 24 часов.
Одна важная деталь: определяйте сегменты по тому, кого вы таргетировали, а не по тому, как они ответили. Оценка должна помочь исправить таргетинг и здоровье отправки, а не просто гнаться за ответами прошлой недели.
Три входных метрики: отказы, жалобы, ответы
Сегментная оценка работает только если входные метрики просты, надёжны и связаны с тем, что вредит доставляемости. Три метрики решают большую часть задач: bounce rate, complaint rate и reply rate.
Bounce rate (сбой доставки)
Отказы показывают, достигаете ли вы реальных почтовых ящиков. Высокий процент отказов обычно не проблема копирайта. Он указывает на качество списка: плохая обогащённая база данных, старые контакты или рискованные домены.
Как эмпирическое правило для холодного исходящего:
- Ниже 2% обычно нормально.
- 2%–5% — сигнал предупреждения, что данные сегмента начинают портиться.
- Выше 5% — сигнал «стоп и исправить» перед масштабом.
Даже при появлении ответов отказы могут быстро повредить репутации отправителя, особенно если сегмент большой.
Complaint rate (жалобы «спам»)
Жалоб немного, но последствия серьёзны. Одна кнопка «Пожаловаться как спам» может навредить больше, чем игнорирование десяти писем.
Для большинства команд цель проста: держать жалобы близко к нулю. Если сегмент даёт повторяющиеся жалобы, считайте это красным флагом, даже если другие метрики в порядке.
Reply rate (доставляемость плюс релевантность)
Ответы — полезный комбинированный сигнал. Вы получаете ответы только если письма доходят и сообщение подходит аудитории.
Но читайте reply rate внимательно. Сегмент с 6% ответов, состоящих в основном из «не заинтересован», может быть доставляем, но неправильно подобран. Если можете отделять реальные ответы от автоответов (например, «вне офиса»), делайте это. Иначе reply rate раздувается и становится некорректно сравнимым.
Где расположены отписки
Отписки лучше использовать как ограничитель, а не включать в оценку. Отслеживайте unsubscribe rate отдельно и установите жёсткий порог. Если он нарушен, не масштабируйте сегмент, пока не подправите таргетинг и сообщение.
Простая модель оценки, которую можно объяснить за минуту
Сегментная оценка должна быть скучной: одно число от 0 до 100, которое остаётся сопоставимым во времени. Если формула постоянно меняется, вы будете гнаться не за исправлением проблемы, а за показателями.
Эта модель расставляет приоритеты: жалобы получают самый большой штраф, отказы — существенный штраф, ответы дают ограниченный бонус.
Оценка (0–100)
Используйте доли (так 2% = 0.02):
score = 100
- 800 * bounce_rate
- 2000 * complaint_rate
+ 100 * reply_rate
Clamp score to 0-100.
Почему такие веса?
- Жалобы редки, но серьёзны, поэтому штраф большой.
- Отказы важны, потому что они быстро портят репутацию и часто лечатся очисткой списка.
- Ответы — положительны, но не должны «покупать» ваше избавление от риска жалоб.
Перед расчётом держите определения стабильными:
- Bounce rate: только hard bounces (невалидный почтовый ящик), не soft bounces
- Complaint rate: жалобы «спам», не отписки
- Reply rate: ответы от доставленных писем, желательно без автоответов типа «вне офиса»
Защитные правила и защита от маленьких выборок
Даже приличная оценка может скрывать проблему при малом объёме. Добавьте несколько правил, чтобы не масштабировать по шуму:
- Авто‑фейл: если complaint rate \u003e 0.30%, выставьте score = 0 и приостановите сегмент
- Ограничение по отказам: если bounce rate \u003e 5%, ограничьте score до 30, пока не почините список
- Минимальный объём: оценивать только сегменты с минимум 200 доставленных писем за окно
- Лимит бонуса за ответы: ограничьте плюсы от reply rate до +15 очков, чтобы один разговорчивый сегмент не маскировал риск
Пример: жалобы 0.10% (0.001), отказы 1.5% (0.015), ответы 6% (0.06).
Score = 100 - 800(0.015) - 2000(0.001) + 100(0.06) = 100 - 12 - 2 + 6 = 92.
Если жалобы вырастут до 0.4% (0.004), сегмент автоматически провалится независимо от ответов.
Пошагово: как посчитать оценку для каждого сегмента
Выберите одно окно времени и придерживайтесь его. Для большинства команд последние 7 дней быстро ловят проблемы, 14 дней сглаживает шум. Что бы вы ни выбрали, держите постоянство, чтобы оценка была сопоставима неделя к неделе.
Для каждого сегмента вытяните сырые счёты за выбранный период:
- Отправлено
- Доставлено (отправлено минус hard bounces)
- Hard bounces
- Жалобы «спам»
- Человеческие ответы
- Отписки (отслеживать отдельно)
Затем вычислите ставки:
- Bounce rate = hard bounces / sent
- Complaint rate = spam complaints / delivered
- Reply rate = human replies / delivered
По ответам: исключайте автоответы типа «вне офиса», если можете. Они раздут reply rate, но не означают, что сообщение приветствуется.
Примените формулу и присвойте сегменту простой следующий шаг:
- Scale: score 80–100 и стабильный или улучшающийся
- Watch: score 60–79 или плоская динамика
- Fix: score 40–59 или снижение неделя к неделе
- Stop: score ниже 40, или любой необъяснимый всплеск жалоб
Не рассматривайте последнее число как полную картину. Отслеживайте тренд сегмента (наша неделя, прошлый и две недели назад). Сегмент с 72 и растущий часто безопаснее для масштабирования, чем тот, что на 82, но быстро падает.
Как использовать оценку для решения о масштабировании
Оценка полезна только если ведёт к последовательным действиям. Рассматривайте оценку как светофор: зелёные сегменты получают больше объёма, жёлтые — наблюдаются и тестируются осторожно, красные — исправляются прежде чем посылать следующую партию.
Держите правила стабильными, чтобы не пересматривать их каждую неделю:
- 80–100 (масштаб): увеличивайте объём малыми шагами и сохраняйте таргетинг и копию по большей части теми же.
- 60–79 (наблюдать): удерживайте объём и проведите один низкорискованный тест (качество списка, соответствие сообщения или оффера).
- Ниже 60 (исправлять): не масштабируйте, устраните корень проблемы и возобновляйте только при росте оценки.
Когда сегмент в зоне масштабирования, избегайте удвоения объёма в одну ночь. Увеличивайте постепенно (например, 10%–20% в неделю) и проверяйте после каждого изменения. Внезапные всплески могут поднять отказы и жалобы и ухудшить доставляемость по всем вашим почтовым ящикам.
Некоторые сигналы должны переопределять оценку и вызывать немедленную паузу:
- Внезапный рост hard bounces обычно означает, что список устарел или стал слишком широким.
- Рост complaint rate — ещё серьёзнее и должен действовать как аварийный тормоз.
Используйте оценку, чтобы выбирать безопасные места для экспериментов. Сильные сегменты — где можно тестировать смелее, потому что у вас есть подушка. Слабые сегменты — где сначала нужно снизить риск.
Пример: как оценивать сегменты и выбрать победителя для масштабирования
Представьте, что вы делаете исходящие для одного продукта, у вас два источника списков (Apollo и участники события), три отрасли (SaaS, маркетинговые агентства, здравоохранение) и два оффера (короткий разбор или релевантный кейс). Вы не хотите масштабировать всё. Вам нужен один–два явных победителя.
После первых 1000 отправок по каждому (одинаковая настройка отправки, похожая длина темы, тот же пул почтовых ящиков) вы вычисляете оценку по сегментам:
| Сегмент (источник + отрасль + оффер) | Отказы | Жалобы | Ответы | Что это значит |
|---|---|---|---|---|
| Участники события + SaaS + Разбор | 1.2% | 0.02% | 3.8% | Сильный кандидат для масштабирования |
| Apollo + SaaS + Разбор | 2.8% | 0.04% | 2.4% | Чистый список — затем масштабировать |
| Участники события + Агентства + Кейс | 1.0% | 0.03% | 1.6% | Безопасно, но оффер слабый |
| Apollo + Агентства + Разбор | 4.6% | 0.08% | 1.9% | Сначала исправьте отказы |
| Участники события + Здравоохранение + Кейс | 1.4% | 0.06% | 0.9% | Доставляется, но не убеждает |
| Apollo + Здравоохранение + Разбор | 6.2% | 0.12% | 0.6% | Остановить и восстановить сегмент |
Две вещи заметны:
- Список «участников события» стабильно здоровее (ниже отказы и жалобы).
- Здравоохранение не откликается на оффер «разбор», а версия из Apollo активно рискована.
Действия на основе этого:
- Сначала масштабируйте «Участники события + SaaS + Разбор», добавляя объём постепенно и держая его отдельно, чтобы он не скрывал проблемы в других местах.
- Для «Apollo + SaaS» почистите список перед увеличением объёма (удалите рискованные должности, валидируйте почты, сузьте фильтры по компаниям), затем запустите небольшую контрольную партию.
- Для «Участники события + Здравоохранение» держите доставляемость, но поменяйте оффер и сообщение — проблема в откликах.
- Для «Apollo + Здравоохранение» приостановите и исправьте таргетинг и гигиену списка, чтобы не сжечь репутацию отправителя.
Типичные ошибки, которые делают оценку бесполезной
Сегментная оценка полезна только если она стабильна и указывает на реальную причину. Большинство провалов происходит от смешения сигналов, которые означают разные вещи, или доверия слишком тонким данным.
Частые ошибки команд:
- Считать reply rate единственным сигналом. Ответы могут падать из‑за оффера, времени или таргетинга. Проблемы с доставляемостью часто проявляются сначала в отказах и жалобах.
- Смешивать совсем новые почтовые ящики с прогретыми. Новые отправители ведут себя иначе и обычно требуют меньших объёмов. Если их усреднять, оценка ничего не объясняет.
- Доверять крошечным выборкам. Установите минимум объёма перед оценкой. Иначе одна жалоба приведёт к случайным решениям.
- Менять веса формулы каждую неделю. Если формула меняется, нельзя сравнивать недели.
- Игнорировать домены отправки или группы почтовых ящиков. Доставляемость часто специфична для домена. Один плохой домен может испортить объединённый вид и заставить вас приостанавливать неверный сегмент.
Если сегмент «улучшается» только потому, что вы переклассифицировали ответы или поменяли определения, это не доставляемость. Держите определения стабильными, чтобы оценка отражала здоровье отправителя, а не смену меток.
Быстрые проверки перед масштабированием сегмента
Перед увеличением объёма потратьте пять минут на быструю проверку сегмента. Оценка может выглядеть отлично на бумаге, но одна скрытая проблема может испортить попадание во входящие при масштабировании.
Просмотрите эти сигналы за то же окно оценки (например, последние 7 дней) и сравните с предыдущим окном:
- Состав отказов: если отказы в основном hard (несуществующий адрес, домен не найден), масштабирование только усугубит проблему.
- Наличие любых жалоб: если жалобы появились только в последнем окне, относитесь к сегменту как к нестабильному и подождите.
- Тренд ответов: стабильность хороша, рост лучше. Если ответы снижаются неделя к неделе, масштабирование часто усугубит падение.
- Последние изменения: новые правила сегмента, новый источник списка или новый текст могут сбросить показатели. Подождите достаточное количество отправок, чтобы судить, или откатитесь.
- Внезапные изменения объёма: если вы удвоили отправки за последние 48 часов, оценка может не успевать за реальностью. Рампьте постепенно.
Пример: ваш сегмент «US agencies» показывает хорошую оценку, но объём вырос после добавления нового источника и hard bounces подскочили. Даже если оценка всё ещё выглядит здоровой, масштабировать сейчас рискованно. Сначала почините качество списка, затем пересчитайте.
Следующие шаги: включите оценку в еженедельную рутину
Относитесь к оценке доставляемости как к еженедельной проверке здоровья. Выберите день и время, пересматривайте одни и те же сегменты каждую неделю и делайте одно‑два изменения, которые можно отследить.
Защищайте качество списка в первую очередь. Если сегмент показывает рост отказов или жалоб, не пробивайте его увеличением объёма. Приостановите, удалите очевидные невалидные адреса (роль‑аккаунты, плохие шаблоны, старые экспорты) и осторожно относитесь к источникам, которые нельзя проверить.
Держите изменения объёма постепенными. Рампьте по доменам и по почтовым ящикам, а не только по общему числу отправок, чтобы не вызвать скачок отказов или жалоб.
Простая еженедельная рутина:
- Пересчитывайте оценку для каждого сегмента по последним 7 дням (или по последним 1 000 отправкам).
- Останавливайте отправки в сегенты, которые перешли ваши красные линии по отказам или жалобам.
- Сужайте таргетинг или переписывайте оффер для сегментов с низким reply rate, которые в остальном чисты.
- Масштабируйте лишь один победивший сегмент в неделю и ограничивайте увеличение.
- Логируйте изменения (источник списка, копия, оффер, объём), чтобы учиться.
Если хотите упростить поддержку, полезно, когда отказы, жалобы и виды ответов видны в одном месте. LeadTrain (leadtrain.app) построен вокруг такого рабочего процесса, сочетая настройку отправки, прогрев, последовательности и классификацию ответов, чтобы вы могли быстро просматривать сегменты и действовать, не переходя между инструментами.
Часто задаваемые вопросы
Why is a segment-level deliverability score better than one overall score?
Сегментный показатель предотвращает принятие «средних» решений. Вместо одного усреднённого числа вы видите, какая конкретная часть рассылки помогает попадать в почтовые ящики, а какая тихо добавляет отказы или жалобы.
How do I pick segments that are actually actionable?
Начинайте с тех сегментов, где одно понятное действие может улучшить результат: источник лидов, тип домена, отрасль, уровень должности или угол предложения. Если вы не можете назвать, что бы поменяли после просмотра оценки, сегмент бесполезен.
What’s the minimum volume I should have before trusting a segment score?
Практическая отправная точка — дождаться минимум 300 доставленных писем в сегменте или 10 общих ответов, если ответы важны для решения. Меньшие выборки слишком чувствительны к единичным событиям.
What exactly should count as bounce rate, complaint rate, and reply rate?
Используйте для расчётов только hard bounces как показатель отказов, учитывайте только жалобы «спам» для complaint rate и меряйте reply rate от доставленных писем. Держите определения стабильными, чтобы изменения неделей к неделе отражали реальность, а не смену меток.
What’s a simple scoring formula I can use right away?
Простая формула от 0 до 100, которая сильнее штрафует жалобы, заметно штрафует отказы и даёт ограниченный бонус за ответы — хороший старт. Главное — стабильность, чтобы принимать последовательные решения со временем.
Should unsubscribes be part of the deliverability score?
Отписки лучше держать отдельно как ограничитель. Отслеживайте unsubscribe rate и установите жёсткий предел; если сегмент его превышает, не масштабируйте, пока не уточните таргетинг или сообщение.
How do I use the score to decide “scale, fix, or stop”?
Масштабируйте сегменты, которые чистые и стабильные; исправляйте те, где выявлена конкретная проблема (обычно качество списка или таргетинг); останавливайте те, что постоянно дают жалобы или много отказов. Рассматривайте оценку как светофор, а не отчёт.
Can a segment be “good” on replies but still too risky to scale?
Да. Практическое правило — авто‑фейл, если complaint rate превышает 0.30%, даже если ответы выглядят хорошо, потому что жалобы быстро вредят репутации.
How fast can I safely increase volume on a high-scoring segment?
Увеличивайте объёмы небольшими шагами (примерно 10%–20% в неделю) и проверяйте после каждого изменения. Внезапные скачки часто повышают отказы и жалобы и снижают общую доставляемость.
What are the most common mistakes that make segment scoring useless?
Чаще всего ошибки — это доверие к маленьким выборкам, опора только на reply rate, смешение новых и прогретых почтовых ящиков, еженедельная смена весов формулы и игнорирование различий по доменам или группам почтовых ящиков. Любая из этих ошибок делает оценку вводящей в заблуждение.