Все

Какие сложности мы преодолели при внедрении RFM-сегментации клиентов в Авито Недвижимости

Статьи analytics
Привет! На связи команда аналитиков продаж Авито Недвижимости. Сегментация клиентов — владельцев недвижимости, которые размещают объявления — одна из наших главных задач.
В статье делимся опытом выбора метода сегментации: расскажем, какие подходы мы рассматривали и почему остановились на RFM-анализе. Ещё покажем результаты применения сегментации и расскажем о сложностях, с которыми столкнулись при её внедрении. Эта информация поможет вам эффективно сегментировать клиентов и избежать возможных препятствий в процессе.
Наши личные профили в LinkedIn, там можно задать любые вопросы и просто поболтать:

Начнём с результатов

Мы попросили коллег поделиться мнением о том, что им дала наша сегментация клиентской базы. Вот что они рассказали:
Сегментация стала занимать 15 минут вместо полутора часов

Евгений Нуруллин, руководитель команды менеджеров продаж в Авито Недвижимости:

«Я применяю RFM-анализ для сегментации клиентской базы. А потом, на основе этих данных, строю предиктивные кампании для прозвона клиентов через внешний и внутренний кол-центры.

Раньше этот процесс занимал около полутора часов и требовал ручного объединения нескольких таблиц из разных отчётов. Теперь благодаря автоматизации он занимает 15 минут. В будущем хотелось бы использовать этот инструмент для всех сегментов пользователей».

RFM-сегментация помогла вырастить конверсию в открытие коммуникаций

Алёна Токарева, координатор по автоматизации в Авито Путешествиях:

«Я работаю с клиентской базой из ста тысяч человек. И мне нужен был способ, который поможет эффективно взаимодействовать с таким количеством клиентов. С помощью RFM-сегментации мы:

Увеличили открытие рассылок на 15 п.п. за счёт точной кластеризации базы.

Начали быстрее реагировать на отток клиентов, что подняло открытие пушей на 14 п.п.

Построили простую и эффективную схему коммуникаций для малых клиентов.

Это изменило подход к CRM в Авито Путешествиях».
Дальше расскажем, как внедряли новую модель сегментации, а в конце дадим ссылку на гайд, который поможет провести подобную практику в вашей компании и добиться аналогичных результатов.

Зачем сегментировать клиентов

Выделим две причины:
Узнавать об особенностях и поведении клиентов, чтобы выстраивать персонализированную коммуникацию. Например, новым пользователям Авито мы отправляем приветственные и обучающие материалы, чтобы помочь быстро освоить сервис.
А с теми, чья активность начала снижаться, используем инструменты удержания. Например, можем отправить частным продавцам недвижимости письмо с предложениями о скидках.
Грамотно использовать ресурсы менеджеров. Более крупным корпоративным клиентам целесообразно позвонить, а частным пользователям — отправить письмо. Благодаря сегментации менеджеры могут выбирать, какие инструменты использовать с конкретными пользователями и эффективно распределять свои ресурсы.
Всё это было бы невозможно без аналитики

Ключевая цель аналитики продаж Авито — лучше понимать потребности клиентов, выявлять возможности для роста и улучшать общую производительность бизнеса.

Если вам интересно работать над похожими задачами — будем рады стать будущими коллегами!

Посмотреть вакансии в командах аналитики Авито

Какие инструменты сегментации клиентов существуют, и почему мы выбрали RFM-анализ

Расскажем про 3 популярных метода: машинное обучение (ML), ABC- и RFM-анализ. У каждого из них есть свои особенности и области применения.
Машинное обучение (ML) — метод, в котором используются алгоритмы для автоматического разделения клиентов на группы с учётом разных признаков. ML может выявлять сложные паттерны в поведении и предпочтениях пользователей.
Почему нет? Он требует значительных ресурсов для сбора данных и настройки моделей, а также может быть сложным в реализации.
ABC-анализ — простой и быстрый метод, который разделяет клиентов на три категории по прибыли: A, B и C. Группа A включает самых ценных клиентов, которые приносят наибольшую прибыль. Группа B — средние по прибыли клиенты, а группа C — с наименьшей прибыльностью.
Почему нет? Этот метод не подошёл, потому что он основывается на денежной ценности клиентов, но не учитывает другие важные аспекты. Например, частоту и давность совершения покупок на площадке.
RFM-анализ позволяет глубже понять поведение клиентов. В отличие от ABC-анализа он помогает рассматривать не только сумму покупок, но и их частоту и давность.
Почему да? Мы выбрали RFM, потому что он даёт более полное представление о клиентах и не требует сложных технологий или больших объёмов данных, как, например, ML.
С его помощью мы можем сегментировать клиентов и выбирать подходящую модель коммуникации.

Что такое RFM-анализ, и как определять сегменты пользователей с помощью баллов

Название RFM происходит от трёх английских слов:
Recency (давность): показывает, сколько времени прошло с момента последней активности клиента. Чем меньше этот промежуток, тем выше вероятность, что клиент повторит действие.
Frequency (частота): измеряет, как часто клиент взаимодействует с сервисом. Чем больше действий он совершил, тем выше вероятность, что он продолжит делать это в будущем.
Monetary (денежная ценность): отражает сумму средств, которые клиент потратил. Больше вложил — выше вероятность повторного заказа.
Клиентам присваиваются баллы для объединения в сегменты. По каждому критерию пользователь получает балл — 1, 2 или 3. Для этого мы смотрим данные о клиентах и делим их на равные части, используя квантильный метод. Общее количество баллов может варьироваться. Для наших задач было достаточно трёхбалльной системы.
Эти баллы не складываются между собой. Вместо этого каждому клиенту присваивается трёхзначный код, например, «2-1-3», где первая цифра — оценка по давности покупки (Recency), вторая — по частоте (Frequency), а третья — по сумме покупок (Monetary). Если система оценки трёхбалльная, как у нас, то получится 27 комбинаций или 27 сегментов пользователей.
Пример матрицы RFM-анализа:
Пример матрицы с сегментами. Мы взяли трёхбалльную систему и получили 27 комбинаций 
Пример матрицы с сегментами. Мы взяли трёхбалльную систему и получили 27 комбинаций.
Бизнесу было важно учитывать простые характеристики, например, размер клиента, опыт использования платформы, количество объявлений. А ещё — отслеживать показатели в динамике и рассмотреть дополнительные критерии сегментации.
Важно понимать, что мы не можем неограниченно увеличивать количество рассматриваемых характеристик. Вот несколько причин:
Если потребуется изменить несколько характеристик, менеджерам придётся заново обрабатывать огромное количество комбинаций и определять, какие коммуникации использовать.
Для каждого сегмента потребуется указать конкретную стратегию коммуникации, что сложно реализовать на практике. Например, если учитывать 6 характеристик с тремя баллами для каждой, мы получим почти тысячу комбинаций: 36=729.
Поэтому мы решили сфокусироваться на четырёх основных параметрах. Это позволило ограничиться разумным числом комбинаций, при котором мы можем обработать каждую группу и разработать стратегии взаимодействия.
Перед началом работы мы изучили существующие исследования и материалы про RFM-сегментацию, чтобы оценить, чего удалось достичь другим компаниям.

Например, наши коллеги из категории Авто успешно применили этот инструмент для создания персонализированных коммуникаций, что привлекло в 1,5 раза больше целевых покупателей.

Статья: «Как с помощью доработки RFM сделать CRM-рассылки эффективнее»

А компания «Техносила», используя RFM-сегментацию, смогла вырастить количество повторных заказов в 4,5 раза. Такие результаты убедили нас в правильности выбранного подхода.

Статья на VC: «Кейс „Техносилы“: рост повторных заказов в 4,5 раза»

Как устроена клиентская база в Авито Недвижимости

Понимание структуры клиентской базы поможет увидеть, как принципы RFM-сегментации адаптируются под разные категории и размеры клиентов. Это даст возможность лучше понять последующие части статьи и адаптировать представленные идеи.
Все клиенты Авито Недвижимости делятся на 4 категории:
  • Новостройки: сюда входят компании-застройщики, которые размещают объявления о новых объектах недвижимости.
  • Жилая недвижимость: клиенты распределены по нескольким направлениям — вторичная и загородная недвижимость, долгосрочная аренда. Для каждого работает отдельная команда менеджеров в зависимости от региона.
  • Коммерческая недвижимость: это юридические лица, компании и иногда физлица, которые занимаются коммерческой недвижимостью.
  • Путешествия: в этой категории представлены объекты для краткосрочной аренды и отели, ориентированные на путешественников и туристов.
Категории клиентов по типу объектов
Категории клиентов по типу объектов.
Также мы делим клиентов по размеру: крупные, средние и малые. Сегментируем их по расходам на услуги продвижения и количеству объявлений. Со всеми типами сегментов мы используем разные виды коммуникаций:
  • Крупным клиентам предоставляем персонального менеджера, что помогает учитывать их индивидуальные потребности. Эти пользователи активнее всего размещают объявления.
  • Средние клиенты получают поддержку от менеджеров контактного центра, которые готовы ответить на вопросы и помочь эффективно использовать наши сервисы.
  • С малыми клиентами взаимодействуем через автоматизированные методы коммуникации. Например, чат-боты, пуш-уведомления и рассылки. Так мы можем быстро предоставлять им необходимую информацию и поддержку.
Под каждый сегмент подбираем подходящий тип коммуникации
Под каждый сегмент подбираем подходящий тип коммуникации.
Разделяем их по регионам, чтобы учитывать специфику и оптимизировать стратегию работы. Это позволяет отслеживать динамику клиентской базы в разных регионах и вовремя адаптировать подходы, а также назначать команды менеджеров, отвечающих за локальные особенности.
Например, крупные клиенты Москвы и Санкт-Петербурга сильно отличаются от крупных клиентов в других регионах, поэтому сегментация помогает менеджерам сосредоточиться на ключевых клиентах своего региона и выстраивать персонализированный подход.
Мы решили создать отдельные сегментации для каждой категории Путешествия, Жилая недвижимость и других, — а также размера клиента и региона. Потому что учесть все нюансы в одной и той же сегментации оказалось затруднительным.
Первым делом внедряли новые виды сегментации в две категории: Крупные клиенты из Жилой Недвижимости и малые клиенты из Путешествий.
Выбрали их по нескольким причинам:
Хотели отобрать для сегментации две категории, где есть и малые, и крупные клиенты.
А ещё нам было важно, чтобы в выбранных категориях было достаточно клиентов для проведения статистически значимого анализа и измерения эффективности. Это позволяет получить надёжные данные и сделать обоснованные выводы о поведении различных сегментов клиентов.
После успешной реализации методологии в этих категориях мы планируем адаптировать её и внедрить в других.
Расскажем, как выбирали критерии для каждого из сегментов.

Как выбирали метрики для сегментации продавцов жилой недвижимости

В сегменте крупных клиентов Жилой Недвижимости важны следующие показатели:
Платёжный потенциал — объём выручки с клиента за отчётный период и динамика его изменений месяц к месяцу.
Объём реализуемого контента — доля рынка, которую клиент охватывает в текущий момент, и все изменения со временем.
Исходя из показателей выше, для этой категории мы рассмотрели более двадцати метрик, разделённых на три группы:
Метрики, которые мы рассматривали для сегментации
Из двадцати метрик нам нужно было оставить 3–4 ключевых. Вот как мы это сделали.
1. Проанализировали корреляции с помощью матрицы и убрали метрики, которые дублировали информацию. Мы использовали корреляционный анализ, так как он показывает силу связи между переменными. Это позволило исключить избыточность и упростить анализ.
Абсолютная корреляция между метриками жилой недвижимости:
Абсолютная корреляция между метриками жилой недвижимости
Когда анализировали корреляционную матрицу, заметили, что у метрик, связанных с активностью клиента, есть высокая корреляция. Например, у показателей «Количество активных объявлений» и «Количество новых объявлений» коэффициент корреляции составил 0,91. Если бы мы оставили обе, это не дало бы дополнительной информации о поведении клиентов. Поэтому решили оставить только одну.
2. Оценили практическую применимость. Некоторые метрики требовали дополнительных данных или сложного расчёта. Мы исключили такие показатели, если они не добавляли достаточной ценности к сегментации или требовали слишком больших усилий для сбора данных.
Например, цена объявления перед его закрытием могла резко меняться. Это искажало реальную стоимость и делало метрику ненадёжной.
3. Сделали финальный выбор метрик. В итоге остановились на четырёх ключевых показателях — они дали полное и точное представление о клиентах и их активности:
  • выручка с клиента за прошлый месяц;
  • количество активных объявлений за прошлый месяц;
  • динамика выручки с клиента от месяца к месяцу;
  • динамика количества активных объявлений от месяца к месяцу.
Использовать дополнительные методы, например, анализ коэффициента ковариации, не потребовалось, так как выбранных метрик было достаточно. Если вас интересует применение анализа ковариации, вы можете найти подробное описание в следующем разделе.

Как выбирали метрики для сегментации арендодателей в Авито Путешествиях

После проработки с менеджерами мы выяснили, что для работы с малыми клиентами в этой категории важно учесть следующие аспекты:
Активность арендодателей — отражает наличие активных объявлений в категории Авито Путешествия в прошедшем периоде. Этот показатель помогает находить клиентов, чья активность снижается, и предлагать подходящие предложения и инструменты, которые повысят эффективность объявлений.
Доля забронированных ночей в ближайший месяц — показывает, насколько востребованы объекты недвижимости владельца в ближайший месяц. Эта метрика позволяет нам находить клиентов с малым количеством бронирований и своевременно предлагать услуги продвижения, а также дополнительную поддержку.
Исходя из этих аспектов мы выделили следующие потенциальные метрики для RFM-сегментации и для удобства разделили их на три категории:
Потенциальные метрики для клиентов в Авито Путешествиях
Выше в статье мы объяснили, почему нельзя неограниченно увеличивать количество метрик, поэтому для сегментации надо было выбрать четыре-пять штук. Вот как мы это сделали.
1. Построили корреляционную матрицу, чтобы выбрать метрики. Анализ показал, что некоторые метрики, например, количество новых объявлений и количество активных объявлений, тесно связаны друг с другом, их корреляция — 0,91. И они фактически дублируют информацию. Такая же ситуация была и с метриками, связанными с расходами на продвижение.
Мы оставили только те метрики, которые не были связаны друг с другом и показывали уникальные особенности поведения клиента, чтобы избежать лишних пересечений.
2. Проанализировали вариации. Вариация показывает, насколько сильно значения метрики различаются среди всех клиентов. Метрики с высокой вариативностью демонстрируют большие различия между клиентами, что делает эти показатели полезными для сегментации, так как они помогают выявить разное поведение. Метрики с низкой вариацией, наоборот, могут быть не такими полезными, потому что не дают дополнительной информации для разделения на сегменты.
Коэффициент вариации (CV) — это основной показатель для оценки вариативности метрики. Он показывает, насколько сильно метрика варьируется относительно среднего значения, и вычисляется по формуле:
CV=σ/μ​× 100%
где:
σ — стандартное отклонение метрики;
μ — среднее значение метрики.
Наиболее изменчивой метрикой оказалась — «Динамика среднего чека бронирования». Но некоторые пользователи находились в стагнации и имели нулевые значения среднего чека в двух периодах. Разброс значений сильно ограничивает нас в подборе коммуникации, поэтому мы решили не использовать этот показатель.
Выделили топ-5 вариативных метрик:
Выделили топ-5 вариативных метрик
Метрики, связанные с динамикой, изменялись нечасто, за исключением «Динамики выручки». Она показала высокую изменчивость и соответствовала категории Money (Денежная ценность) в RFM-сегментации.
Из топ-5 вариативных метрик мы выбрали две: «Динамику выручки» и «Выручку за текущий период».
Важно отметить, что сравнивать вариацию разных типов метрик — некорректно
Например, нет смысла сравнивать булевые показатели: «да» или «нет». Непрерывные — выручку, и дискретные — количество сделок.
Так, вместо использования булевой метрики: «Наличие трат у клиента», мы решили взять более информативную непрерывную метрику — «Выручка за текущий период». Она предоставляет детализированные данные о расходах пользователей.
3. Сделали финальный выбор. После анализа и обсуждения с бизнесом мы выбрали такие метрики для сегментации в Авито Путешествиях:
  • Активность: показывает, как часто арендодатель размещает и обновляет объявления. Метрика помогает оценить общую вовлечённость пользователя.
  • Доля забронированных ночей в ближайший месяц: отражает, насколько востребованы объекты недвижимости владельца в предстоящий период. Это позволяет понять уровень загрузки и интерес к его предложениям.
  • Выручка за текущий период: показывает, сколько дохода принёс арендодатель за последний период. Ключевой показатель для понимания ценности клиента на платформе.
  • Динамика выручки: указывает на изменения доходов со временем. Эта метрика помогает определить, растёт или падает выручка арендодателя, что может быть полезным для прогнозирования поведения.

Как технически реализована RFM-сегментация

RFM сегменты пользователей рассчитываются ежедневно. Мы использовали комбинацию Python-кода и SQL-запросов, настроили регулярную автоматическую выгрузку данных из Vertica.
Полученные данные обрабатываются Python-скриптами, которые считают RFM метрики и реализуют логику сегментации. Итоговые результаты отображаются в Redash-отчётах.
Благодаря этому менеджеры получают оперативную и актуальную информацию о сегментах клиентов. Это позволяет быстрее принимать решения и выстраивать стратегию коммуникации.
Для оценки эффективности внедрения RFM-сегментации и проверки гипотез мы используем A/B-тесты. Это помогает измерить, насколько новый подход улучшает ключевые показатели.
Общий подход к A/B-тестам у нас выглядит так:
  • формируем скрипт — запрос к БД;
  • создаём коннектор и флоу обработки метрик с помощью Jupyter;
  • грузим данные в DWH и Redash;
  • формируем группы для А/B-теста, чтобы оценить эффект.
Общая схема A/B-теста:
Общая схема A/B-теста

Какие результаты мы получили

У нас была гипотеза, что новая сегментация приведёт к увеличению выручки благодаря персонализированным коммуникациям.
Мы решили проверить это на A/B-тестах. Отправляли пользователям тестовой группы цепочку коммуникаций, которая соответствовала актуальному RFM-сегменту. А пользователям из сегмента оттока, которые перестали размещать объявления, мы звонили через колбота и отправляли пуш. Пользователи из контрольной группы получали базовую общую рассылку, которая не зависела от RFM-сегмента.
Результаты после A/B-тестов

Жилая Недвижимость:

Использование сегментации позволило перевыполнить месячный план по выручке менеджеров по привлечению клиентов на 1 миллион рублей.

Авито Путешествия:

Конверсия из отправки коммуникации в открытие выросла на 15 п.п для пользователей тестовой группы по сравнению с контрольной.

Звонок колботом пользователям в оттоке позволил повысить конверсию в открытие пуш-уведомления на 14 п.п.

Конверсия в отписку от рассылок статистически значимо не изменилась.

Планы для других сегментов пользователей

Мы продолжаем улучшать сегментацию пользователей Авито.
Для крупных клиентов. На первом этапе мы планируем сегментировать только половину клиентской базы, чтобы сравнить результаты по финансовым метрикам. Уже сейчас менеджеры по продажам в Жилой Недвижимости и Авито Путешествиях фиксируют, что они сократили время проработки базы на 2–3 часа в неделю.
Мы продолжаем работать с сегментами, закрепляя самых перспективных клиентов за наиболее эффективными менеджерами. В будущем планируем увеличить число сегментов, чтобы обеспечить более персональный подход к каждому клиенту. Для этого будем использовать данные текущего RFM-анализа и обучим ML-модели с дополнительными показателями.
Это поможет нам справиться со множеством комбинаций метрик, которые сейчас трудно обрабатывать вручную.
Для малых клиентов. После проведения A/B-теста мы решим, стоит ли применять триггерную систему рассылок для всех малых клиентов в категории Авито Путешествий. Если результаты покажут положительное влияние на взаимодействие с клиентами, мы расширим использование этой системы.
Мы будем улучшать сегментацию по мере поступления данных, уточнять метрики и адаптировать методы работы, чтобы соответствовать изменениям продукта и требованиям рынка краткосрочной аренды.
Далее делимся чек-листом, в котором собрали все основные шаги внедрения RFM-сегментации, описанные в статье. Следуя этим шагам, вы сможете настроить сегментацию и использовать её для улучшения работы с клиентами.

Гайд, который поможет внедрить RFM-сегментацию в ваш продукт

Собрали в одном гайде всё, что нужно для успешного внедрения RFM-сегментации — от первых шагов до практических советов. Это краткое руководство с ключевыми мыслями из статьи, а также деталями по выбору метрик:
  • Чек-лист шагов внедрения: от подготовки данных до настройки коммуникаций.
  • Методы анализа метрик: как использовать корреляцию и вариацию, чтобы оставить только самые информативные метрики.
  • Как реализовать RFM-сегментацию с технической точки зрения.
Он поможет шаг за шагом внедрить RFM-сегментацию и вывести работу с клиентами на новый уровень. Забирайте гайд в нашем Телеграм-канале.
Если у вас есть идеи или опыт, которые могут помочь улучшить процесс сегментации, и вы хотите работать с аналогичными задачами — будем рады видеть вас в нашей команде.

Узнайте больше о карьерных возможностях в Авито и присоединяйтесь к команде аналитики продаж, чтобы вместе развивать новые подходы и инструменты.

Смотрите вакансии на сайте Avito.career