Недавно мы полностью пересобрали алгоритмы ранжирования в Авито: добавили поведенческие признаки, отказались от оптимизации на контакты и внедрили персонализированный поиск.
Авито Работа — одна из наших вертикалей наряду с Товарами, Недвижимостью, Услугами. Также в рамках Работы у нас есть две категории: Вакансии и Резюме. Сначала речь пойдёт о второй.
У каждого резюме есть история: сколько раз его покупали и отвечал ли человек на предложения работодателей.
Если смотреть только на суммарную активность, можно сделать неправильный вывод. Поэтому мы оцениваем конверсию в ответ отдельно по каждому каналу.
Всё написанное выше не означает, что текущий алгоритм «плохой» и его нужно «выкинуть». Он показывает себя отлично в других категориях и поначалу неплохо справлялся с Резюме. Но как только у нас появилась возможность его улучшить — мы ей воспользовались.
Офлайн-тест или бэк-тест — метод валидации алгоритма без запуска в прод. Мы берём исторические данные: реальные поисковые выдачи, в которых уже известны факты — по каким резюме произошла сделка, а по каким — нет.
Чтобы сравнить алгоритмы, нужна метрика. Мы используем NDCG — Normalized Discounted Cumulative Gain. Это мера «идеальности» выдачи, которая показывает, насколько хорошо алгоритм расположил объявления по сравнению с идеальной ситуацией.
Если интересна эта тема, читайте статью моего коллеги: «Как работает поисковое ранжирование для миллионов объявлений Авито»
В процессе разработки мы поняли: такой подход нужен не только Резюме. У каждой категории свои специфичные признаки, цели и правила ранжирования, поэтому вместо частного решения для одной вертикали мы создали фреймворк, который можно использовать везде. Теперь любая команда в Авито может принести свои признаки, обучить модель и встроить её в поиск.
В результате работы можно сделать вывод — подход работает. Мэтчинг-поиск помогает работодателям и соискателям встречаться друг с другом, увеличивает количество сделок и удовлетворённость пользователей Авито.
Мэтчинг-поиск — это алгоритм, который ранжирует объявления не по привлекательности, а по вероятности найма. Он учитывает интересы обеих сторон: работодателя и соискателя.