На Авито продаются тысячи разных позиций товаров — автомобили, мебель, недвижимость. Из-за этого пользователи не всегда понимают, где разместить объявление и какую категорию выбрать.
Подробнее про особенности доставки — в статье: «Как продавать запчасти для грузовиков и спецтехники с помощью Авито Доставки».
Чтобы подсказки на подаче и модерация были точными, нам предстояло построить ML-систему. Расскажу, как мы решали эту задачу и какие технологии использовали.
Инфомодель Авито — база знаний обо всех параметрах, категориях и значениях товаров, которые пользователи публикуют на площадке. Например, все существующие бренды, цвета, размеры, составы. Эти параметры мы ещё называем атрибутами.
Про нашу Инфомодель рассказывали в статье: «Версионирование данных в Инфомодели Авито»
cmp(Cand1(p_node11, p_node12, …), Cand2(p_node21, p_node22, …))
Подробнее про библиотеку Aqueduct мы писали в статьях:
Документация по Airflow на airflow.apache
Документация по MLFow на mlflow.org