Мы обучили LLM-модель, которая достает модель товара из заголовка и описания объявления. Это не простая задача классификации: например, продавец может придумать свою модель товара, если сам её производит.
Сейчас выходит много опенсорсных моделей, которые и так хорошо справляются с задачами. И каждая новая модель бьёт все предыдущие. А вот создать свой претрейн очень дорого: нужно взять большую модель, терабайты данных и обучить модель на задачу next token prediction. Это может занять несколько дней или даже недель — в зависимости от количества данных, размера модели и количества GPU-карт.