Привет!
Это страница
курса по
открытого
Академии Аналитиков Авито
от
от Академии Аналитиков Авито
Привет! Это страница
Для тех, кто хочет применять прикладную статистику в реальных бизнес-задачах.
Курс учит, как на реальных данных из своей бизнес-области эти кастомные критерии провалидировать*, убедиться что они корректны и выбрать из них оптимальный.
*авторы курса поднаторели в создании как раз таких критериев и уверены: их нужно валидировать, иначе просто ошибиться
Курс учит, как на реальных данных из своей бизнес-области валидировать кастомные критерии* и выбирать из них оптимальный.
наиболее частых критериев. Для этих критериев сначала мы разберём теорию, затем в деталях и на практике изучим все нюансы этих критериев. Напишем много кода! Цель — как Брюс Ли, отработать один удар на 10 000 разных противниках, чтобы для самых полезных критериев стать мастерами 10 дана.
критериев, названия которых не на слуху. Курс не ставит цель галопом по Европам пройти все эти критерии. Мы научним, как быстро разобраться в новом критерии, провалидировать его и со 100% уверенностью применить в работе.
кастомной жести, которую аналитик сам собрал, пользуясь своим бизнес-сенсом, знаниями в ML, эконометрике и теории экспериментов. Всё это мы изучаем в Академии Аналитиков Авито.
Для решения бизнес-задач наукоёмкие команды Авито применяют:
Ключевые навыки
Cтудент умеет решать практические задачи с использованием статистических критериев: t-test, Манна-Уитни, бутстрап, хи-квадрат
Cтудент умеет использовать специализированные библиотеки Python для решения статистических задач
Cтудент умеет разрешать спорные ситуации при анализе статистических данных (как учесть несколько гипотез, можно ли перепровести эксперимент)
Второстепенные навыки
Cтудент может поставить эксперимент для проверки гипотезы статистическим критерием
Cтудент может вывести критерий, доказать справедливость используемой формулы
Программа курса
Курс разделен на две части. Первая часть охватывает базовые темы прикладной статистики. Во второй части будут рассматриваться более хитрые критерии.
Часть 1
Статистический критерий
Статистическая мощность
Z-test
T-test
Метод Монте-Карло
1. Статистический критерий
1.1. Зачем нужна прикладная статистика?
1.2. Статистические гипотезы
1.3. Статистические функции в Python
1.4. Двусторонний критерий
2. Статистическая мощность
2.1. Статистическая мощность
2.2. Мощность для задачи про доставку
2.3. Minimum detectable effect aka MDE
2.4.1. Доверительный интервал
2.4.2. Доверительный интервал. Продолжение
2.4.3. Доверительный интервал Уилсона
2.5. Алгоритм проверки гипотез.
3. Z-test
3.1. Нормальное распределение
3.2. Z-test
3.3. Занятие со звездочкой, Z-test
4. T-test
4.1. Критерии сравнения средних. T-критерий Стьюдента
4.2. T-test
4.3. Доверительный интервал
4.4. A/B-тесты. Двувыборочный Т-test
4.5. MDE для T-test
5. Метод Монте-Карло
5.1. Метод Монте-Карло
5.2. Метод Монте-Карло (на исторических данных)
5.3. Метод Монте-Карло (определение мощности на исторических данных)
Часть 2
Критерий Колмогорова
Критерий Колмогорова-Смирнова
Хи-квадрат
Критерий Манна-Уитни
Бутстрап
Линеаризация
Будет выпущена осенью 2024
6. Критерий Колмогорова
6.1. Критерии согласия. Критерий Колмогорова ч.1
6.2. Критерии согласия. Критерий Колмогорова ч.2
6.3. Критерий согласия. Критерий Шапиро-Уилка
6.4. QQ-plot


7.
2.1.
2.2.
2.3.
2.4.1.
2.4.2.
2.4.3.
2.5.
3. Z-test
3.1. Нормальное распределение
3.2. Z-test
3.3. Занятие со звездочкой, Z-test
4. T-test
4.1. Критерии сравнения средних. T-критерий Стьюдента
4.2. T-test
4.3. Доверительный интервал
4.4. A/B-тесты. Двувыборочный Т-test
4.5. MDE для T-test
5. Метод Монте-Карло
5.1. Метод Монте-Карло
5.2. Метод Монте-Карло (на исторических данных)
5.3. Метод Монте-Карло (определение мощности на исторических данных)
Часть 1
Смотреть курс
1. Статистический критерий
1.4. Двусторонние критерии
1.1. Статистический критерий
1.2. Создаем статистические критерии в Python
1.3. Cтатистический критерий уровня статзначимости α
2. Статистическая мощность
2.4. Доверительный интервал
2.1. Статистическая мощность
2.2. Мощность для задачи про доставку
2.3. Minimum detectable effect aka MDE
2.4/1. Доверительный интервал. Продолжение
2.4/2. Доверительный интервал Уилсона
2.5. Алгоритм проверки гипотез
3. Z-test
3.1. Критерии сравнения средних
3.2. Z-test
3.3. Занятие со звездочкой, Z-test
4. T-test
4.4. АБ-тесты. Двувыборочный Т-test
4.1. Критерии сравнения средних. T-критерий Стьюдента
4.2. T-test
4.3. Доверительный интервал
4.5. MDE для T-test
5. Метод Монте-Карло
5.1. Метод Монте-Карло
5.2. Метод Монте-Карло (на исторических данных)
5.3. Метод Монте-Карло (определение мощности на исторических данных)
Часть 2
6. Критерий Колмогорова
6.4. QQ-plot
6.1. Критерии согласия. Критерий Колмогорова. Часть 1.
6.2. Критерии согласия. Критерий Колмогорова. Часть 2.
6.3. Критерии согласия. Критерий Шапиро-Уилка.
6.5. Где НЕ нужно применять критерии согласия
6.6. Проверка критерия Колмогорова
6.7. Критерии согласия. Проверка сложных гипотез.
7. Критерий Колмогорова-Смирнова
7.4. Применимость критерия однородности Колмогорова Смирнова на практике
7.1. Критерий однородности Колмогорова-Смирнова
7.2. Размер выборки критерия Колмогорова Смирнова
7.3. Независимость элементов выборки критерия Колмогорова Смирнова
8. Хи-квадрат
8.4. Критерий Хи-квадрат Пирсона
8.1. Критерий Хи-квадрат Пирсона
8.2. Критерий Хи-квадрат Пирсона для непрерывного распределения
8.3. Критерий Хи-квадрат Пирсона для проверки сложной гипотезы
8.5. Критерий Хи-квадрат Пирсона для гипотезы независимости
8.6. Критерий Хи-квадрат Пирсона для гипотезы однородности
8.7. Критерий Хи-квадрат Пирсона с поправкой Йейтса
9. Критерий Манна-Уитни
10. Бутстрап
11. Линеаризация
Команда курса
Тимур Мерлин
Закончил ММП ВМК МГУ и ШАД. Основной фокус, которого придерживаюсь при создании курса в ААА по сравнению с этими двумя (очень крутыми) учебными заведениями — максимальный упор на сложные кейсы из реальной рабочей практики. Мои команды внутри Авито создают математически навороченные фреймворки для проведения экспериментов и управления бизнесовыми процессами. Я ставлю цель, чтобы выпускники курса обрели достаточно компетенций для работы с такими нетривиальными задачами.
Head of Analytics, Авито
Дмитрий Лунин
Работаю в Авито вот уже как 3+ года, до этого успел поработать в Яндексе и в Тинькофф. Закончил ФИВТ МФТИ, где также проводил семинары по статистике и читал лекции по временным рядам.
По работе я очень часто сталкиваюсь с нетривиальным применением статистики на практике, поэтому много что могу рассказать на эту тему) И именно этот опыт помог создать материалы к большинству лекций курса. Надеюсь, вам понравится)
Analyst Team Lead, Авито
Роман Логинов
Закончил ФИВТ МФТИ и ШАД. Преподавал и принимал участие в создании курсов по статистике и ML в МФТИ и ШАДе. По работе обычно занимаюсь задачами ранжирования с разных сторон, на данный момент исследую размещение платных объявлений на выдаче. Считаю, что в работе DS одна из главных задач — это правильно задизайненный эксперимент и его анализ, поэтому без знаний по статистике не обойтись. На опыте это зачастую даже важнее умения обучить хитрую ML-модель. Надеюсь, вы обретёте эти навыки на курсе!
Senior Data Scientist, Авито
Закончил МатМех СПбГУ и ФКН ВШЭ. В Авито работаю в команде автоматизации клиентской поддержки: разрабатываю систему метрик продукта, с помощью тестов измеряю эффект от изменений в ботах, решающих вопросы пользователей. Своим опытом поделюсь с вами в методичках курса.
Analyst, Авито
Никита Мейер
Команда курса
Закончил ММП ВМК МГУ и ШАД. Основной фокус, которого придерживаюсь при создании курса в ААА по сравнению с этими двумя (очень крутыми) учебными заведениями — максимальный упор на сложные кейсы из реальной рабочей практики. Мои команды внутри Авито создают математически навороченные фреймворки для проведения экспериментов и управления бизнесовыми процессами. Я ставлю цель, чтобы выпускники курса обрели достаточно компетенций для работы с такими нетривиальными задачами.
Работаю в Авито вот уже как 3+ лет, до этого успел поработать в Яндексе и в Тинькофф. Закончил ФИВТ МФТИ, где также недолгое время проводил семинары по статистике и читал лекции по временным рядам. По работе я очень часто сталкиваюсь с нетривиальным применением статистики на практике, поэтому много что могу рассказать на эту тему) И именно этот опыт помог создать материалы к большинству лекций курса. Надеюсь вам понравится)
Закончил ФИВТ МФТИ и ШАД. Преподавал и принимал участие в создании курсов по статистике и ML в МФТИ и ШАДе. По работе обычно занимаюсь задачами ранжирования с разных сторон, на данный момент исследую размещение платных объявлений на выдаче. Считаю, что в работе DS одна из главных задач — это правильно задизайненный эксперимент и его анализ, поэтому без знаний по статистике не обойтись. На опыте это зачастую даже важнее умения обучить хитрую ML-модель. Надеюсь, вы обретёте эти навыки на курсе!
Закончил МатМех СПбГУ и ФКН ВШЭ. В Авито работаю в команде автоматизации клиентской поддержки: разрабатываю систему метрик продукта, с помощью тестов измеряю эффект от изменений в ботах, решающих вопросы пользователей. Своим опытом поделюсь с вами в методичках курса.
Тимур Мерлин
Head of Analytics, Авито
Дмитрий Лунин
Analyst Team Lead, Авито
Роман Логинов
Senior Data Scientist, Авито
Analyst, Авито
Никита Мейер
Закончил ММП ВМК МГУ и ШАД. Основной фокус, которого придерживаюсь при создании курса в ААА по сравнению с этими двумя (очень крутыми) учебными заведениями — максимальный упор на сложные кейсы из реальной рабочей практики. Мои команды внутри Авито создают математически навороченные фреймворки для проведения экспериментов и управления бизнесовыми процессами. Я ставлю цель, чтобы выпускники курса обрели достаточно компетенций для работы с такими нетривиальными задачами.
Тимур Мерлин
Head of Analytics, Авито
Работаю в Авито вот уже как 3+ года, до этого успел поработать в Яндексе и в Тинькофф. Закончил ФИВТ МФТИ, где также проводил семинары по статистике и читал лекции по временным рядам. По работе я очень часто сталкиваюсь с нетривиальным применением статистики на практике, поэтому много что могу рассказать на эту тему) И именно этот опыт помог создать материалы к большинству лекций курса. Надеюсь вам понравится)
Дмитрий Лунин
Analyst Team Lead, Авито
Закончил ФИВТ МФТИ и ШАД. Преподавал и принимал участие в создании курсов по статистике и ML в МФТИ и ШАДе. По работе обычно занимаюсь задачами ранжирования с разных сторон, на данный момент исследую размещение платных объявлений на выдаче. Считаю, что в работе DS одна из главных задач — это правильно задизайненный эксперимент и его анализ, поэтому без знаний по статистике не обойтись. На опыте это зачастую даже важнее умения обучить хитрую ML-модель. Надеюсь, вы обретёте эти навыки на курсе!
Роман Логинов
Senior Data Scientist, Авито
Закончил МатМех СПбГУ и ФКН ВШЭ. В Авито работаю в команде автоматизации клиентской поддержки: разрабатываю систему метрик продукта, с помощью тестов измеряю эффект от изменений в ботах, решающих вопросы пользователей. Своим опытом поделюсь с вами в методичках курса.
Analyst, Авито
Никита Мейер
FAQ
Чем этот курс отличается от остальных?
Во-первых, авторы курса — практики, которые применяют статистику, чтобы получать миллиардные аплифты.
Во-вторых, авторы курса — новаторы, которые используют статистику как базу для создания наукоёмких механизмов в нескольких командах Авито.
Что нужно знать для успешного освоения курса?
Достаточно знать программу 1 курса университета по математике, а также разбираться в теор. вере: что такое вероятность, функция распределения, дисперсия, мат. ожидание, как формулируется центральная предельная теорема и закон больших чисел. Если у вас в университете был курс по теор. веру — его точно будет достаточно.
Кроме этого, нужно уметь писать простые программы на языке программирования Python, и уметь пользоваться юпитер-ноутбуками.
Ранее у меня не было опыта изучения статистики. Этот курс подойдет для меня?
Да, знание статистики не является обязательным условием для успешного прохождения курса.
Но нужно разбираться в теор. вере.
Что нужно для прохождения курса?
Youtube и локальный Jupyter Notebook. Как пользоваться юпитер-ноутбуками, можно прочесть в большом количестве гайдов в интернете.
Сколько времени нужно для освоения курса?
В полном курсе 11 лекций средней продолжительность 2−2.5 часа. Старт обучения и распределение времени на прохождение курса выбираете вы сами. Рекомендуем не растягивать обучение. Оптимальный срок прохождения 2−4 месяца.
Что делать, если у меня возникнут вопросы по материалу?
Подать заявку на поступление в Академию Аналитиков Авито =)
В ней студенты имеют возможность не просто задать все вопросы авторам курса и экспертам из числа действующих синьоров Авито, но и под их руководством прорешать практические задачи на семинарах и в ДЗ, а также получить персональные рекомендации и комментарии по своим решениям.
Я получу сертификат о прохождении курса после окончания?
Нет. Для получения сертификата приходи учиться в Академию Аналитиков Авито.
У меня остались вопросы. Куда писать?
Если ты не нашел ответ на свой вопрос, напиши нам на почту analytics-academy@avito.ru. В теме письма укажи, что вопрос по видеокурсу Прикладная Статистика.
Связаться с командой ААА:
analytics-academy@avito.ru
Связаться с командой AvitoTech: tech@avito.ru
© ООО «Авито Тех» 2020–2024.
Фидбек