Перейти к содержимому
Вебинар «Как цифровая трансформация меняет бизнес в России- 22 апреля 2020 года, начало в 15:00 (мск) - зарегистрироваться
- Элементы программирования в R (занятие 1, занятие 2)
— Описательные статистики и визуализация
— Например, что важнее: средний чек или типичный чек?
- Кластерный анализ
— Какая задача решается. Разбить группу объектов на подгруппы.
— Пример задачи. Сегментация сайтов, определение схожих сайтов.
— Изучаемые методы. Иерархический кластерный анализ, метод к-средних, Метод к-медоидов.
- Проверка статистических гипотез
— Какая задача решается. Сравнить две группы объектов.
— Пример задачи. A/B тестирование поведения пользователя на разных версиях страницы сайта.
— Изучаемые методы. Тест для пропорций, Критерий Стьюдента, Критерий Ливиня, Критерий Уилкоксона-Манна-Уитни
- Линейный регрессионный анализ.
— Пример задачи. Оценить, насколько упали цены на подержанные автомобили после увеличения таможенных пошлин.
— Изучаемые методы. Отбор переменных, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание). Прогнозирование коротких рядов с сезонной составляющей с помощью линейной регрессии
- Прогнозирование
— Какая задача решается. Построить прогноз временного ряда
— Пример задачи. Спрогнозировать посещаемость сайта на 6 месяцев вперед.
— Изучаемый метод. Экспоненциальное сглаживание
- Machine Learning (Распознавание образов)
— Пример задачи. Распознать пол и возраст у каждого посетителя сайта
— Изучаемые методы. Метод k-го ближайшего соседа Деревья классификации (CART). Случайные леса. Gradient boosting machine