• Элементы программирования в R (занятие 1, занятие 2)
    — Описательные статистики и визуализация
    — Например, что важнее: средний чек или типичный чек?
  • Кластерный анализ
    — Какая задача решается. Разбить группу объектов на подгруппы.
    — Пример задачи. Сегментация сайтов, определение схожих сайтов.
    — Изучаемые методы. Иерархический кластерный анализ, метод к-средних, Метод к-медоидов.
  • Проверка статистических гипотез
    — Какая задача решается. Сравнить две группы объектов.
    — Пример задачи. A/B тестирование поведения пользователя на разных версиях страницы сайта.
    — Изучаемые методы. Тест для пропорций, Критерий Стьюдента, Критерий Ливиня, Критерий Уилкоксона-Манна-Уитни
  • Линейный регрессионный анализ.
    — Пример задачи. Оценить, насколько упали цены на подержанные автомобили после увеличения таможенных пошлин.
    — Изучаемые методы. Отбор переменных, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание). Прогнозирование коротких рядов с сезонной составляющей с помощью линейной регрессии
  • Прогнозирование
    — Какая задача решается. Построить прогноз временного ряда
    — Пример задачи. Спрогнозировать посещаемость сайта на 6 месяцев вперед.
    — Изучаемый метод. Экспоненциальное сглаживание
  • Machine Learning (Распознавание образов)
    — Пример задачи. Распознать пол и возраст у каждого посетителя сайта
    — Изучаемые методы. Метод k-го ближайшего соседа Деревья классификации (CART). Случайные леса. Gradient boosting machine