Владимир панов
Математическая статистика и приложения
О курсе

«Чем бы вы потом не занимались, вы будете заниматься статистикой» - эту фразу я впервые услышал на вручении дипломов на мехмате и с тех пор много раз убеждался в её правильности. Любое эмпирическое исследование опирается на анализ данных, включающий в себя (в большей или меньшей мере) элементы статистического анализа.

Целью данного курса является знакомство слушателей с методами математической статистики, которые находят применение при решении прикладных задач. Особое внимание уделено современным методам, обычно не входящим в базовые курсы статистики – в частности, непараметрическим и семипараметрическим подходам. Курс сопровождается семинарами, на которых помимо теоретических задач будут рассмотрены реализации рассматриваемых идей в прикладном программном обеспечении.


Команда курса
Владимир Панов
Лектор
Екатерина Морозова
Ассистент
Программа
Оценивание параметров модели
Статистическая модель. Свойства статистических оценок. Метод моментов, метод максимального правдоподобия и другие методы получения оценок. Достаточные статистики.
Непараметрическое оценивание плотности распределений
Гистограмма. Ядерные оценки. Дилемма смещения-дисперсии. Оптимальные в минимаксном смысле оценки.
Доверительные интервалы
Методы построения доверительных интервалов. Бутстрэп.
Проверка статистических гипотез. Общая теория.
Ошибки I и II рода. LR-тесты. Оценка адекватности модели (goodness of fit). Теоремы Пирсона и Уилка.
Таблицы сопряженности
Тест хи-квадрат. Точный критерий Фишера.
Корреляционный анализ
Параметрические и непараметриеские коэффициенты корреляции. Предельные распределения ранговых характеристик, разложение Эджворта.
Статистические тесты для сравнения групп
Тесты для модели независимых групп и парных повторных наблюдений (критерии Стьдента, Уилкоксона, Манна-Уитни, Краскела-Уоллиса, Фридмана).
Регрессия
Линейная регрессия. Экспоненциальные семейства распределений и обобщённые линейные модели. Парадоксы регрессии. Метод кросс-проверки. Критерий Акаике. Вейвлеты.
Байесовские методы оценивания
Априорные и апостериорные распределения. Гауссовская модель.
Задачи классификации и кластеризации
Эвристические и иерархические методы. Деревья классификации.
Методы понижения размерности
Метод главных компонент. Метод независимых компонент. Семипараметрические подходы.
Анализ выживаемости
Понятия цензурированных наблюдений. Функция выживания и функция риска (hazard function). Оценки Каплана-Мейера.