Статистические гипотезы. Критерии согласия. параметрические критерии.
Генеральная
совокупность
Множество всех объектов, обладающих изучаемым признаком
Объем генеральной
совокупности -число
объектов генеральной
совокупности
Выборочная
совокупность или
выборка
Множество объектов, отобранных случайным образом из генеральной совокупности для изучения
объем выборки - количество
объектов в выборке
репрезентативность
(представительность) -
показатель того, насколько
хорошо выборка отражает
основные свойства той
генеральной совокупности,
частью которой является
выборка репрезентативна, если
она сделана случайным образом
Статистическая
гипотеза
Предположение о виде
неизвестного
распределения или об
его параметрах
Статистическая ошибка
статистическая ошибка I рода -
нулевая гипотеза верна, но
отвергается
Вероятность ошибки обозначают α и
называют уровнем значимости
статистическая ошибка II рода -
нулевая гипотеза не верна, но
не отвергается
Вероятность ошибки обозначают β.
Величина 1 - β называется
мощностью критерия - способность
выявлять различия или отклонять
нулевую гипотезу, если она не
верна
При проверке выдвигаются 2
гипотезы:
Нулевая (или основная) –
гипотеза о сходстве (H0)
Для проверки используется
специально подобранная случайная
величина К - статистический
критерий :
должна являться функцией выборочных
данных
характеризовать меру расхождения
выборочных данных сосновной гипотезой
ее закон распределения в случае
истинности гипотезы должен быть известен
Альтернативная (или
конкурирующая) – гипотеза о
различиях (H1)
направленная
ненаправленная
Основной принцип принятия
решения при проверке:
гипотез а отвергается, если
наблюдаемое значение
критерия, принадлежит
критической области, и не
отвергается, если
наблюдаемое значение
принадлежит допустимой
области
Критерии согласия
Критерии,
позволяющие оценить
степень согласия
наблюдаемого
статистического
распределения
выборки с
гипотетическим
распределением
Критерий Колмогорова
(Колмогорова-Смирнова)
В качестве величины, которая
характеризует согласие
распределения изучаемой
величины с теоретическим
распределением
используется разность между
эмпирической и
гипотетической функцией
распределения.
Критерий Шапиро - Уилка W
Основан на отношении
оптимальной оценки
дисперсии к ее обычной
оценке.
Нормальный закон распределения
а – математическое ожидание
(характеризует центр
распределения, в статистике
– это среднее значение
параметра в генеральной
совокупности, примерно
равно выборочной средней)
σ – среднеквадратическое
отклонение (характеризует
разброс, примерно равно
стандартному отклонению,
полученному по выборке)
«правило трех сигм»:
вероятность того, что
значение нормально
распределенной случайной
величины отклонится от
математического ож идания не
б олее чем на 3σ, примерно
равна единице
Совпадение величин средней
арифметической, моды и
медианы
Чем больше величина
признака отклоняется от
среднего значения, тем
меньше будет частота
встречаемости (вероятности)
этого признака в распределении
Тип организации эксперимента
Независимые (несвязные)
выборки -процедура
эксперимента и результаты
измерения, полученные на
одной из выборок, не
оказывают влияния на
особенности протекания
эксперимента и результаты
измерения у другой выборки
Зависимые (связные)
выборки -процедура
эксперимента и результаты
измерения, полученные на
одной выборке, оказывают
влияние на особенности
протекания эксперимента и
результаты измерения у
другой выборки
Параметрические критерии
Основаны на конкретном виде распределения изучаемой случайной величины и используют числовые характеристики выборочной совокупности
Критерий Фишера -
Снедекора: F равна
отношению большей из
исправленных выборочных
дисперсий к меньшей
H0 - генеральные дисперсии
равны
H1 - генеральные дисперсии не
равны
Критерий Стюдента
H0 - генеральные средние равны
H1 - генеральные средние не
равны
t-критерий Стьюдента для
независимых выборок
t-критерий Стьюдента для
зависимых выборок
Непараметрические критерии
Не базируются на
предположении о виде распределения
изучаемой величины и используют
непосредственно выборочные данные , а
не параметры выборки