Категории: Все - выборка - критерии - распределение - мощность

по Даня Олениус 8 лет назад

424

Олениус

Критерии согласия используются для оценки соответствия наблюдаемого статистического распределения с гипотетическим. Критерий Колмогорова, предложенный Андреем Колмогоровым, применяется для непрерывных случайных величин и оценивает разность между эмпирической и гипотетической функциями распределения.

Олениус

"Статистические гипотезы. Критерии согласия. Параметрические критерии"

Критерии согласия – это критерии, позволяющие оценить степень согласия наблюдаемого статистического распределения выборки с гипотетическим распределением.

Критерий Колмогорова (или Колмогорова-Смирнова) Критерий предложен русским математиком Андреем Николаевичем Колмогоровым и применим только для непрерывной случайной величины (Смирнов Николай Васильевич предложил модификацию данного критерия для 2 выборок, но во многих учебниках и критерий согласия называется критерием Колмогорова-Смирнова). В качестве величины, которая характеризует согласие распределения изучаемой величины с теоретическим распределением используется разность между эмпирической и гипотетической функцией распределения. В данном критерии при проверке нормальности распределения с в случае сложной гипотезы (когда параметры распределения оцениваются по выборке), вводится поправка Лиллиефорса.
Критерий Шапиро - Уилка Критерий Шапиро – Уилка основан на отношении оптимальной оценки дисперсии к ее обычной оценке. Применение критерия требует специальных таблиц с коэффициентами. Поэтому для числа наблюдений больше 2000, этот критерий неприменим (в этом случае можно применить критерий Колмогорова, не имеющий ограничения по объему). Но при объеме выборки, не превышающем 50, мощность критерия Шапиро-Уилка выше мощности критерия Колмогорова. Критерий Шапиро-Уилка считают лучшим критерием нормальности, так как он обладает большей мощностью перед широким выбором альтернативных критериев нормальности.

Статистическая гипотеза – это предположение о виде неизвестного распределения или об его параметрах.

При проверке статистических гипотез всегда выдвигается две гипотезы:
Альтернативная (или конкурирующая) – гипотеза о различиях, обозначается H1.
Нулевая (или основная) – гипотеза о сходстве, обозначается H0.

Для проверки основной гипотезы используется специально подобранная случайная величина К, которая должна удовлетворять определенным требованиям: 1. она должна являться функцией выборочных данных; 2. характеризовать меру расхождения выборочных данных с основной гипотезой; 3. ее закон распределения в случае истинности гипотезы должен быть известен. Такая случайная величина К называется статистическим критерием.

Наблюдаемое значение критерия – это значение критерия, вычисленное по выборке, то есть зависящее от выборочных значений. Допустимая область – это область значений критерия, которые не противоречат нулевой гипотезе. Критическая область – это область значений критерия, при которых отвергается нулевая гипотеза и принимается конкурирующая. Критические точки – это точки, отделяющие критическую область от допустимой.

Статистические ошибки В результате проверки статистических гипотез возможны четыре случая: 1) гипотеза Н0 верна и не отвергается 2) гипотеза Н0 верна, но отвергается 3) гипотеза Н0 не верна и отвергается 4) гипотеза Н0 не верна, но не отвергается
Первый и третий случаи означают правильное решение. Во втором случае (нулевая гипотеза верна, но отвергается) говорят, что совершается статистическая ошибка I рода.
В четвертом случае (нулевая гипотеза не верна, но не отвергается) говорят, что совершается статистическая ошибка II рода. Вероятность статистической ошибки II рода обозначают β. Величина 1 - β называется мощностью критерия

Параметрические критерии

Критерий Фишера -Снедекора. Проверка гипотез о равенстве генеральных дисперсий двух нормально распределенных генеральных совокупностей./Применяется F-критерий Фишера - Снедекора. В качестве критерия используется случайная величина F, имеющая распределение Фишера – Снедекора (в случае истинности нулевой гипотезы ). F равна отношению большей из исправленных выборочных дисперсий к меньшей. Гипотезы при использовании критерия Фишера-Снедекора выдвигаются следующим образом: • H0 - генеральные дисперсии равны • H1 - генеральные дисперсии не равны Если в результате проверки нулевую гипотезу отвергаем, то генеральные дисперсии не равны, выборочные дисперсии различаются значимо. Если нет оснований отвергать нулевую гипотезу, то генеральные дисперсии равны, выборочные дисперсии различаются не значимо.
Критерий Стьюдента. Проверка гипотезы о равенстве генеральных средних двух нормально распределенных генеральных совокупностей. Проверка данной гипотезы осуществляется с помощью t-критерия Стьюдента. Критерий используется чаще всего в том случае, когда нужно проверить влияние какого-либо фактора на исследуемую величину. • Если различие между выборочными средними статистически значимо, то фактор оказывает влияние на исследуемую величину. • Если различие между средними не значимо, то фактор не оказывает влияния на исследуемую величину, различие между выборочными средними обусловлено воздействием случайных причин. Гипотезы при использовании критерия Стьдента выдвигаются следующим образом: • H0 - генеральные средние равны • H1 - генеральные средние не равны Применение t-критерия Стьюдента возможно как для зависимых, так и для независимых выборок.
Две зависимые выборки. В этом случае используется t-критерий Стьюдента для зависимых выборок. В зависимых выборках сравнение величин X и Y осуществляется с помощью величины d, являющейся разностью между величинами X и Y. Если нулевая гипотеза отвергается и принимается конкурирующая, то выборочные средние различаются значимо, генеральные средние в исследуемых совокупностях не равны между собой. Можно говорить о влиянии фактора на изучаемую величину. Если нет оснований отвергать нулевую гипотезу, то выборочные средние различаются не значимо, генеральные средние в исследуемых совокупностях равны. Фактор не влияет на изучаемую величину, полученное различие объясняется только случайными причинами.
Две независимые выборки. В этом случае используется t-критерий Стьюдента для независимых выборок. Наблюдаемое значение критерия вычисляется по формуле: . Критическое значение находится по таблице критических точек распределения Стьюдента (двусторонняя критическая область). Оно зависит от уровня значимости α и числа степеней свободы f = nx + ny - 2. Если гипотеза H0 отвергается и принимается гипотеза H1, то: • Генеральные средние не равны. • Выборочные средние различаются значимо. • Фактор влияет на исследуемую величину. Если нет оснований отвергать гипотезу H0, то: • Генеральные средние равны. • Выборочные средние различаются незначимо. • Фактор не влияет на исследуемую величину. Следовательно, пред применением критерия Стьюдента необходимо убедиться в нормальности распределения (с помощью критериев согласия) и в равенстве генеральных дисперсий (с помощью критерия Фишера – Снедекора).