Categorías: Todo - выборка - критерии - гипотеза - распределение

por alex alex hace 8 años

343

Статистические гипотезы

Статистическая гипотеза представляет собой предположение о распределении или параметрах неизвестной величины. Для проверки таких гипотез используют статистические критерии. Допустимая область включает значения, которые не противоречат нулевой гипотезе, в то время как критическая область содержит значения, при которых нулевая гипотеза отвергается.

Статистические гипотезы

Параметрические критерии

Критерии согласия – это критерии, позволяющие оценить степень согласия наблюдаемого статистического распределения выборки с гипотетическим распределением.

Критерий Шапиро - Уилка
Критерий Шапиро-Уилка считают лучшим критерием нормальности, так как он обладает большей мощностью перед широким выбором альтернативных критериев нормальности.
Критерий Шапиро – Уилка основан на отношении оптимальной оценки дисперсии к ее обычной оценке. Применение критерия требует специальных таблиц с коэффициентами. Поэтому для числа наблюдений больше 2000, этот критерий неприменим (в этом случае можно применить критерий Колмогорова, не имеющий ограничения по объему). Но при объеме выборки, не превышающем 50, мощность критерия Шапиро-Уилка выше мощности критерия Колмогорова.
Критерий Колмогорова
Критерий Колмогорова считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному, но он мало применим для выборок небольшого объема. В этом случае лучше использовать критерий Шапиро-Уилка.
Критерий Колмогорова позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р < 0,05, то данное эмпирическое распределение существенно отличается от нормального, а если р > 0,05, то делают вывод о приблизительном соответствии данного эмпирического распределения нормальному.
H0 - функция распределения изучаемой величины соответствует функции нормального распределения H1 - функция распределения изучаемой величины не соответствует функции нормального распределения Замечание: если не давать строгое определение, то функция распределения - это функция, которая описывает

Нормальный закон распределения

Для нормальной случайной величины характерно свойство, называемое «правилом трех сигм»: вероятность того, что значение нормально распределенной случайной величины отклонится от математического ожидания не более чем на 3σ, примерно равна единице. Это означает, что если признак имеет нормальное распределение, то подавляющее большинство вариант (99,7%) будут отдаляться от среднего значения не далее, чем на 3σ.
Для нормального распределения характерно также совпадение величин средней арифметической, моды и медианы. Равенство этих показателей указывает на нормальность данного распределения (но это нужно доказать с помощью специальных критериев).
Нормальное распределение играет большую роль в математической статистике, поскольку многие статистические методы предполагают, что анализируемые экспериментальные данные распределены нормально. График нормального распределения имеет вид колоколообразной кривой и описывается формулой:

статистика

Критерий Фишера -Снедекора.
Такая задача на практике возникает при необходимости сравнить точность двух приборов или методик исследования, однородность (степень разброса признака в 2 группах). Дисперсия характеризует разброс значений признака относительно генеральной средней. Чем меньше разброс результатов измерений, тем более точен прибор или метод (или однороднее группы
доказательную
описательную

Параметры

Репрезентативность - это показатель того, насколько хорошо выборка отражает основные свойства той генеральной совокупности, частью которой является
Количество объектов в выборке называют объемом выборки

Статистическая гипотеза – это предположение о виде неизвестного распределения или об его параметрах.

В результате проверки статистических гипотез возможны четыре случая
1) гипотеза Н0 верна и не отвергается 2) гипотеза Н0 верна, но отвергается 3) гипотеза Н0 не верна и отвергается 4) гипотеза Н0 не верна, но не отвергается
Статистический критерий.
Критические точки – это точки, отделяющие критическую область от допустимой
Критическая область – это область значений критерия, при которых отвергается нулевая гипотеза и принимается конкурирующая.
Допустимая область – это область значений критерия, которые не противоречат нулевой гипотезе.
Наблюдаемое значение критерия – это значение критерия, вычисленное по выборке, то есть зависящее от выборочных значений.

Вид закона распределения исследуемой случайной величины

Непараметрические критерии
не базируются на предположении о виде распределения изучаемой величины и используют непосредственно выборочные данные, а не параметры выборки.
основаны на конкретном виде распределения изучаемой случайной величины (как правило, на нормальном распределении) и используют числовые характеристики выборочной совокупности (выборочную среднюю, выборочную дисперсию и т.п.), которые являются точечными оценками параметров генеральной совокупности

Тип организации эксперимента

Зависимыми
Например, измерения каких-либо параметров в одной и той же группе: первый раз – до начала лечения, второй раз – после окончания курса лечения.
Независимыми
Например, измерения каких-либо параметров в двух разных группах, одна из которых получала препарат А, а другая – препарат В.