Данные

Критерии согласия

Критерии согласия

Это критерии, позволяющие оценить степень согласия наблюдаемого статистического распределения выборки с гипотетическим распределением

При использовании критериев согласия для проверки согласия с нормальным законом выдвигаются следующие гипотезы

H0 - функция распределения изучаемой величины соответствует функции нормального распределения

H1 - функция распределения изучаемой величины не соответствует функции нормального распределения

Наиболее часто для проверки согласия с нормальным законом применяются критерий Колмогорова-Смирнова и критерий Шапиро-Уилка.

Критерий Колмогорова позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р < 0,05, то данное эмпирическое распределение существенно отличается от нормального, а если р > 0,05, то делают вывод о приблизительном соответствии данного эмпирического распределения нормальному

Критерий Шапиро – Уилка основан на отношении оптимальной оценки дисперсии к ее обычной оценке. Применение критерия требует специальных таблиц с коэффициентами. Поэтому для числа наблюдений больше 2000, этот критерий неприменим (в этом случае можно применить критерий Колмогорова, не имеющий ограничения по объему). Но при объеме выборки, не превышающем 50, мощность критерия Шапиро-Уилка выше мощности критерия Колмогорова

Генеральная и выборочная совокупности

Генеральной совокупностью называют множество всех объектов, обладающих изучаемым признаком.

Число объектов генеральной совокупности называют объемом генеральной совокупности.

Пример 1. Изучается уровень лейкоцитов у сотрудников некоторого предприятия. Генеральной совокупностью в данном случае будут все сотрудники данного предприятия.

Выборкой или выборочной совокупностью называют множество объектов, отобранных случайным образом из генеральной совокупности для изучения.

Объемом выборки.

Репрезентативность - это показатель того, насколько хорошо выборка отражает основные свойства той генеральной совокупности, частью которой является

Прежде, чем выполнить любой эксперимент, необходимо

Прежде, чем выполнить любой эксперимент, необходимо

Четко сформулировать его задачи;
определить экспериментальную гипотезу;
выбрать соответствующий статистический метод, наиболее эффективный для решения поставленных в исследовании задач

Тип организации эксперимента – являются выборки зависимыми или независимыми

Независимые

Например, измерения каких-либо параметров в двух разных группах, одна из которых получала препарат А, а другая – препарат В.

Зависимык

Например, измерения каких-либо параметров в одной и той же группе: первый раз – до начала лечения, второй раз – после окончания курса лечения

Вид закона распределения исследуемой случайной величины

Параметрические критерии основаны на конкретном виде распределения изучаемой случайной величины

Непараметрические критерии не базируются на предположении о виде распределения изучаемой величины и используют непосредственно выборочные данные, а не параметры выборки.

Проверка гипотез

Проверка гипотез

Критерий Фишера -Снедекора

Гипотезы при использовании критерия Фишера-Снедекора выдвигаются следующим образом

H0 - генеральные дисперсии равны

Если в результате проверки нулевую гипотезу отвергаем, то генеральные дисперсии не равны, выборочные дисперсии различаются значимо.

Если нет оснований отвергать нулевую гипотезу, то генеральные дисперсии равны, выборочные дисперсии различаются не значимо

H1 - генеральные дисперсии не равны

Критерий Стьюдента

роверка данной гипотезы осуществляется с помощью t-критерия Стьюдента. Критерий используется чаще всего в том случае, когда нужно проверить влияние какого-либо фактора на исследуемую величину

Проверка данной гипотезы осуществляется с помощью t-критерия Стьюдента. Критерий используется чаще всего в том случае, когда нужно проверить влияние какого-либо фактора на исследуемую величину

Если различие между средними не значимо, то фактор не оказывает влияния на исследуемую величину, различие между выборочными средними обусловлено воздействием случайных причин

Статистическая гипотеза

При проверке статистических гипотез всегда выдвигается две гипотезы:

Нулевая (или основная) – гипотеза о сходстве, обозначается H0.
Альтернативная (или конкурирующая) – гипотеза о различиях, обозначается H1. Она может быть ненаправленной и направленной.

статистический критерий

Наблюдаемое значение критерия – это значение критерия, вычисленное по выборке, то есть зависящее от выборочных значений.

В результате проверки статистических гипотез возможны четыре случая:

В результате проверки статистических гипотез возможны четыре случая:

гипотеза Н0 верна и не отвергается

гипотеза Н0 верна, но отвергается

гипотеза Н0 не верна и отвергается

гипотеза Н0 не верна, но не отвергается

Допустимая область – это область значений критерия, которые не противоречат нулевой гипотезе.

Критическая область – это область значений критерия, при которых отвергается нулевая гипотеза и принимается конкурирующая.

Критические точки – это точки, отделяющие критическую область от допустимой

При использовании статистических пакетов, мы получаем таблицу результатов, в которой обязательно содержится наблюдаемое значение критерия и p - уровень. p - уровень представляет собой вероятность ошибки, которую мы сделаем, если отвергнем нулевую гипотезу. Поэтому решение принимается следующим образом

если p - уровень меньше 0,05, то нулевую гипотезу отвергаем, принимаем конкурирующую (при уровне значимости 0,05)
если p - уровень больше 0,05, то нет оснований отвергать нулевую гипотезу

Нормальный закон распределения

Нормальный закон распределения

График нормального распределения имеет вид колоколообразной кривой и описывается формулой

График нормального распределения имеет вид колоколообразной кривой и описывается формулой

Нормальное распределение зависит от двух параметров а и σ, где а – математическое ожидание (оно характеризует центр распределения, в статистике – это среднее значение параметра в генеральной совокупности, оно примерно равно выборочной средней), σ – среднеквадратическое отклонение (оно характеризует разброс, примерно равно стандартному отклонению, полученному по выборке)

График плотности распределения вероятностей выглядит следующим образом

График плотности распределения вероятностей выглядит следующим образом