Статистические гипотезы.
Основной принцип статистической гипотезы: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.
Статистическая гипотеза - это предположение о виде неизвестного распределения или об его параметрах
Изменяемая величина имеет нормальное измерение
Генеральные средние двух изучаемых величин равны между собой
Генеральная средняя не превышает 10,5
Критерии согласия
При проверки статистических гипотез всегда выдвигаются две гипотезы
Нулевая (основная) - гипотеза о сходстве, обозначается как Ho
Альтернативная (конкурирующая) - гипотеза о различиях, обозначается как H1
Направленная
Ненаправленная
Параметрические критерии
Критерий согласия - это критерий, позволяющий оценить степень согласия наблюдаемого статистического распределения выборки с гипотетическим распределением
Наиболее часто для проверки согласия с нормальным законом применяются критерий Колмогорова-Смирнова и критерий Шапиро-Уилка
H1 - функция распределения изучаемой величины не соответствует функции нормального распределения
H0 - функция распределения изучаемой величины соответствует функции нормального распределения
Эмпирические частоты получают в результате опыта (наблюдения)
Теоретические частоты рассчитывают по формулам
Часто применяемые для проверки согласия с нормальным законом критерии:
Критерий Колмогорова-Смирнова
используется для проверки гипотезы Hо: "случайная величина X имеет распределение F(x)"
Критерий Шапиро-Уилка
используется для проверки гипотезы Hо: «случайная величина X распределена нормально»
Генеральная совокупность - называют множество всех объектов, обладающих изучаемым признаком.
Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя. Иногда генеральная совокупность — это всё взрослое население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты исследования. Например, женщины 10—89 лет, использующие крем для рук определённой марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного члена семьи.
Выборка или выборочная совокупность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом).
Характеристики выборки:
Качественная характеристика выборки — что именно мы выбираем и какие способы построения выборки мы для этого используем.
Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки.
Необходимость выборки:
Объект исследования очень обширный. Например, потребители продукции глобальной компании — огромное количество территориально разбросанных рынков.
Существует необходимость в сборе первичной информации.
Параметрический критерий - основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.).
Критерий Фишера -Снедекора, возникает при необходимости сравнить точность двух приборов или методик исследования, однородность (степень разброса признака в 2 группах). В качестве критерия используется случайная величина F, имеющая распределение Фишера – Снедекора (в случае истинности нулевой гипотезы ). F равна отношению большей из исправленных выборочных дисперсий к меньшей.
H0 - генеральные дисперсии равны
H1 - генеральные дисперсии не равны
Если в результате проверки нулевую гипотезу отвергаем, то генеральные дисперсии не равны, выборочные дисперсии различаются значимо.
Если нет оснований отвергать нулевую гипотезу, то генеральные дисперсии равны, выборочные дисперсии различаются не значимо.
Критерий Стьюдента. Проверка данной гипотезы осуществляется с помощью t-критерия Стьюдента. Критерий используется чаще всего в том случае, когда нужно проверить влияние какого-либо фактора на исследуемую величину. Гипотезы при использовании критерия Стьдента выдвигаются следующим образом:
H0 - генеральные средние равны
H1 - генеральные средние не равны Применение критерия Стьюдента возможно лишь тогда, когда
1) выборки извлечены из нормально распределенных генеральных совокупностей
2)генеральные дисперсии равны
Непараметрический критерий - базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения».
Тип организации эксперемента
Независимыми (или несвязными) Например, измерения каких-либо параметров в двух разных группах, одна из которых получала препарат А, а другая – препарат В.
Зависимыми (или связными) Например, измерения каких-либо параметров в одной и той же группе: первый раз – до начала лечения, второй раз – после окончания курса лечения.
Нормальный закон распределения. Для нормального распределения характерно совпадение величин средней арифметической, моды и медианы
Независимые выборки
Если гипотеза H0 отвергается и принимается гипотеза H1, то:
1)Генеральные средние не равны.
2)Выборочные средние различаются значимо.
3)Фактор влияет на исследуемую величину.
Если нет оснований отвергать гипотезу H0, то:
1)Генеральные средние равны.
2)Выборочные средние различаются незначимо.
3)Фактор не влияет на исследуемую величину.
Зависимые выборки. В зависимых выборках сравнение величин X и Y осуществляется с помощью величины d, являющейся разностью между величинами X и Y.
Статистические ошибки
Статистическая ошибка I рода
Нулевая гипотеза верна, но отвергается. Вероятность статистической ошибки I рода обозначают α и называют уровнем значимости. В биологических и медицинских исследованиях ее принимают равной 0,01 или 0,05.
Статистическая ошибка II рода
Нулевая гипотеза не верна, но не отвергается. Вероятность статистической ошибки II рода обозначают β. Величина 1 - β называется мощностью критерия. Мощность критерия – это способность выявлять различия или отклонять нулевую гипотезу, если она не верна.