Статистические ошибки
Статистическая ошибка II рода
Нулевая гипотеза не верна, но не отвергается. Вероятность статистической ошибки II рода обозначают β. Величина 1 - β называется мощностью критерия. Мощность критерия – это способность выявлять различия или отклонять нулевую гипотезу, если она не верна.
Статистическая ошибка I рода
Нулевая гипотеза верна, но отвергается. Вероятность статистической ошибки I рода обозначают α и называют уровнем значимости. В биологических и медицинских исследованиях ее принимают равной 0,01 или 0,05.
Зависимые выборки. В зависимых выборках сравнение величин X и Y осуществляется с помощью величины d, являющейся разностью между величинами X и Y.
Независимые выборки
Если нет оснований отвергать гипотезу H0, то:
1)Генеральные средние равны.
2)Выборочные средние различаются незначимо.
3)Фактор не влияет на исследуемую величину.
Если гипотеза H0 отвергается и принимается гипотеза H1, то:
1)Генеральные средние не равны.
2)Выборочные средние различаются значимо.
3)Фактор влияет на исследуемую величину.
Нормальный закон распределения. Для нормального распределения характерно совпадение величин средней арифметической, моды и медианы
Если в результате исследования возникает предположение, что изучаемая величина может иметь нормальное распределение, то это предположение необходимо проверить. Для этого используются так называемые критерии согласия.
Тип организации эксперемента
Зависимыми (или связными) Например, измерения каких-либо параметров в одной и той же группе: первый раз – до начала лечения, второй раз – после окончания курса лечения.
Независимыми (или несвязными) Например, измерения каких-либо параметров в двух разных группах, одна из которых получала препарат А, а другая – препарат В.
Непараметрический критерий - базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения».
Параметрический критерий - основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.).
Критерий Стьюдента. Проверка данной гипотезы осуществляется с помощью t-критерия Стьюдента. Критерий используется чаще всего в том случае, когда нужно проверить влияние какого-либо фактора на исследуемую величину. Гипотезы при использовании критерия Стьдента выдвигаются следующим образом:
H0 - генеральные средние равны
H1 - генеральные средние не равны Применение критерия Стьюдента возможно лишь тогда, когда
1) выборки извлечены из нормально распределенных генеральных совокупностей
2)генеральные дисперсии равны
Критерий Фишера -Снедекора, возникает при необходимости сравнить точность двух приборов или методик исследования, однородность (степень разброса признака в 2 группах). В качестве критерия используется случайная величина F, имеющая распределение Фишера – Снедекора (в случае истинности нулевой гипотезы ). F равна отношению большей из исправленных выборочных дисперсий к меньшей.
Если в результате проверки нулевую гипотезу отвергаем, то генеральные дисперсии не равны, выборочные дисперсии различаются значимо.
Если нет оснований отвергать нулевую гипотезу, то генеральные дисперсии равны, выборочные дисперсии различаются не значимо.
H1 - генеральные дисперсии не равны
H0 - генеральные дисперсии равны
Выборка или выборочная совокупность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом).
Необходимость выборки:
Существует необходимость в сборе первичной информации.
Объект исследования очень обширный. Например, потребители продукции глобальной компании — огромное количество территориально разбросанных рынков.
Характеристики выборки:
Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки.
Качественная характеристика выборки — что именно мы выбираем и какие способы построения выборки мы для этого используем.
Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя. Иногда генеральная совокупность — это всё взрослое население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объекты исследования. Например, женщины 10—89 лет, использующие крем для рук определённой марки не реже одного раза в неделю, и имеющие доход не ниже 5 тысяч рублей на одного члена семьи.
Генеральная совокупность - называют множество всех объектов, обладающих изучаемым признаком.
Часто применяемые для проверки согласия с нормальным законом критерии:
Критерий Шапиро-Уилка
используется для проверки гипотезы Hо: «случайная величина X распределена нормально»
Является одним наиболее эффективных критериев проверки нормальности.
Критерий Колмогорова-Смирнова
используется для проверки гипотезы Hо: "случайная величина X имеет распределение F(x)"
Теоретические частоты рассчитывают по формулам
Эмпирические частоты получают в результате опыта (наблюдения)
Критерий согласия - это критерий, позволяющий оценить степень согласия наблюдаемого статистического распределения выборки с гипотетическим распределением
H0 - функция распределения изучаемой величины соответствует функции нормального распределения
H1 - функция распределения изучаемой величины не соответствует функции нормального распределения
Наиболее часто для проверки согласия с нормальным законом применяются критерий Колмогорова-Смирнова и критерий Шапиро-Уилка
Статистические гипотезы.
Параметрические критерии
При проверки статистических гипотез всегда выдвигаются две гипотезы
Альтернативная (конкурирующая) - гипотеза о различиях, обозначается как H1
Ненаправленная
Направленная
Нулевая (основная) - гипотеза о сходстве, обозначается как Ho
И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза
.
Критерии согласия
Статистическая гипотеза - это предположение о виде неизвестного распределения или об его параметрах
Генеральная средняя не превышает 10,5
Генеральные средние двух изучаемых величин равны между собой
Изменяемая величина имеет нормальное измерение
Основной принцип статистической гипотезы: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.