Sample Mind Map

Plus de détails

Статистические гипотезы. Критерии согласия. Параметрические критерии

par Юраш Вадим

моя пробная

par Александра Вышедко

Статистические гипотезы

par Раушания Хусаинова

карта

par Dochkin Vyacheslav

Анализ выживаемости и многомерная статистика

Многомерный анализ.Методы многомерного анализа (англ. multivariate или multivariable analysis) разработаны для оценки одновременного влияния более чем одного фактора на результат (исход)

Анализ качества модели

Для логистических регрессий предложено несколько статистических критериев согласия (goodness-of-fit test), каждый из которых имеет свои достоинства и недостатки. Чаще применяется тест Хосмера-Лемешова (Hosmer-Lemeshow test). Критерии согласия обычно используются для оценки эффективности объясняющих моделей. О надежности объясняющих моделей можно судить по их воспроизводимости на других массивах данных. Если модель надежна, то и в независимом массиве данных в модель войдут те же факторы риска с коэффициентами близкими к тем, что наблюдались в оригинальной модели.

Включение независимых переменных в модель

Метод наилучшего подмножества подразумевает выбор путем подстановки такого набора переменных, которые наилучшим образом удовлетворяют условиям, определенным исследователем. При автоматизированном подходе к выбору переменных может получиться так, что не все основные и мешающие переменные окажутся в модели, или в модели могут отсутствовать наиболее значимые клинические показатели. Поэтому после создания модели в автоматизированном режиме от исследователя требуется ее критическая оценка на адекватность.

Взаимодействие между переменными

О взаимодействии между переменными (interactions) в эффекте говорят, когда влияние фактора риска на исход (эффект) зависит от значения третьей синтетической переменной, составленной из двух исходных независимых переменных.

Виды многомерного анализа

модель пропорциональных интенсивностей Кокса (Cox proportional hazards model)

множественная логистическая регрессия (multiple logistic regression)

множественная линейная регрессия (multiple linear regression)

Методы анализа выживаемости.Под методами оценки выживаемости (survival) понимается изучение закономерности появления ожидаемого события у представителей наблюдаемой выборки во времени.

Лог-ранк тест

С помощью лог-ранк теста (логарифмического рангового теста) можно оценить общую выживаемость в двух и более группах за весь период наблюдения, что является важным отличием от умозрительного сравнения показателей выживаемости в любой момент времени.

Модель пропорциональных интенсивностей Кокса

Модель Кокса (Cox Proportional Hazards Model), часто называемая в литературе «Пропорциональная модель Кокса», является наиболее используемым в современных публикациях и рекомендуемым инструментом анализа данных выживаемости. В ее основе лежит метод множественной регрессии (см. раздел 2.2.), и в качестве выходного параметра модель возвращает значение отношения рисков и его доверительный интервал. Отношение рисков (hazard ratio, HR) - это оценка отношения интенсивностей (показателей, уровней, функции) риска в экспериментальной и контрольной группах, рассчитанные для любого момента времени наблюдения.

Метод Каплана-Мейера используется для оценки доли объектов наблюдения (пациентов), у которых событие не произошло (функция выживания, выживаемость) для любого момента времени в течение всего периода наблюдения.

Таблицы дожития – один из наиболее традиционных методов исследования данных о выживаемости (происхождение интересующего нас события). В таблицах дожития время наступления события разбивается на интервалы, для каждого из которых определяется число и доля объектов:

которые были изъяты или цензурированы на данном интервале

у которых событие произошло в течение данного интервала

у которых событие не произошло на момент начала данного интервала времени

Данные, которые содержат неполную информацию, называют цензурированными (censored).

Наиболее распространенными описательными методами исследования цензурированных данных являются построение таблиц дожития (mortality table) и метод Каплана-Мейера (Kaplan-Meier method)

Главная тема

Одномерный статистический анализ

1.5. Статистическая достоверность

Для демонстрации достоверности различия часто используется наглядный метод доверительных интервалов

Показатель достоверности различий обозначается р (probability, в англоязычной литературе встречается обозначение Р или P). Величиной р (или «пи-величина», англ. «Р-value») для конкретной выборки называют вероятность получения по крайне мере таких же или ещё больших отличий наблюдаемого от ожидаемого, чем в данной конкретной выборке, при условии, что выдвинутая гипотеза верна. Величина p меняется от выборки к выборке, т.е. является случайной величиной на множестве выборок (причём, с равномерным распределением на интервале 0 - 1).

1.6. Выбор одномерного статистического теста (критерия)

Параметрическая статистика

Для сравнения независимой переменной в более чем двух выборках может выполняться дисперсионный анализ (ANalysis Of Variance, ANOVA).

используется для анализа непрерывных (численных) переменных, значения которых распределены нормально.

При неуверенности в одинаковых дисперсиях (стандартных отклонениях) выборок используется модифицированный t-тест Уэлча (Welch’s t-test), но он применим только к независимым выборкам (непарный тест).

односторонний

двусторонний (двунаправленный, англ. two-tailed) означает, что поиск различий будет производиться в обе стороны: для увеличения показателей и для их уменьшения.

Непараметрическая статистика

Непараметрические методы анализа применяются как к непрерывным, так и к дискретным данным.

Номинативные переменные

Для независимых бинарных данных обычно используются методы таблиц сопряжения (англ. contingency tables). Сравнительный анализ проводится чаще всего с помощью точного теста Фишера (англ. Fisher’s exact test) или хиквадрат (χ2) теста (англ. chi-square test; или «хи-квадрат Пирсона», англ. Pearson’s chisquare).

отношение шансов (англ. odds ratio, OR) и вычисляется как (А*Г)/ (Б*В). Отношение шансов используется, чтобы оценить насколько велики шансы положительных и отрицательных исходов

Если номинативные данные являются зависимыми, используется тест МакНемара (McNemar test), который представляет собой модификацию хи-квадрат теста для парных или соотнесенных данных.

Непрерывные переменные

тест знаковых рангов Вилкоксона (Wilcoxon signedrank)

тест Крускала-Уоллиса (Kruskal-Wallis)

U тест Манна-Уитни (Mann-Whitney U)

зависит от:

распределение параметрическое (нормальное) или непараметрическое (отличное от нормального)

количество сравниваемых групп

данные зависимые или независимые

тип данных (непрерывные или дискретные)

1.7. Корреляционный и регрессионный анализ

Линейная регрессия и линейная корреляция – сходные, но не идентичные методы анализа.

Линейный регрессионный анализ проводится, если корреляционный анализ выявил взаимосвязь между переменными.

Корреляционный анализ определяет характер взаимосвязи переменных (прямой или обратный), а регрессионный - форму зависимости (насколько сильно изменяется переменная в ответ на изменение другой)

Если распределение значений отличается от нормального или в силу каких-то причин это невозможно оценить, то можно воспользоваться непараметрической корреляцией Спирмана, с помощью которой также можно рассчитать коэффициент корреляции r (англ. Spearman r)

коэффициент корреляции (correlation coefficient). Этот коэффициент является количественным, обозначается r (Pearson r), и имеет область значений от - 1 до + 1. r = 1 означает максимально сильную положительную линейную взаимосвязь между X и Y; r = - 1 означает максимальную отрицательную линейную взаимосвязь между X и Y; r = 0 означает отсутствие линейной взаимосвязи между X и Y.

Корреляция Пирсона (обычно просто «корреляция») между переменными может быть положительной, отрицательной или вовсе отсутствовать.

1.8. Чувствительность, специфичность и точность

Специфичность определяется как доля людей, не имеющих заболевания среди всех, у кого тест оказался отрицательным

Точность показывает долю «правильных срабатываний теста» среди всех обследованных и является совокупным показателем информативности теста.

Чувствительность определяется как доля пациентов действительно имеющих заболевание среди тех, у кого тест был положительным.

Количественную оценку характеристической кривой можно провести, рассчитав площадь под ней (англ. Area Under Curve, AUC)

AUC=0,9-1,0 – отличное качество AUC=0,8-0,9 – высокое качество AUC=0,7-0,8– хорошее качество AUC=0,6-0,7– среднее качество AUC=0,5-0,6– плохое (неудовлетворительное) качество.

Исходя из значений чувствительности и специфичности, рекомендуется построение характеристической кривой (ROC-кривая; англ. Receiver Operating Characteristic (ROC) curve), которая показывает зависимость количества верно диагностированных положительных случаев от количества неверно диагностированных отрицательных случаев

Высокочувствительный диагностический тест – тот, который дает наибольшее число положительных результатов при фактическом наличии заболевания. С клинической точки зрения нужно понимать, что высокочувствительный тест может отличаться гипердиагностикой, зато позволяет минимизировать риск пропустить заболевание.

1.4. Размер выборки и статистическая мощность

Таблица 1. Типы ошибок и статистическая мощность исследования Результаты проверки Истинный, но неизвестный характер взаимодействия гипотезы Гипотеза Ho не верна Гипотеза Ho верна Отвергнуть гипотезу Ho Корректное решение (достаточная статистическая мощность) Ошибка 1 типа (α) Принять гипотезу Ho Ошибка 2 типа (β) Корректное решение

Статистическая мощность (statistical power) вычисляется как 1 - β и означает вероятность сделать заключение о наличии различия, в то время как оно имеется на самом деле (т.е. получить «истинно положительный результат»).

1.3. Описательная статистика

среднее (mean), который вычисляется путем деления суммы значений переменной на количество значений и характеризует «центральное положение» количественной переменной.

Стандартная ошибка (среднего) (англ. standard error, SE, иногда standard error mean, SEM) является оценкой возможного отличия между значением среднего в анализируемой выборке, и истинным средним для всей популяции

Доверительный интервал (англ. confidence interval, CI) – диапазон значений, область, в которой с определенным уровнем надежности (или доверия) содержится истинное значение параметра (например, среднего)

Медиана (median) – значение, которое занимает среднее положение среди точек данных, разбивая выборку на две равные части

Стандартное отклонение (standard deviation, SD) отражает изменчивость (разброс, вариацию) значений переменной и оценивает степень их отличия от среднего.

1.2. Типы данных, их независимость и распределение

Независимость (англ. independence) данных предполагает, что значения переменных в одной выборке не связаны со значениями переменных в другой, с которой производится сравнение.

Оценка соответствия распределения данных гауссовому выполняется в статистических программах с помощью критериев нормальности (например, КолмогороваСмирнова).

типы переменных,возможные зависимости между ними и формы их распределений

1.1. Формирование статистической гипотезы

Если гипотеза не верна, то принимается альтернативная гипотеза (Н1) о наличии различия между группами

Если гипотеза верна - наблюдаемое отличается от ожидаемого лишь случайным образом, а именно в соответствии с вероятностным законом этой гипотезы.

Нулевая гипотеза (обозначается Ho) предполагает отсутствие различий (корреляции, связи) между сравниваемыми выборками.