Одномерный статистический анализ
1.1. Формирование статистической гипотезы
Если гипотеза верна - наблюдаемое отличается от ожидаемого лишь случайным образом, а именно в соответствии с вероятностным законом этой гипотезы.
Нулевая гипотеза (обозначается Ho) предполагает отсутствие различий (корреляции, связи) между сравниваемыми выборками.
Если гипотеза не верна, то принимается альтернативная гипотеза (Н1) о наличии различия между группами
1.2. Типы данных, их независимость и распределение
типы переменных,возможные зависимости между ними
и формы их распределений
Оценка соответствия распределения данных гауссовому выполняется в статистических программах с помощью критериев нормальности (например, КолмогороваСмирнова).
Независимость (англ. independence) данных предполагает, что значения переменных в одной выборке не связаны со значениями переменных в другой, с которой производится сравнение.
1.3. Описательная статистика
Стандартное отклонение (standard deviation, SD) отражает изменчивость (разброс, вариацию) значений переменной и оценивает степень их отличия от среднего.
Медиана (median) – значение, которое занимает среднее положение среди точек данных, разбивая выборку на две равные части
Доверительный интервал (англ. confidence interval, CI) – диапазон значений, область, в которой с определенным уровнем надежности (или доверия) содержится истинное значение параметра (например, среднего)
Стандартная ошибка (среднего) (англ. standard error, SE, иногда standard error mean, SEM) является оценкой возможного отличия между значением среднего в анализируемой выборке, и истинным средним для всей популяции
среднее (mean), который вычисляется путем деления суммы значений переменной на количество значений и характеризует «центральное положение» количественной переменной.
1.4. Размер выборки и статистическая мощность
Статистическая мощность (statistical power) вычисляется как 1 - β и означает вероятность сделать заключение о наличии различия, в то время как оно имеется на самом деле (т.е. получить «истинно положительный результат»).
Таблица 1. Типы ошибок и статистическая мощность исследования
Результаты проверки Истинный, но неизвестный характер взаимодействия
гипотезы
Гипотеза Ho не верна
Гипотеза Ho верна
Отвергнуть гипотезу Ho
Корректное решение
(достаточная статистическая мощность)
Ошибка 1 типа (α)
Принять гипотезу Ho
Ошибка 2 типа (β)
Корректное решение
1.8. Чувствительность, специфичность и точность
Высокочувствительный диагностический тест – тот, который дает наибольшее число положительных результатов при фактическом наличии заболевания. С клинической точки зрения нужно понимать, что высокочувствительный тест может отличаться гипердиагностикой, зато позволяет минимизировать риск пропустить заболевание.
Исходя из значений чувствительности и специфичности, рекомендуется построение характеристической кривой (ROC-кривая; англ. Receiver Operating Characteristic (ROC) curve), которая показывает зависимость количества верно диагностированных положительных случаев от количества неверно диагностированных отрицательных случаев
Количественную оценку характеристической кривой можно провести, рассчитав площадь под ней (англ. Area Under Curve, AUC)
AUC=0,9-1,0 – отличное качество
AUC=0,8-0,9 – высокое качество
AUC=0,7-0,8– хорошее качество
AUC=0,6-0,7– среднее качество
AUC=0,5-0,6– плохое (неудовлетворительное) качество.
Чувствительность определяется как доля пациентов действительно имеющих заболевание среди тех, у кого тест был положительным.
Точность показывает долю «правильных срабатываний теста» среди всех обследованных и является совокупным показателем информативности теста.
Специфичность определяется как доля людей, не имеющих заболевания среди всех, у кого тест оказался отрицательным
1.7. Корреляционный и регрессионный анализ
Корреляционный анализ определяет характер взаимосвязи переменных (прямой или обратный), а регрессионный - форму зависимости (насколько сильно изменяется переменная в ответ на изменение другой)
Корреляция Пирсона (обычно просто «корреляция») между переменными может быть положительной, отрицательной или вовсе отсутствовать.
коэффициент корреляции (correlation coefficient). Этот коэффициент является количественным, обозначается r (Pearson r), и имеет область значений от - 1 до + 1. r = 1 означает максимально сильную положительную линейную взаимосвязь между X и Y; r = - 1 означает максимальную отрицательную линейную взаимосвязь между X и Y; r = 0 означает отсутствие линейной взаимосвязи между X и Y.
Если распределение значений отличается от нормального или в силу каких-то причин это невозможно оценить, то можно воспользоваться непараметрической корреляцией Спирмана, с помощью которой также можно рассчитать коэффициент корреляции r (англ. Spearman r)
Линейная регрессия и линейная корреляция – сходные, но не идентичные методы анализа.
Линейный регрессионный анализ проводится, если корреляционный анализ выявил взаимосвязь между переменными.
1.6. Выбор одномерного статистического теста (критерия)
зависит от:
тип данных (непрерывные или дискретные)
данные зависимые или независимые
количество сравниваемых групп
распределение параметрическое (нормальное) или непараметрическое (отличное от нормального)
Непараметрическая статистика
Непрерывные переменные
U тест Манна-Уитни (Mann-Whitney U)
тест Крускала-Уоллиса (Kruskal-Wallis)
тест знаковых рангов Вилкоксона (Wilcoxon signedrank)
Номинативные переменные
Для независимых бинарных данных обычно используются методы таблиц сопряжения (англ. contingency tables). Сравнительный анализ проводится чаще всего с помощью точного теста Фишера (англ. Fisher’s exact test) или хиквадрат (χ2) теста (англ. chi-square test; или «хи-квадрат Пирсона», англ. Pearson’s chisquare).
Если номинативные данные являются зависимыми, используется тест МакНемара (McNemar test), который представляет собой модификацию хи-квадрат теста для парных или соотнесенных данных.
отношение шансов (англ. odds ratio, OR) и вычисляется как (А*Г)/ (Б*В). Отношение шансов используется, чтобы оценить насколько велики шансы положительных и отрицательных исходов
Непараметрические методы анализа применяются как к непрерывным, так и к дискретным данным.
Параметрическая статистика
используется для анализа непрерывных (численных) переменных, значения которых распределены нормально.
При неуверенности в одинаковых дисперсиях (стандартных отклонениях) выборок используется модифицированный t-тест Уэлча (Welch’s t-test), но он применим только к независимым выборкам (непарный тест).
двусторонний (двунаправленный, англ. two-tailed) означает, что поиск различий будет производиться в обе стороны: для увеличения показателей и для их уменьшения.
односторонний
Для сравнения независимой переменной в более чем двух выборках может выполняться дисперсионный анализ (ANalysis Of Variance, ANOVA).
1.5. Статистическая достоверность
Показатель достоверности различий обозначается р (probability, в англоязычной литературе встречается обозначение Р или P). Величиной р (или «пи-величина», англ. «Р-value») для конкретной выборки называют вероятность получения по крайне мере таких же или ещё больших отличий наблюдаемого от ожидаемого, чем в данной конкретной выборке, при условии, что выдвинутая гипотеза верна. Величина p меняется от выборки к выборке, т.е. является случайной величиной на множестве выборок (причём, с равномерным распределением на интервале 0 - 1).
Для демонстрации достоверности различия часто используется наглядный метод доверительных интервалов
Главная тема
Анализ выживаемости и многомерная статистика
Методы анализа выживаемости.Под методами оценки выживаемости (survival) понимается изучение закономерности появления ожидаемого события у представителей наблюдаемой выборки во времени.
Данные, которые содержат неполную информацию, называют цензурированными (censored).
Наиболее распространенными описательными методами исследования цензурированных данных являются построение таблиц дожития (mortality table) и метод Каплана-Мейера (Kaplan-Meier method)
Таблицы дожития – один из наиболее традиционных методов исследования данных о выживаемости (происхождение интересующего нас события). В таблицах дожития время наступления события разбивается на интервалы, для каждого из которых определяется число и доля объектов:
у которых событие не произошло на момент начала данного интервала времени
у которых событие произошло в течение данного интервала
которые были изъяты или цензурированы на данном интервале
Метод Каплана-Мейера используется для оценки доли объектов наблюдения (пациентов), у которых событие не произошло (функция выживания, выживаемость) для любого момента времени в течение всего периода наблюдения.
Модель пропорциональных интенсивностей Кокса
Модель Кокса (Cox Proportional Hazards Model), часто называемая в литературе «Пропорциональная модель Кокса», является наиболее используемым в современных публикациях и рекомендуемым инструментом анализа данных выживаемости. В ее основе лежит метод множественной регрессии (см. раздел 2.2.), и в качестве выходного параметра модель возвращает значение отношения рисков и его доверительный интервал. Отношение рисков (hazard ratio, HR) - это оценка отношения интенсивностей (показателей, уровней, функции) риска в экспериментальной и контрольной группах, рассчитанные для любого момента времени наблюдения.
Лог-ранк тест
С помощью лог-ранк теста (логарифмического рангового теста) можно оценить общую выживаемость в двух и более группах за весь период наблюдения, что является важным отличием от умозрительного сравнения показателей выживаемости в любой момент времени.
Многомерный анализ.Методы многомерного анализа (англ. multivariate или multivariable analysis) разработаны для оценки одновременного влияния более чем одного фактора на результат (исход)
Виды многомерного анализа
множественная линейная регрессия (multiple linear regression)
множественная логистическая регрессия (multiple logistic regression)
модель пропорциональных интенсивностей Кокса (Cox proportional hazards model)
Взаимодействие между переменными
О взаимодействии между переменными (interactions) в эффекте говорят, когда влияние фактора риска на исход (эффект) зависит от значения третьей синтетической переменной, составленной из двух исходных независимых переменных.
Включение независимых переменных в модель
Метод наилучшего подмножества подразумевает выбор путем подстановки такого набора переменных, которые наилучшим образом удовлетворяют условиям, определенным исследователем. При автоматизированном подходе к выбору переменных может получиться так, что не все основные и мешающие переменные окажутся в модели, или в модели могут отсутствовать наиболее значимые клинические показатели. Поэтому после создания модели в автоматизированном режиме от исследователя требуется ее критическая оценка на адекватность.
Анализ качества модели
Для логистических регрессий предложено несколько статистических критериев согласия (goodness-of-fit test), каждый из которых имеет свои достоинства и недостатки. Чаще применяется тест Хосмера-Лемешова (Hosmer-Lemeshow test). Критерии согласия обычно используются для оценки эффективности объясняющих моделей. О надежности объясняющих моделей можно судить по их воспроизводимости на других массивах данных. Если модель надежна, то и в независимом массиве данных в модель войдут те же факторы риска с коэффициентами близкими к тем, что наблюдались в оригинальной модели.