Статистические методы
Анализ выживаемости и многомерная статистика
Одномерный статистический анализ
Формирование статистической гипотезы
Нулевая гипотеза - Ho
Отсутствие различий между сравниваемыми выборками
Альтернативная гипотеза - Н1
Наличии различия между сравниваемыми выборками
Типы данных, их независимость и распределение
Критериев нормальности
Согласуется
Не согласуется
Независимость
Зависимые
Показатели АД, измеренные у пациентов в 9 часов утра и измеренные у них же в 5 часов вечера
Результаты этих измерений для каждого человека и в целом между выборками скорее всего будут коррелировать, поэтому они считаются парными
Независимые
Показатели АД в группе мужчин по сравнению с группой женщин: АД у мужчин не зависит от аналогичного показателя у женщин
Переменных в одной выборке не связаны со значениями переменных в другой, с которой производится сравнение
Описательная статистика
Размер выборки и статистическая мощность
Статистическая мощность
Вычисляется как 1 - β и означает вероятность сделать заключение о наличии различия, в то время как оно имеется на самом деле (т.е. получить «истинно положительный результат»)
Ошибки 1 и 2 типа
Статистическая достоверность (р)
Вероятность получения по крайне мере таких же или ещё больших отличий наблюдаемого от ожидаемого, чем в данной конкретной выборке, при условии, что выдвинутая гипотеза верна
Если выбран уровень значимости α=0,05, то все выборки, которые для выдвинутой гипотезы возвращают величину p≤0,05, отвергают эту гипотезу => H1
Выборки с величиной p>0,05 не дают оснований отвергнуть гипотезу => Ho
Демонстрация достоверности
Если доверительный интервал интересующего нас параметра в изучаемой группе «накрывает» значение среднего в группе сравнения, то априори следует вывод о том, что наблюдаемое различие является статистически недостоверным
Если среднее значение параметра в контрольной группе лежит вне доверительного интервала изучаемой группы, то скорее всего различие является достоверным
Выбор критерия
РАССМАТРИВАЕМ ТОЛЬКО ДЛЯ ОДНОЙ ВЫБОРКИ
Корреляционный и регрессионный анализ
Регрессионный - форму зависимости (насколько сильно изменяется переменная в ответ на изменение другой); определяются параметры прямой, которая наилучшим способом предсказывает значение одной переменной на основании значения другой согласно формуле:
y = a + bx,
где y - значение одной переменной, a – точка пересечения прямой с осью ординат (вертикальная ось, ось Y), b задает наклон линии, а х – значение другой переменной
Достоверность (значение р) отклонения наклона регрессионной прямой от 0 - оценка наличия значимой корреляции между двумя переменными
Если достоверность такого отклонения оказывается высокой (т.е. получено малое значение р для этого параметра), необходимо отказаться от линейного регрессионного анализа «сырых данных» и подумать над возможностью приведения их к линейности путем преобразования (например, извлечение квадратного корня, возведения в степень, логарифмирования или описания более сложной функцией)
Корреляционный - определяет характер взаимосвязи переменных (прямой или обратный); метод оценки линейных связей (общей пропорциональности) между переменными, т.е. насколько согласовано они меняются
Положительная
Если большие значения одной переменной имеют тенденцию к ассоциации с большими значениями другой переменной
Отрицательная
Если большие значения одной переменной ассоциированы с меньшими значениями другой переменной
Отсутствовать
При отсутствии корреляции нет никакой закономерности взаимосвязи одних показателей с другими
Коэффициент корреляции
Показателем согласованности между значениями двух переменных; является количественным, обозначается r, и имеет область значений от - 1 до + 1
r = 1 означает максимально сильную положительную линейную взаимосвязь между X и Y
r = - 1 означает максимальную отрицательную линейную взаимосвязь между X и Y
r = 0 означает отсутствие линейной взаимосвязи между X и Y
Чувствительность, специфичность и точность
Чувствительность определяется как доля пациентов действительно имеющих заболевание среди тех, у кого тест был положительным
Специфичность определяется как доля людей, не имеющих заболевания среди всех, у кого тест оказался отрицательным
Точность показывает долю «правильных срабатываний теста» среди всех обследованных и является совокупным показателем информативности теста
а - истинно положительный результат; б - ложноположительный результат; в - ложноотрицательный результат; г - истинно отрицательный результа
Чувствительность = а / (а+в)
Специфичность = г / (г+б)
Точность = (а+г) / (а+б+в+г)
Характеристической кривая
Показывает зависимость количества верно диагностированных положительных случаев от количества неверно диагностированных отрицательных случаев
Чем ближе проходит характеристическая кривая к значению (0;1) (идеальная чувствительность), тем выше эффективность теста. Наоборот, чем меньше кривая напоминает форму буквы «Г», т.е. чем ближе она проходит к диагонали графика ("бесполезный тест"), тем эффективность теста меньше
AUC (площадь под ней) - количественная оценка характеристической кривой.
AUC=0,9-1,0 – отличное качество
AUC=0,8-0,9 – высокое качество
AUC=0,7-0,8– хорошее качество
AUC=0,6-0,7– среднее качество
AUC=0,5-0,6– плохое (неудовлетворительное) качество.
Для того, чтобы новый диагностический метод заслужил признание, он должен продемонстрировать более высокие, чем «золотой» стандарт, значения чувствительности и специфичности
Методы анализа выживаемости
Изучение закономерности появления ожидаемого события у представителей наблюдаемой выборки во времени
Точкой отсчета может быть дата (час) выполнения процедуры, назначения лекарственного препарата, возраст на момент диагноза и т.п. Период времени от начального события (например, постановки диагноза) до итогового (летальный исход, рецидив, выздоровление) называется временем до события (time to event) или временем ожидания
Цензурированные данные - Данные, которые содержат неполную информацию; наблюдаемый параметр является временем до наступления события, а период наблюдения ограничен
Таблицы дожития
Один из наиболее традиционных методов исследования данных о выживаемости (происхождение интересующего нас события). В таблицах дожития время наступления события разбивается на интервалы, для каждого из которых определяется число и доля объектов:
а) у которых событие не произошло на момент начала данного интервала времени,
б) у которых событие произошло в течение данного интервала и
в) которые были изъяты или цензурированы на данном интервале.
Для получения надежных оценок основных показателей размер группы должен быть не менее 30
Число изучаемых объектов – число объектов, у которых событие не произошло на момент начала данного интервала времени минус половина числа объектов, которые были изъяты или цензурированы
Доля «умерших» - отношение числа объектов, у которых событие произошло в течение данного интервала, к числу изучаемых объектов на данном временном интервале
Доля выживших - единица минус доля «умерших»
Функция выживания (выживаемость) – кумулятивная доля объектов, событие у которых не произошло на момент начала определенного интервала времени; ее рассчитывают как произведение долей выживших на всех предыдущих интервалах
Плотность вероятности – оценка вероятности наступления события в каком-либо интервале; рассчитывается как отношение разности между значениями функции выживания на любом данном и последующем интервале к продолжительности данного интервала времени
Функция интенсивности представляет собой вероятность того, что на данном интервале произойдет событие у того объекта, у которого оно еще не произошло на момент начала этого интервала; вычисляется как отношение числа событий, происшедших в течение данного интервала, к числу объектов, у которых событие не произошло до момента времени, находящегося в середине этого интервала
Медиана ожидаемого времени жизни – точка на оси времени, в которой значение функции выживания равна 0,5; медиана ожидаемого времени жизни совпадает с точкой выживания 50% наблюдений только в том случае, если до этого момента времени цензурированных наблюдений не было. Аналогично через значения функции выживания можно определить и квартили (25-й и 75-й процентили) ожидаемого времени жизни
Метод Каплана-Мейера
Используется для оценки доли объектов наблюдения (пациентов), у которых событие не произошло (функция выживания, выживаемость) для любого момента времени в течение всего периода наблюдения; оценка функции выживания представляет собой произведение выживаемости в данный момент времени на выживаемость в следующий момент времени, когда событие произошло.
Для расчетов используется истинное количество объектов, у которых событие ещё не произошло в любой момент времени, для которого производится оценка
цензурированность данных может оказывать влияние на оценку функции выживаемости, в связи с чем метод Каплана-Мейера использует следующие предположения:
а) цензурированные объекты («выбывшие») имеют те же самые показатели выживаемости, как и те, которые продолжают наблюдаться (т.е. цензурирование не влияет на прогноз выживаемости);
б) оценки выживаемости одинаковы для объектов, включенных в исследование на более ранних или более поздних сроках;
в) событие происходит именно в анализируемый момент времени
Широко используются в клинических испытаниях, например, с целью оценки эффективности нового лекарственного препарата в изучаемой группе по сравнению с контрольной (получающей плацебо) группой
Когда у объекта наблюдения происходит ожидаемое событие, производится перерасчет пропорции оставшихся в исследовании объектов, у которых событие не произошло, что отображается «ступенькой» вниз на кривой
Лог-ранк тест
можно оценить общую выживаемость в двух и более группах за весь период наблюдения, принимает за нулевую гипотезу то, что выживаемость в сравниваемых группах пациентов не различается
Если кривые выживаемости вдруг пересекаются (например, при сравнении результатов хирургического лечения и тактики пассивного наблюдения прогрессирующей коронарной окклюзии), лог-ранк тест вообще не способен выявить различие. В связи с этим при выполнении анализа с помощью этого теста необходимо вначале представлить кривые выживания на графике.
Модель пропорциональных интенсивностей Кокса
В ее основе лежит метод множественной регрессии, и в качестве выходного параметра модель возвращает значение отношения рисков и его доверительный интервал. Отношение рисков - это оценка отношения интенсивностей (показателей, уровней, функции) риска в экспериментальной и контрольной группах, рассчитанные для любого момента времени наблюдения. Модель предполагает, что отношение рисков у членов экспериментальной и контрольной групп остаются неизменными в течение всего периода наблюдения
Данная модель позволяет включать в исследование всех интересующих нас пациентов, невзирая на цензурирование (частичную неполноту данных), поскольку модель использует базисное допущение о том, что выбывание пациентов происходит случайным образом и с одинаковой вероятностью как в изучаемой, так и в контрольной группе
Отношение рисков может показывать наличие положительного эффекта применения препарата в клиническом испытании (когда HR достоверно превышает 1), что действительно предполагает укорочение времени до выздоровления
Многомерный анализ
Для оценки одновременного влияния более чем одного фактора на результат; дает информацию о степени влиянии на исход каждой из (многих) переменных, а также об эффекте взаимодействия этих переменных между собой
Виды многомерного анализа
Множественная линейная регрессия
Используется для изучения изменения зависимой переменой (y) в ответ на различные значения других переменных (x1, x2, x3), которые представляют собой непрерывные (численные интервальные или относительные) переменные
Логистическая регрессия
Используется когда значение переменной результата является бинарным, таким как выживаемость (да/нет), развитие заболевания (да/нет), положительный результат диагностического теста (да/нет) и может включать одну или более независимых переменных
Модель пропорциональных интенсивностей Кокса
Оценивает шансы более раннего наступления события у членов изучаемой группы по сравнению с контрольной группой с помощью показателя отношения рисков (HR)
Включение независимых переменных в модель
Модель
Объясняющая - выяснение характера и степени влияния различных факторов на результат
Тщательный подбор переменных и их математической формы, является крайне важным
Прогностическая - определение вероятности происхождения события
Если созданная модель хорошо воспроизводится и эффективно работает на независимых массивах данных, то вопросы подбора и ревизии переменных в ней уже не являются актуальными. В прогностической модели наиболее важным является точность предсказания результата
Любая модель многомерного анализа должна включать как минимум один или несколько факторов риска и потенциальные мешающие факторы (конфаундеры)
В идеале в модель нужно включить все переменные, которые были определены с помощью теоретических рассуждений или установлены в предыдущих исследованиях как факторы риска или конфаундеры изучаемого исхода
С другой стороны, важным является не только включение в анализ всех потенциально важных переменных, но и исключение посторонних
Отбор
Для оптимизации количества переменных в модели
Прямого пошагового
Переменная, оказывающая наиболее сильное влияние на исход по результатам одномерного анализа, вводится первой, следом за ней добавляется переменная со следующим наиболее сильным влиянием и т.д. до тех пор, пока все переменные, влияющие на результат (с уровнем значимости, определенным исследователем; обычно в многомерном регрессионном анализе он устанавливается >90%, т.е. р<0,1) не будут включены в модель
Любая ранее введенная в модель переменная, которая перестает быть значимой при введении следующей переменой, последовательно исключается
Обратного пошагового удаления
Сначала включаются все переменные
Затем они последовательно удаляются, начиная с переменной, имеющей наиболее слабую ассоциацию с результатом. Удаление продолжается до тех пор, пока в модели не останутся только те переменные, которые достоверно влияют на исход
Наилучшего подмножества
Выбор путем подстановки такого набора переменных, которые наилучшим образом удовлетворяют условиям, определенным исследователем
Взаимодействие между переменными
Когда влияние фактора риска на исход (эффект) зависит от значения третьей синтетической переменной, составленной из двух исходных независимых переменных. При этом сама третья переменная не является независимым фактором риска или мешающей переменной
Для внесения эффекта взаимодействия в модель необходимо изначально иметь предположение о том, что переменные могут взаимодействовать. В противном случае начинается почти системный поиск взаимодействия путем разбиения групп на подгруппы, и чем больше ожидается взаимодействующих переменных, тем больше образуется подгрупп данных. Это может привести к тому, что в одной или нескольких из них взаимодействие будет обнаружено в силу случая (ошибка 1 типа)
Взаимодействие между переменными также называют эффектом модификации в том случае, если одна из них рассматривается как основная с содержательной точки зрения
Анализ качества модели
Для логистических регрессий предложено несколько статистических критериев согласия
Чаще применяется тест Хосмера-Лемешова
Для оценки эффективности множественной линейной регрессии используется уже известный из корреляционного анализа коэффициент детерминации r2
Отражает степень рассеяния результата, возникающего благодаря вкладу многих переменных
Значение r2 варьирует в пределах от 0 до 1 и чем ближе оно к 1, тем лучше модель описывает результат
Ввиду того, что в модель может входить несколько факторов риска, коэффициент рассчитывается с поправкой на их количество
О надежности объясняющих моделей можно судить по их воспроизводимости на других массивах данных
Если модель надежна, то и в независимом массиве данных в модель войдут те же факторы риска с коэффициентами близкими к тем, что наблюдались в оригинальной модели
Критерии согласия обычно используются для оценки эффективности объясняющих моделей
Для прогностических моделей рекомендуется более точная количественная оценка
Для ее получения рассчитываются такие показатели, как чувствительность, специфичность и точность для определенных пороговых условий. Исходя из значений чувствительности и специфичности, строится характеристическая кривая (ROC-кривая) по форме которой и по величине площади под которой (AUC) можно судить об удачности модели
Надежность прогностической модели также может быть проверена на независимых массивах данных, в которых она должна предсказывать вероятность исхода с высокой эффективностью