Пропорции, критерии хи-квадрат и отношения шансов

08.09.2021

Качественные данные также называются номинальными или категориальными, и они появляются, когда мы классифицируем предметы по двум или более категориям. Например, мы можем классифицировать состояние пациента как «плохое», «удовлетворительное», «хорошее» или «отличное» или дать в качестве вариантов ответа на вопрос «да», «нет» или «не знаю». Это отличается от количественных данных, где у нас есть числа, которые представляют величину чего-то, например, артериального давления. Хотя на самом деле они могут быть записаны как числовые коды 1, 2, 3 или 4, номер имеет какое-либо числовое значение. Мы могли бы закодировать «да» как 1 и «нет» как 2, или «да» как 2 и «нет» как 1, и это не повлияло бы на анализ. Категориальные переменные всего с двумя категориями, такими как «живые» или «мертвые» или «женский 'или' мужской 'называются дихотомическими, атрибутивными,квантовыйили бинарный.

Для анализа таких данных было разработано множество статистических методов. В этой лекции я рассмотрю критерий хи-квадрат для ассоциации, точный критерий Фишера, критерий хи-квадрат для определения тенденции, отношения рисков, относительного риска или отношения ставок, отношения шансов и количества, необходимого для лечения.

Таблицы непредвиденных обстоятельств

Таблица сопряженностиявляется кросс-табулирование двух категориальных переменных. Например, в таблице 1 приведены данные исследования приемлемости теста на антитела к ВИЧ в женских консультациях (Meadows et al., 1994).

Данные расположены в строках и столбцах. Часть таблицы, определяемая определенной строкой и столбцом, называется ячейкойтаблицы. Цифры в таблице непредвиденных обстоятельств - это частоты. Число в первой ячейке таблицы 1, равное 71, говорит нам, что в этом исследовании участвовала 71 женщина, которые были замужем и прошли тест на ВИЧ. Я также добавил итоги для каждой строки и столбца и для всей таблицы. Итоги по строкам и столбцам также называются предельными итогами, общее количество всех наблюдений в таблице называется общим итогом. Такая перекрестная таблица частот также называется таблицей перекрестной классификации.. Мы часто ссылаемся на таблицы, используя размер таблицы. Таблицу 1 можно назвать таблицей «4 на 2» или «4 × 2», потому что в ней четыре строки и два столбца. Иногда можно услышать общий термин « rcтаблица», где rобозначает количество строк, а c- количество столбцов.

Тест хи-квадрат

Мы часто хотим проверить нулевую гипотезу об отсутствии связи между двумя переменными. Мы используем термин « ассоциация» для обозначения отношений между двумя категориальными переменными. Если выборка большая, мы можем сделать это с помощью теста хи-квадрат. Если образец небольшой, мы должны использовать другой тест, точный тест Фишера, описанный ниже.

Наша нулевая гипотеза состоит в том, что между двумя переменными нет никакой связи. Альтернативная гипотеза состоит в том, что существует ассоциация определенного типа.

Критерий хи-квадрат рассчитывает частоты, которые мы ожидали бы увидеть в ячейках, если бы не было абсолютно никакой связи. Это работает вот так. Что касается данных теста на ВИЧ, доля тех, кто согласился пройти тест, составляет 134/788. Мы ожидаем, что из 486 замужних женщин 486 ± 134/788 = 82,6 согласны принять тест, если нулевая гипотеза об отсутствии ассоциации верна. Точно так же процент отказавшихся от теста = 654/788. Мы ожидаем, что из 899 486 замужних женщин 486 ± 654/788 = 403,4 согласны принять тест, если нулевая гипотеза верна. Обратите внимание, что 82,6 + 403,4 = 788. Сумма ожидаемых частот равна сумме наблюдаемых частот.

Точно так же из 222 сожителей мы ожидаем, что 222 ± 134/788 = 37,8 согласны пройти тест на ВИЧ, если нулевая гипотеза верна. Мы также ожидаем, что 222 ± 654/788 = 184,2 будут отвергающими, если бы нулевая гипотеза была верна. Обратите внимание, что 37,8 + 184,2 = 222, сумма второй строки. Мы продолжаем таким образом, пока не получим ожидаемые частоты для всех ячеек таблицы (Таблица 2).

Обратите внимание, что 82,6 + 37,8 + 8,5 + 5,1 = 134,0 и 403,4 + 184,2 + 41,5 + 24,9 = 654,0. Наблюдаемые и ожидаемые частоты имеют одинаковые итоги в строках и столбцах.

Мы видим, что для каждой ячейки таблицы мы рассчитали ожидаемую частоту на

итого по строке - итоговый / итоговый по столбцу

Это были бы ожидаемые частоты, если бы нулевая гипотеза была верна. Здесь слово «ожидаемый» используется для обозначения «среднего количества наблюдений, которые мы ожидаем в ячейке, если мы будем повторять это исследование снова и снова». Это не означает, что мы ожидаем увидеть 82,6 замужних женщины, которые согласятся пройти тестирование на ВИЧ. К сожалению, статистики часто так мучают язык. Чтобы быть действительно педантичным, это ожидаемая частота, если нулевая гипотеза верна, а итоговые значения строк и столбцов остались прежними.

Критерий хи-квадрат для таблицы непредвиденных обстоятельств использует различия между наблюдаемой и ожидаемой частотами. Чем больше эти различия, тем больше у нас будет доказательств того, что две переменные связаны. Мы не можем просто сложить эти различия, потому что они всегда равны нулю. Вместо этого мы делаем то, что делали при вычислении стандартного отклонения, мы возводим их в квадрат. Другая проблема заключается в том, что чем больше частоты, тем больше возможная разница между наблюдаемым и ожидаемым. Мы могли бы ожидать, что большие выборки будут давать большие различия, чем маленькие выборки, просто случайно. Оказывается, мы можем учесть это, разделив квадрат разности на ожидаемую частоту, чтобы получить:

(обервед - ожидалось) 2 / ожидалось

Точные причины этого выбора довольно абстрактны и математичны, поэтому я не буду вдаваться в них здесь, но Бланд (2000) объясняет их. Мы работаем с этим (наблюдаемым - ожидаемым) 2 / ожидаемым результатом для каждой ячейки таблицы и складываем их вместе. Обычно я не даю формулы в этом курсе, но мы будем сталкиваться с этой довольно часто, и она довольно проста, поэтому я включил ее, чтобы было легче увидеть, что происходит. Для таблицы 2 эта сумма составляет 9,15. Это будет наша тестовая статистика (неделя 3). Следуя обычной формулировке теста значимости, он должен следовать некоторому известному распределению, если нулевая гипотеза верна. Он следует за распределением хи-квадрат.. (См. Bland, 2000, чтобы узнать больше об этом и о том, почему это правда.) «Хи-квадрат» часто пишется вместо греческой буквы «чи», произносимой «ки» как «воздушный змей». Сумма (наблюдаемое - ожидаемое) 2 / ожидаемое называется статистикой хи-квадрат, иногда обозначаемой как X 2. Я дам распределению хи-квадрат заглавную букву "С", чтобы отличить его от статистики хи-квадрат.

Распределение хи-квадрат очень похоже на t-распределение, с которым оно тесно связано. Это семейство распределений, и конкретный член семейства определяется одним параметром, называемым степенями свободы. На рисунке 1 показаны несколько членов семьи хи-квадрат.

Рисунок 1. Некоторые члены семьи распределения хи-квадрат.

d

Когда степени свободы малы, распределение хи-квадрат сильно смещено вправо, а по мере увеличения степеней свободы оно становится более симметричным. В конце концов, это становится похоже на нормальное распределение. Мы ожидаем, что это произойдет, потому что это получается путем сложения множества вещей вместе, и это имеет тенденцию генерировать нормальное распределение по мере увеличения количества добавленных вещей. Подобно t-распределению и нормальному распределению, не существует простой формулы для площади под кривой хи-квадрат и, следовательно, для вероятности превышения любого заданного значения. Мы можем использовать таблицу вероятностей, тщательно рассчитанную с помощью (очень точного) математического приближения. В таблице 3 показаны некоторые процентные точки для распределения хи-квадрат с различными степенями свободы.

Рис. 2. Верхняя 5% точка распределения хи-квадрат с 4 степенями свободы, как показано в таблице 3

d.

Конечно, компьютеры очень хороши для кропотливых вычислений, и на практике мы просто позволяем компьютерной программе делать всю работу и каждый раз вычислять вероятность за нас. Одна полезная особенность распределения хи-квадрат заключается в том, что его среднее значение равно его степеням свободы. Таким образом, если наблюдаемое значение статистики хи-квадрат аналогично или меньше его степеней свободы, данные будут соответствовать проверяемой нулевой гипотезе.

Мы решаем, какой член семейства хи-квадрат применим к нашей таблице, вычисляя степени свободы. Для таблицы непредвиденных обстоятельств степени свободы задаются следующим образом:

(количество строк - 1) (количество столбцов - 1).

Опять же, я не буду вдаваться в причины этого, см. Bland (2000), если вам интересно. Но кое-что из логики можно увидеть, посмотрев, сколько ячеек таблицы можно заполнить, прежде чем можно будет вычислить оставшиеся ячейки на основе итоговых значений строк и столбцов. Мы можем начинать заполнять ячейки первой строки, пока не дойдем до последней ячейки. Это должно быть исправлено, потому что все частоты ячеек должны быть суммированы в итоговую сумму строки. Таким образом, количество свободных вариантов в первой строке равно количеству столбцов минус один. Таким же образом мы можем заполнить ячейки во второй строке, получив еще одно «количество столбцов минус один». Продолжаем делать это, пока не дойдем до последнего ряда. Теперь эти частоты будут фиксированными, потому что частоты в каждом столбце должны быть суммированы с итоговыми значениями столбца. Для всех строк, кроме одной, у нас есть «количество столбцов минус один»свободный выбор. Следовательно, общее количество свободных вариантов равно «количеству столбцов минус один», умноженному на «количество строк минус один». Это дает нам степени свободы для стола.

Точный критерий Фишера для этой таблицы дает P = 0,004. Критерий хи-квадрат дает хи-квадрат = 8,87, 1 df, P = 0,0029. Они довольно разные, хотя оба приводят к одному и тому же выводу. Что выбрать? Я думаю, что всегда предпочтительнее точный тест Фишера, потому что он точен. Так зачем нужны два теста? Метод Фишера может быть выполнен только для таблиц с более чем двумя строками или столбцами или с большим количеством предметов, если у вас есть современный компьютер. Поведение исследователей меняется медленно, учебники всегда устаревают, а практика требует много времени, чтобы измениться. Вы увидите множество тестов хи-квадрат. Есть много других ситуаций, когда используется статистика хи-квадрат, и принципы будут во многом такими же. Я рассматриваю один ниже в рамках теста хи-квадрат на наличие тренда.

Не все статистики согласятся с тем, что точный критерий Фишера верен, и это является предметом периодических оживленных споров среди статистиков (да, это действительно происходит). Я могу быть не прав. Вы услышите точный критерий Фишера, описанный как «консервативный», потому что он дает более высокие значения P, чем критерий хи-квадрат. Я думаю, что верно обратное, что тесты хи-квадрат дают значения P, которые слишком малы и являются «антиконсервативными». Это имеет значение только при малых частотах,

Есть два разных способа выполнить точный тест Фишера. Вышеупомянутый тест был проведен с использованием статистической программы Stata. Я тоже пробовал это с помощью собственной программы Clinstat. Это дало 0,0049. Это не потому, что я плохой программист, а потому, что есть два разных способа вычислить вероятность Фишера. Когда тест был впервые разработан, он предназначался строго для таблиц 2 на 2. Вы можете провести односторонний тест, суммируя вероятность для вашей наблюдаемой таблицы и всех наиболее экстремальных в том же направлении. Для таблицы 4 это означало увеличение числа в первой ячейке (35) (36, 37 и т. Д. До 54) и вычисление вероятности для каждой из них. Эти вероятности будут добавлены. Это дало односторонний тест. Чтобы сделать двусторонний тест, было непонятно, какие таблицы использовать, нет ничего симметричного.Первоначально было сделано удвоение одностороннего значения P. Это то, что делает Clinstat. Это могло бы дать вероятности больше 1.0, но они были бы установлены равными 1.0. Когда вы переходите к таблице с более чем двумя строками или столбцами, направление эффекта ничего не значит, и все тесты будут двусторонними. Способ, которым Stata делает это, - единственный способ для больших таблиц, и поэтому я теперь рекомендую его как лучший способ. Были написаны программы, которые делают и то, и другое, и позволяют вам принимать собственные решения. Я бы просто сделал то, что делает ваше программное обеспечение, но вы всегда должны указывать, какую программу вы используете, чтобы любой, кто действительно хочет знать, мог узнать, какой метод был использован.Когда вы переходите к таблице с более чем двумя строками или столбцами, направление эффекта ничего не значит, и все тесты будут двусторонними. Способ, которым Stata делает это, - единственный способ для больших таблиц, и поэтому я теперь рекомендую его как лучший способ. Были написаны программы, которые делают и то, и другое, и позволяют вам принимать собственные решения. Я бы просто сделал то, что делает ваше программное обеспечение, но вы всегда должны указывать, какую программу вы используете, чтобы любой, кто действительно хочет знать, мог узнать, какой метод был использован.Когда вы переходите к таблице с более чем двумя строками или столбцами, направление эффекта ничего не значит, и все тесты будут двусторонними. Способ, которым Stata делает это, - единственный способ для больших таблиц, поэтому теперь я рекомендую его как лучший способ. Были написаны программы, которые делают и то, и другое, и позволяют вам принимать собственные решения. Я бы просто сделал то, что делает ваше программное обеспечение, но вы всегда должны указывать, какую программу вы используете, чтобы любой, кто действительно хочет знать, мог узнать, какой метод был использован.но вы всегда должны указывать, какую программу вы используете, чтобы любой, кто действительно хочет знать, мог узнать, какой метод был использован.но вы всегда должны указывать, какую программу вы используете, чтобы любой, кто действительно хочет знать, мог узнать, какой метод был использован.

Даже с компьютерами, доступными на момент написания, очень большие таблицы могут их победить. Существует так много вероятностей, которые нужно вычислить, что они не могут сохранить их все и не могут вычислить их до летних каникул. Некоторые программы, такие как SPSS, предлагают вариант Монте-Карло. Это означает, что таблицы генерируются случайным образом, создается выборка всех возможных таблиц и рассчитываются их вероятности. Это используется для оценки значения P. Если у вас недостаточно симуляций, вы можете получить немного другой ответ, если сделаете это снова, поэтому не забудьте попросить несколько тысяч.

Поправка Йетса

Для таблиц с малыми ожидаемыми частотами критерий хи-квадрат дает меньшие вероятности, чем точный критерий Фишера. Если вы верите в точную вероятность, то критерий хи-квадрат неверен. Йейтс ввел модифицированный критерий хи-квадрат для таблицы 2 на 2, который очень близко аппроксимирует точную вероятность Фишера. Он работает, делая разницу между наблюдаемой и ожидаемой частотой ближе к нулю на 0,5 перед возведением в квадрат. Работает очень хорошо. Для таблицы 4 точный критерий Фишера дает P = 0,0049, а обычный критерий хи-квадрат дает статистику хи-квадрат = 8,87, df = 1, P = 0,0029. Критерий хи-квадрат с поправкой Йейтса дает меньшую статистику хи-квадрат = 7,84, df = 1, P = 0,0051. Это очень близко к 0,0049, полученному в точном тесте.Это замечательно хорошая модификация теста хи-квадрат, и его гораздо проще вычислить без компьютера, чем точный тест.

Поправку Йетса также называют поправкой на непрерывность теста хи-квадрат. Это связано с тем, что в нем учитывается тот факт, что для таблицы с небольшим количеством наблюдений существует лишь небольшое количество возможных значений для статистики хи-квадрат. Мы аппроксимируем дискретное распределение тестовой статистики непрерывным распределением хи-квадрат, и поправка Йетса улучшает это приближение.

Даже поправка Йетса делает расчет без компьютера более трудоемким, чем простой критерий хи-квадрат, и его рекомендовали только тогда, когда хотя бы одна ожидаемая частота была меньше пяти. Это соглашение продолжилось, когда люди стали регулярно выполнять эти вычисления с помощью компьютеров. Однако, если поправка Йетса лучше для небольших таблиц, она должна быть лучше для всех таблиц.

Поправка Йетса сейчас устарела, поскольку мы всегда можем провести точный тест, и мы начнем видеть ее реже.

Тест хи-квадрат на тренд

В таблице 5 приведены данные исследования охраны материнства в Шотландии.

Мы могли бы провести тест хи-квадрат для ассоциации по этой таблице, который даст хи-квадрат = 11,36, df = 3, P = 0,01. Многие исследователи поступили бы именно так. Hundley et al.(2002), однако, не сообщили, что хи-квадрат = 9,33, df = 1, P = 0,002. Они использовали другой тест, называемый критерием хи-квадрат для определения тренда.

В таблице 5 категории «0–4», «5–9», «10–14» и «15 или более» имеют четкий порядок, в отличие от категорий семейного положения в таблице 1. Критерий хи-квадрат для ассоциация не принимает во внимание порядок категорий. Мы получили бы ту же статистику хи-квадрат, как бы мы ни перетасовывали строки таблицы 1. Так и должно быть, мы не хотели бы рассматривать «женат», «проживает с партнером», «холост» и «разведен / овдовел». / separated 'как значимое ранжирование, потому что это не так. Если мы сначала напишем «одиночную» строку, мы хотим получить такое же значение P. Когда мы упорядочили категории, мы должны использовать информацию, которую нам дает упорядочивание.

В тесте хи-квадрат для тренда мы не только используем порядок категорий, но и присваиваем им числовое значение. Hundley et al.(2002) присвоили значения 1, 2, 3 и 4 категориям «0–4», «5–9», «10–14», «15 или более». Это разумно, поскольку эти категории основаны на количестве посещений, и каждая категория, кроме последней, охватывает один и тот же диапазон посещений. 5. Часто у нас нет основной качественной переменной, например, когда состояние субъекта классифицируется как «плохое». , «хорошо», «удовлетворительно» или «отлично». Они явно расположены в возрастающем порядке, но наше решение относительно того, какое числовое значение приложить, является произвольным, это вопрос суждения. Когда у нас нет причин принимать иное решение, мы обычно делаем интервалы равными, то есть оцениваем их 1, 2, 3,и т.п.

Хи-квадрат для статистики тренда всегда меньше, чем хи-квадрат для статистики ассоциации. В этом примере это 9,33 по сравнению с 11,36. Однако он имеет меньше степеней свободы и, если действительно есть тренд, будет иметь меньшее значение P. Следовательно, это более эффективный тест, когда категории упорядочены. Разница между двумя статистическими данными хи-квадрат также следует распределению хи-квадрат, если нулевая гипотеза верна, со степенями свободы, равными разнице между двумя степенями свободы. Для примера у нас есть хи-квадрат = 11,36 - 9,33 = 2,03, со степенями свободы 3 - 1 = 2, P = 0,4. Это называется хи-квадрат относительно тренда и проверяет, есть ли доказательства какой-либо связи в таблице, которая не была бы объяснена линейным трендом. В этом примереданные явно согласуются с нулевой гипотезой об отсутствии нелинейной связи.

Многие качественные переменные с более чем двумя категориями имеют упорядоченные категории и должны быть проанализированы каким-либо образом с учетом упорядочения. Формулы, используемые в этом тесте, могут немного отличаться, и разные программы могут давать несколько разные ответы. Другой подход, который используют некоторые программы, - это ранговая корреляция, в частности тау Кендалла b. Stata делает это и для таблицы 5 дает tau-b Кендалла = -0,1031, SE = 0,032. Если мы используем это для проверки значимости, мы получим P = 0,001, что немного более значимо, чем критерий хи-квадрат для тренда в этом примере. Это может быть связано с тем, что категория, представляющая нижний крайний предел, «0–4», имеет больший процент в «традиционной модели», чем следующая категория, «5–9», хотя и после того, как процентные значения возрастут.Поскольку в этой категории всего несколько субъектов, этого недостаточно, чтобы вызвать значимую ассоциацию, не объясняемую тенденцией.

В отношении Таблицы 5 стоит отметить еще два момента. Во-первых, я привел процентные значения для столбцов, используя в качестве знаменателя количество женщин в категории посещений. Логичнее было бы взять их за ряды, используя в качестве знаменателя количество женщин в данном типе единицы, поскольку мы хотим сравнивать именно типы единиц. Это то, что Hundley et al.(2002) сделал. Мои проценты были рассчитаны, чтобы выявить тенденцию по всей таблице. Во-вторых, было 6 единиц традиционных и 14 единиц новой модели. Таким образом, женщины не были действительно независимыми, поскольку можно было ожидать, что количество посещений будет связано с практикой в ​​конкретном отделении. Предположение теста было нарушено. Возможно, было бы лучше оценить среднее число для каждой единицы и сравнить их с методом двух выборок для непрерывных данных. Часто существует множество возможных способов анализа данных, каждый из которых может иметь преимущества и недостатки по сравнению с другими.

Другой пример: Tappin et al.(2005) провели пробу мотивационного опроса акушерок, чтобы помочь беременным курильщицам бросить курить или отказаться от курения. Таблица 6 показывает изменение самооценки курения в зависимости от группы лечения.

Авторы сообщили о хи-квадрат для тренда = 0,01, P = 0,98, нелинейного хи-квадрат = 11,26, P = 0,004 (2 df). В целом существует значимая взаимосвязь, хи-квадрат = 11,26, 3 df, P = 0,01. Все значения хи-квадрат относятся к трендам. Связь есть, но это не линейный тренд. Доля женщин в группе мотивационного интервью снижается с «бросить» до «сократить», затем увеличивается до «такой же», затем падает до «больше».

На рисунке 3 показаны два теста на тенденцию. Ни одна из них не показывает полностью плавной тенденции в одном направлении, но для дородовых посещений три большие группы явно демонстрируют тенденцию к росту. Нет четкого направления исследования курения.

Рисунок 3. Два анализа тенденций



(площадь круга пропорциональна количеству субъектов в этой курящей группе). D

Соотношение риска

Теперь обратимся к методам только для таблиц 2 на 2. Рассмотрим исследование перевязки венозной язвы ног, показанное в таблице 4. Мы хотим оценить размер эффекта от лечения. Мы уже рассмотрели разницу между двумя пропорциями, для которых мы можем найти стандартную ошибку, большой доверительный интервал выборки с использованием стандартной ошибки и малый доверительный интервал выборки с использованием точных вероятностей. В таблице 4 эти две пропорции составляют 0,538 и 0,284, или 53,8% и 28,4%, для эластичного и неэластичного бинтов соответственно. Разница составляет 0,538 - 0,284 = 0,254 или 53,8% - 28,4% = 25,4 процентных пункта.

Мы также можем провести проверку нулевой гипотезы о том, что пропорции заживления одинаковы для популяций пациентов с язвой, леченных эластичными и неэластичными повязками. Это можно сделать, используя стандартную ошибку для проверки нулевой гипотезы. Этот тест дает статистику теста, которая следует стандартному нормальному распределению, если нулевая гипотеза верна. Для таблицы 4 это z = 2,98, что имеет двустороннюю вероятность P = 0,0029. Обычно мы представляем это как P = 0,003. Это в точности эквивалентно критерию хи-квадрат для ассоциации и всегда дает идентичное значение P. Статистика теста здесь - квадратный корень из хи-квадрат.

Доля исцеляющих называется рискомисцеления для этой популяции. Это звучит довольно странно, поскольку риск обычно относится к чему-то плохому, а исцеление - это хорошо, но поскольку мы используем одни и те же методы для анализа пропорций, испытывающих желаемые события, и тех пропорций, которые переживают нежелательные события, мы используем один и тот же термин для обоих. Разница называется разницей риска, абсолютной разницей рискаили абсолютным снижением риска.

Мы можем взглянуть на разницу в риске между двумя группами лечения по-разному. Отношение риска заживления в группе с эластичной повязкой к риску в группе с неэластичной повязкой называется отношением рисков. Для таблицы 4 коэффициент риска = 0,538 / 0,284 = 1,89. Отношение рисков также называется относительным рискоми отношением ставок, и все они могут быть сокращены до ОР.

Рассчитав нашу оценку эффекта, нам нужен доверительный интервал для него. Статистически довольно сложно иметь дело с соотношениями. Поскольку коэффициент риска - это коэффициент, он имеет очень неудобное распределение. Вариации, которые делают знаменатель меньше, оказывают гораздо большее влияние на соотношение, чем те, которые увеличивают знаменатель, и мы получаем неравномерное распределение. Мы занимаемся этим с помощью логарифмов (см. Лекцию о преобразованиях). Взятие логарифма отношения дает нам разницу между журналами двух чисел. Если мы возьмем логарифм отношения скоростей, у нас будет что-то, что можно найти путем сложения и вычитания логарифмических частот. Распределение становится приблизительно нормальным и, если частоты не малы, имеет простую стандартную ошибку.

Для таблицы 4 коэффициент логарифмического риска равен log e (RR) = 0,6412. Его стандартная ошибка составляет 0,2256, и поэтому мы можем найти 95% доверительный интервал для log e (RR) с помощью

0,6412 - 1,96 ± 0,2256 до 0,6412 + 1,96 ± 0,2256

= 0,1990 до 1,0834.

Большинство из нас не думают легко в терминах логарифмов, поэтому мы преобразуем это обратно в естественный масштаб с помощью антилогарифма или экспоненты: 95% ДИ для RR = exp (0,1990) до exp (1,0834) = от 1,22 до 2,95. Таким образом, по нашим оценкам, процент выздоровевших с использованием эластичного бинта в 1,22–2,95 раза больше, чем процент тех, кто вылечит с помощью неэластичного бинта. Хотя у нас другой доверительный интервал для отношения рисков, мы используем точно такое же значение P, как и раньше.

Отношение рисков не находится в середине доверительного интервала, в отличие от разницы рисков. Доверительный интервал симметричен в логарифмической шкале, а не в натуральной шкале.

Эти доверительные интервалы представляют собой большие выборочные аппроксимации. Есть несколько лучших, которые используются для малых частот. Хорошим ориентиром является то, что если все четыре частоты превышают пять, метод большой выборки будет в порядке. У нас возникают проблемы, когда одна из частот равна нулю, поскольку относительный риск может быть равен нулю или вообще не может быть рассчитан. Оценить очень сложно, но мы можем найти верхний или нижний предел, даже если мы не можем оценить RR.

Отношения шансов

  • Риск = число переживающих событие, деленное на число тех, кто мог.
  • Коэффициенты = количество переживающих событие, деленное на количество тех, у кого не было события.

Другой способ взглянуть на это: риск = 0,538 означает, что на каждого пролеченного человека выздоравливает 0,538 человек, или на каждые 100 человек выздоравливает 53,8 человека. Коэффициент = 1,17 означает, что на каждого человека, который не лечит, выздоравливает 1,17 человека, или на каждые 100 человек, которые не исцеляются, выздоравливает 117 человек.

Другой способ определить шансы - это вероятность события, деленная на единицу, минус вероятность события. Следовательно, вероятность исцеления составляет 0,538 / (1 - 0,538) = 1,17.

Отношение шансов- это вероятность заживления с учетом эластичных повязок, деленная на вероятность заживления с учетом неэластичных повязок. Как мы видели, шансы на выздоровление с учетом эластичных бинтов = 35/30 = 1,17. Точно так же шансы на исцеление с неэластичными повязками = 19/48 = 0,40.

Отношение шансов = (35/30) / (19/48) = 1,17 / 0,40 = 2,95.

На каждого человека, который не лечит, в 2,95 раза больше людей будут лечить эластичными повязками, чем неэластичными.

«Отношение шансов» часто сокращается до « ИЛИ». Как и RR, OR имеет неудобное распределение, и мы оцениваем доверительный интервал таким же образом. Мы используем логарифмическое отношение шансов. Когда мы это делаем, распределение становится приблизительно нормальным и, если частоты не малы, имеет простую стандартную ошибку.

Как обычно, мы не будем вдаваться в подробности того, как это было рассчитано, поскольку мы ожидаем, что любой, кто хочет провести статистический анализ, будет использовать компьютер, но Bland (2000) дает подробности. Мы находим 95% доверительный интервал для log e (OR), используя стандартную ошибку 1,96 с помощью обычного метода большой выборки:

1,0809 - 1,96 ± 0,3679 до 1,0809 + 1,96 ± 0,3679

= 0,3598 до 1,8020.

Чтобы найти 95% доверительный интервал для самого отношения шансов, мы сглаживаем эти ограничения:

95% ДИ для OR = exp (0,3598) до exp (1,8020) = 1,43-6,06.

Следовательно, наше расчетное отношение шансов составляет OR = 2,95, 95% ДИ = 1,43–6,06.

Что касается RR, OR не находится в середине своего доверительного интервала. Интервал симметричен в логарифмической шкале, а не в натуральной шкале.

Одна из замечательных особенностей отношения шансов заключается в том, что не имеет значения, каким образом мы это делаем. Мы можем найти отношение шансов для лечения эластичной повязкой при условии заживления. 35 пациентов вылечились и наложили эластичную повязку по сравнению с 19 пациентами, излечившимися с помощью неэластичной повязки, поэтому шансы на получение эластичной повязки для излечившихся составляли 35/19. Точно так же вероятность наложения эластичной повязки для тех, кто не зажил, составляла 30/48. Следовательно

Отношение шансов для лечения: OR (35/19) / (30/48) = 0,95, как и раньше.

Обе эти версии отношения шансов одинаковы:

(35/30) / (19/48) = (35/19) / (30/48) = (35,48) / (30,19) = 0,95

Таким образом, обе версии отношения шансов = (35,48) / (30,19). Мы также называем это отношением перекрестных произведений, потому что числитель - это частота верхней левой ячейки, умноженная на нижнюю правую, а знаменатель - это частота верхней правой ячейки, умноженная на нижнюю левую.

Изменение порядка строк или столбцов меняет отношение шансов на противоположное. В Таблице 7 показаны данные Таблицы 4 с обратным порядком столбцов.

Мы можем рассчитать отношение шансов незаживления данной эластичной повязки из соотношения перекрестных продуктов в этой таблице: OR = (30/35) / (48/19) = 0,339 = 1 / 2,95. Так что это одно из вероятностей исцеления. Фактически, существует только два возможных отношения шансов для таблицы 2 на 2, отражающих направления, в которых мы могли бы смотреть на взаимосвязь. В логарифмической шкале они равны и противоположны: log e (2,95) = 1,082 и log e (0,339) = -1,082.

При малых частотах с соотношением шансов возникают те же проблемы, что и с относительными рисками.

использованная литература

Бланд М. (2000) Введение в медицинскую статистику, 3-е издание.Издательство Оксфордского университета.

Каллам М.Дж., Харпер Д.Р., Дейл Дж.Дж., Браун Д., Гибсон Б., Прескотт Р.Дж., Резюме Ракли. (1992) Испытание заживления язвы ноги в Лотиан-Форт-Вэлли, часть 1: эластичные и неэластичные бинты при лечении хронических язв на ногах. Флебология7: 136-41.

Флетчер А., Каллум Н., Шелдон Т.А. (1997) Систематический обзор компрессионного лечения венозных язв ног. Британский медицинский журнал315: 576-580.

Hundley V, Penney G, Fitzmaurice A, van Teijlinen E, Graham E. (2002) Сравнение данных, полученных от поставщиков услуг и пользователей услуг для оценки качества ухода за беременными. Акушерство18, с. 126-135.

Мидоуз Дж., Дженкинсон С., Каталан Дж. (1994) Кто решает пройти тест на антитела к ВИЧ в антинатальной клинике? Акушерство10, 44-48.

Northeast ADR, Layer GT, Wilson NM, Browse NL, Burnand KG. (1990) Повышенная компрессия ускоряет заживление венозной язвы. Венозный форум Королевского общества медицины. Лондон: Королевское медицинское общество.

Эта страница поддерживается Мартином Бландом.

Последнее обновление: 10 сентября 2009 г.

Еще новости