Почему матч? Изучение согласованных планов исследований случай-контроль с оценкой причинно-следственных связей *

08.09.2021

В сфере общественного здравоохранения обычно используются подходящие дизайны исследований «случай-контроль». Хотя сопоставление предназначено для устранения путаницы, основным потенциальным преимуществом сопоставления в исследованиях «случай-контроль» является повышение эффективности. Методы анализа сопоставленных исследований случай-контроль сосредоточены на использовании моделей условной логистической регрессии, которые обеспечивают условные, а не причинно-следственные оценки отношения шансов. В этой статье исследуется использование взвешенной целевой оценки максимального правдоподобия с целью получения предельных причинно-следственных эффектов в подобранных исследованиях по типу случай-контроль. Мы сравниваем использование взвешенной целевой оценки максимального правдоподобия в сопоставимых и несовпадающих планах, чтобы выяснить, какой план дает больше всего информации о предельном причинном эффекте.Процедуры требуют знания определенных вероятностей распространенности и ранее были описаны ван дер Лааном (2008). Во многих практических ситуациях, когда интересующим параметром является причинно-следственный эффект, исследователям может быть лучше использовать непревзойденный дизайн.

1. Введение

Индивидуально подобранные дизайны исследований случай-контроль часто можно найти в литературе по общественному здравоохранению и медицинской литературе, и условная логистическая регрессия является наиболее часто используемым инструментом для анализа этих исследований. Сопоставление предназначено для устранения путаницы, однако основным потенциальным преимуществом сопоставления в исследованиях «случай-контроль» является повышение эффективности. Следовательно, когда эти планы исследований действительно полезны? Учитывая все потенциальные недостатки, в том числе дополнительные затраты, дополнительное время для включения в исследование и повышенную систематическую ошибку, использование сопоставления в исследованиях методом случай-контроль требует тщательной оценки. Обсуждение преимуществ и недостатков сопоставления в литературе насчитывает более 40 лет.

В этой статье мы сосредотачиваемся на индивидуальном сопоставлении в исследованиях «случай-контроль», когда исследователь заинтересован в оценке предельного причинно-следственного эффекта и известны определенные вероятности распространенности. Наша процедура, впервые представленная ван дер Лааном (2008), «нацелена» на интересующий параметр, а не на распределение интересов, и поэтому уместно названа взвешенной целевой оценкой максимального правдоподобия, взвешенной по случай-контролю. Чтобы устранить систематическую ошибку, вызванную согласованным планом выборки «случай-контроль», этот метод основан на знании истинной вероятности распространенности q 0 ≡ P 0 * (Y = 1) и дополнительного значения q ¯ 0 (M) ≡ q 0 P 0 * (Y = 0 | M) P 0 * (Y = 1 | M), где M - соответствующая переменная. Для непревзойденных проектов знание только q 0 требуется для.

Схема взвешивания «случай-контроль» отображает методы оценки, разработанные для проспективной выборки, в методы для выборки-случай-контроль, и дает эффективные оценщики, когда эффективен ее предполагаемый аналог выборки. Таким образом, как согласованные, так и несогласованные процедуры являются двойными устойчивыми и локально эффективными: они работают хорошо, пока P 0 * (Y | A, W) или P 0 * (A | W) заданы правильно, согласованы, если любой из этих модели указаны правильно и эффективны, если обе правильно указаны. (Здесь Aпредставляет интерес, а If - вектор ковариат.) эффект. В этой статье не рассматривается сопоставление в когортных исследованиях, а основное внимание будет уделено исследованиям случай-контроль. Однако сопоставление в когортных исследованиях было кратко рассмотрено ван дер Лааном (2008), и применение наших методов в когортных исследованиях является областью будущих исследований.

2. Почему матч? Обзор литературы

Существует большое количество литературы, посвященной теме индивидуального сопоставления в исследованиях типа случай-контроль. В этом обзоре предпринята попытка охватить наиболее важные аспекты, и он ни в коем случае не является исчерпывающим.

2.1. Индивидуальный подбор в исследованиях случай-контроль

В индивидуально подобранном исследовании случай-контроль идентифицируется представляющая интерес совокупность, и случаи отбираются случайным образом или выбираются на основе определенных критериев включения. Хотя, как отмечают Ротман и Гренландия (1998), определение случая может неявно определять группу, представляющую интерес для случаев и контроля. Затем каждый из этих случаев сопоставляется с одним или несколькими элементами управления на основе переменной (или переменных), которые, как полагают,быть смущающим. В значительной части литературы по индивидуальному сопоставлению в исследованиях случай-контроль, особенно в более ранних текстах, эти схемы описываются как способ уменьшить путаницу при построении выборки. Ссылка на это сделана в: Miettinen (1970), Breslow et al. (1978), Бреслоу и Дэй (1980), Куппер и др. (1981), Шлессельман (1982), Коллетт (1991) и Костанца (1995), среди других. Однако несколько авторов (Breslow and Day, 1980; Kupper et al., 1981; Schlesselman, 1982; Rothman and Greenland, 1998; Vandenbroucke et al., 2007) указывают, что цель сопоставления - повысить эффективность исследования путем принуждения случайная и контрольная выборки должны иметь одинаковое распределение по смешивающим переменным. Ротман и Гренландия (1998) продолжают говорить, что, хотя сопоставление предназначено для контроля смешения, оно не может этого сделать в исследованиях типа случай-контроль,и, по сути, может вносить предвзятость. Костанца (1995) согласился с этим, заявив, что сопоставление искажающих факторов в исследованиях «случай-контроль» ничего не делает для устранения искажения, но часто вводит отрицательное искажение.

Таким образом, хотя в некоторой литературе цель сопоставления упоминается как повышение достоверности, более поздние публикации (Куппер и др., 1981; Ротман и Гренландия, 1998) продемонстрировали, что сопоставление оказывает большее влияние на эффективность, чем на достоверность. Согласованная выборка приводит к сбалансированному количеству наблюдений и контролей на всех уровнях выбранных совпадающих переменных. Этот баланс может уменьшить разброс интересующих параметров, что повышает статистическую эффективность. Исследование с случайно выбранной контрольной группой может дать некоторые страты с дисбалансом случаев и контроля. Однако важно добавить, что сопоставление в исследованиях случай-контроль может привести к повышению или снижению эффективности (Kupper et al., 1981; Rothman and Greenland, 1998). Это будет обсуждаться далее в следующих разделах.

Бреслоу и Дэй (1980) отмечают, что в исследованиях «случай-контроль» делается попытка повысить информативность каждого из субъектов исследования. Однако следует также отметить, что сопоставленные исследования не учитывают не только пул несогласованных контролей, но и информацию в каждой паре случай-контроль, согласующейся с воздействием. Кроме того, сопоставление оказывает существенное влияние на исследуемую выборку, в частности, оно создает такую ​​контрольную выборку, которая не является репрезентативной для воздействия в популяции или в популяции в целом. Эффект соответствующей переменной больше не может быть изучен напрямую, и частота воздействия в контрольной выборке будет смещена в сторону случаев (Rothman and Greenland, 1998). Сопоставление в исследованиях случай-контроль также не позволяет полностью контролировать переменную или переменные, используемые для сопоставления в целом.Это означает, что исследователи, реализующие согласованные проекты, должны выполнять согласованный или стратифицированный анализ (Seigel and Greenhouse, 1973; Schlesselman, 1982; Holland and Rubin, 1988; Rothman and Greenland, 1998; Rubin, 2006). Если несогласованный анализ выполняется на совпадающих данных, достоверность сравнения случай-контроль может быть снижена (Schlesselman, 1982).

2.2. Выбор переменной

Мы возвращаемся к предыдущему пункту, сделанному в этом обзоре индивидуально подобранных исследований случай-контроль: соответствующие переменные выбираются априори.на убеждении, что они противоречат взаимосвязи между воздействием и болезнью. Если элементы управления сопоставляются с наблюдениями на основе переменной, которая не является истинным конфаундером, это может повлиять на эффективность. Например, если соответствующая переменная не связана с заболеванием, но связана с воздействием, это увеличит дисперсию оценки по сравнению с несогласованным дизайном. Здесь сопоставление приводит к большему количеству пар конкордантный случай-контроль, которые не являются информативными для анализа, что приводит к увеличению дисперсии. Если соответствующая переменная связана только с заболеванием, часто также наблюдается потеря эффективности (Schlesselman, 1982). Если соответствующая переменная находится на причинном пути между болезнью и воздействием, то сопоставление будет способствовать смещению, которое невозможно устранить в анализе (Vandenbroucke et al., 2007).Соответствие переменной, связанной с воздействием, а не болезни, или переменной причинно-следственной связи считается типомпревосходство . Поэтому переменные для сопоставления следует выбирать очень тщательно, и следует учитывать только те, которые, как известно, связаны как с воздействием, так и с заболеванием. Количество совпадающих переменных также должно быть сокращено до минимально возможного. По мере увеличения числа совпадающих переменных, случаи и меры контроля будут становиться все более похожими в отношении воздействия, представляющего интерес, и исследование может дать ложный результат или не предоставить никакой информации (Breslow and Day, 1980). Кроме того, при сопоставлении более чем одной переменной соответствующие переменные не должны сильно коррелировать друг с другом (Schlesselman, 1982).

2.3. Подробнее об эффективности

Куппер и др. (1981) выполнили множество симуляций, чтобы продемонстрировать влияние согласования на эффективность. Они обнаружили, что в ситуациях, когда присутствует искажение, доверительные интервалы для сопоставленных исследований были меньше, чем для несопоставленных исследований, если только отношение шансов и интересующее воздействие не были большими. Однако доверительные интервалы для образцов со случайно выбранными контролями всегда были короче, если количество контролей было как минимум вдвое больше, чем в случаях. Это важный результат, поскольку эффективность часто преподносится как преимущество индивидуально подобранного дизайна исследования «случай-контроль». Помимо моделирования, Cochran (1953) часто цитируется как теоретическая статья, демонстрирующая эффективность согласованных проектов. Однако, как отмечает МакКинли (1977), результат Кокрана может вводить в заблуждение.Сравнение совпадающих и непревзойденных дизайнов исследований часто проводится с помощьюравные размеры выборки и отсутствие других методов ковариантной корректировки (например, регрессии). В согласованном дизайне элементы управления могут быть отброшены, если они не соответствуют конкретному случаю интересующей переменной или переменных. Множественные элементы управления могут быть отброшены для каждого случая, в зависимости от интересующих переменных (Freedman, 1950; Cochran and Chambers, 1965; McKinlay, 1977). Эти контроли должны быть включены в типичное исследование случай-контроль. Во многих случаях, если бы отброшенные контроли были доступны для отклонения в подобранном исследовании, они были бы доступны для несравнимого дизайна в том же исследовании (Billewicz, 1965; McKinlay, 1977). Следовательно, может быть более уместным сравнить эффективность сопоставленных исследований случай-контроль размера n с случайно выбранными исследованиями случай-контроль размера.n + количество отброшенных контролей . Кроме того, в этих случайно выбранных исследованиях случай-контроль следует использовать метод анализа для уменьшения систематической ошибки и дисперсии. Таким образом, результат Kupper et al. (1981) особенно важен, поскольку все случайно выбранные исследования случай-контроль, которые имели размер не менее 2n, имели более короткие доверительные интервалы, чем их сопоставленные аналоги размера n .

2.4. Тенденции

Gefeller et al. (1998) выполнили обзор литературы исследований случай-контроль, опубликованных между 1955 и 1994 годами в трех основных эпидемиологических журналах: American Journal of Epidemiology, International Journal of Epidemiology и Journal of Epidemiology and Community Health.. Они обнаружили, что среди этих журналов наблюдается тенденция к снижению процента опубликованных индивидуально подобранных исследований случай-контроль (71,7% в годы, предшествующие 1981 г., 65,5% в 1985 г., 46,9% в 1989 г. и 46,4% в 1994 г.). и возрастающий процент исследований с совпадающей частотой (5,0% в годы, предшествующие 1981 г., 9,1% в 1985 г., 16,3% в 1989 г. и 26,2% в 1994 г.). Интересно, что процент исследований случай-контроль, в которых не использовалось сопоставление, оставался относительно постоянным без очевидной тенденции (в среднем 29,3% и варьировался от 23,2% до 36,7%). К сожалению, они обнаружили существенные доказательства того, что индивидуально подобранные исследования выполнялись без соответствующего сопоставленного анализа: только 74% исследований 1994 года использовали условную логистическую регрессию, если логистическая регрессия была выбранным методом анализа.Более поздний анализ медицинской литературы в Medline, Rahman (2003) показал, что 5,3% индивидуально подобранных исследований случай-контроль использовали безусловную логистическую регрессию для тех, кто выбирал модели логистической регрессии. Обзор в Gefeller et al. (1998) указывает, что непревзойденные исследования случай-контроль, по крайней мере, в эпидемиологии, составляют меньшинство. Это следует поставить под сомнение, учитывая подавляющее большинство литературных источников, согласно которым сопоставление не всегда оправдано для дизайнов исследований методом случай-контроль.Это следует поставить под сомнение, учитывая подавляющее большинство литературных источников, согласно которым сопоставление не всегда оправдано для дизайнов исследований методом случай-контроль.Это следует поставить под сомнение, учитывая подавляющее большинство литературных источников, согласно которым сопоставление не всегда оправдано для дизайнов исследований методом случай-контроль.

2.5. Обсуждение обзора литературы

Консенсус в литературе указывает на то, что существует очень мало обстоятельств, при которых индивидуальное сопоставление действительно оправдано. Исследования «случай-контроль» с очень небольшим количеством случаев могут выиграть от индивидуального сопоставления, поскольку случайно выбранная контрольная группа даже из четко определенной представляющей интерес популяции может быть неинформативной по многим интересующим переменным (Schlesselman, 1982; Costanza, 1995). Индивидуальное соответствие переходит от полезного к необходимому, когда в исследование включаются такие переменные, как родство (Rothman and Greenland, 1998; Costanza, 1995). Многие авторы также называют сопоставление необходимым, когда исследователи ожидают, что распределение переменной сопоставления будет сильно отличаться между случаями и контрольными случаями. Возможно, именно эта причина привлекает многих исследователей к согласованному дизайну.возможно, без надлежащего рассмотрения недостатков или определения интересующей группы населения.

В литературе методологи подчеркивают, что вмешивающиеся факторы часто можно скорректировать в анализе, а не сопоставить в схемах «случай-контроль» (Schlesselman, 1982; Vandenbroucke et al., 2007). Разработка эффективных методов контроля смешения в анализах, возможно, способствовала уменьшению количества индивидуально подобранных дизайнов, но они все еще довольно распространены. Поэтому важно продолжать распространять среди исследователей значение индивидуально подобранного дизайна исследования случай-контроль, поскольку Ротман и Гренландия (1998) отмечают, что «люди совпадают по переменной (например, полу) просто потому, что это« ожидаемый результат ». 'и они могут потерять доверие из-за несоответствия ". Когда исследователи принимают решения по дизайну и анализу на основе таких соображений, их исследования могут пострадать.

Наш вклад в обширную литературу по индивидуальному сопоставлению для исследований случай-контроль будет уникальным. Мы сосредотачиваемся на сценариях, в которых исследователь заинтересован в оценке предельного причинно-следственного эффекта, параметра, который невозможно оценить с помощью условной логистической регрессии, и известны определенные вероятности распространенности. Таким образом, мы сравним использование взвешенной целевой оценки максимального правдоподобия в сопоставимых и несовпадающих планах, чтобы выяснить, какой план дает больше всего информации о предельном причинном эффекте.

3. Существующие методы

Методы на основе моделей для анализа сопоставленных исследований случай-контроль широко представлены в недавней литературе (Breslow et al., 1978; Holford et al., 1978; Breslow and Day, 1980; Greenland, 1981; Schlesselman, 1982; Holland and Rubin). , 1988; Беничу и Вахолдер, 1994; Ротман и Гренландия, 1998; Гренландия, 2004). И хотя это не единственный метод анализа для индивидуально подобранных исследований случай-контроль, преобладающим методом анализа является условная логистическая регрессия. Этот метод обеспечивает условную оценку отношения шансов заболеть с учетом интересующей экспозиции и исходных ковариат. Более подробно условная логистическая регрессия будет рассмотрена в подразделе ниже. Гренландия (1981) и Холланд и Рубин (1988) обсуждают другой метод, основанный на моделях: использование лог-линейных моделей для оценки предельного отношения шансов.Кроме того, Ротман и Гренландия (1998) и Гренландия (2004) демонстрируют использование стандартизации в исследованиях «случай-контроль», которые оценивают предельные эффекты с усреднением по совокупности или человеку-времени. Холланд и Рубин (1988) отмечают, что традиционная двусторонняя таблица и ее расширения обычно не дают причинно-следственных связей для сопоставленных исследований «случай-контроль». Однако все эти методы существенно отличаются от метода, который мы проиллюстрировали в этой статье, обсуждаемой ван дер Лааном (2008), поскольку наш метод представляет собой непараметрическую двойную робастную локально эффективную процедуру, которая обеспечивает оценку отношения предельных причинных шансов.Холланд и Рубин (1988) отмечают, что традиционная двусторонняя таблица и ее расширения, как правило, не дают причинно-следственных связей для сопоставленных исследований «случай-контроль». Однако все эти методы заметно отличаются от метода, который мы проиллюстрировали в этой статье, обсуждаемой ван дер Лааном (2008), поскольку наш метод представляет собой непараметрическую двойную робастную локально эффективную процедуру, которая обеспечивает оценку отношения предельных причинных шансов.Холланд и Рубин (1988) отмечают, что традиционная двусторонняя таблица и ее расширения обычно не дают причинно-следственных связей для сопоставленных исследований «случай-контроль». Однако все эти методы существенно отличаются от метода, который мы проиллюстрировали в этой статье, обсуждаемой ван дер Лааном (2008), поскольку наш метод представляет собой непараметрическую двойную робастную локально эффективную процедуру, которая обеспечивает оценку отношения предельных причинных шансов.

3.1. Условная логистическая регрессия

Модель логистической регрессии для сопоставленных исследований случай-контроль отличается от несопоставленных исследований тем, что она позволяет перехвату варьироваться среди сопоставленных единиц случаев и контролей. Соответствующая переменная не включена в модель (Breslow et al., 1978; Holford et al., 1978; Breslow and Day, 1980; Schlesselman, 1982). Если интересующим параметром является коэффициент перед воздействием A, использование согласованного дизайна исследования и условного логистического регрессионного анализа может привести к повышению эффективности по сравнению с несогласованным дизайном с логистическим регрессионным анализом. Важно отметить, что для того, чтобы оценить эффект воздействия А с помощью условной логистической регрессии, случай и контроль должны не согласовываться с А.. Кроме того, если информация для переменной отсутствует; для случая (или контроля) соответствующая контрольная информация (или случай) отбрасывается (Breslow and Day, 1980; Schlesselman, 1982). Эти два ограничения не встречаются в новой методологии взвешенной целевой оценки максимального правдоподобия случай-контроль для параметров причинно-следственных связей. Что еще более важно, если предельный причинный эффект является параметром, представляющим интерес, условная логистическая регрессия не может использоваться, поскольку она может только оценить условное отношение шансов.

4. Взвешенная целевая оценка максимального правдоподобия с контролем случая

4.1. Задний план

Мы определяем O * = (W, A, Y) ∼ P 0 * как экспериментальную единицу и соответствующее распределение P 0 *, представляющее интерес. P 0 * представляет популяцию, из которой будут взяты все случаи и контроли. Здесь O * состоит из исходных ковариат W, переменной воздействия A (называемой переменной «лечения» в проспективных исследованиях) и двоичного результата Y, который определяет статус случая или контроля. Если нас интересуют параметры предельного причинного эффекта, мы можем определить ψ 0 * = Ψ * (P 0 *) ∈ IR d для P 0 * ∈ M * как параметр причинного эффекта и определить разницу рисков, относительный риск, отношение шансов. следующим образом для двоичного экспонирования A ∈ :

Еще новости