INTRODUCCIÓN
Debido a su baja prevalencia (<5%) o por su latencia prolongada, muchos fenómenos en la naturaleza dificultan la identificación de sus factores de riesgo y su relación causal. Por tal motivo, se requiere de la aplicación de un diseño de estudio que les permita a los investigadores obtener resultados en un tiempo más corto.
Se ha observado que el diseño de casos y controles o también llamado “casos y testigos” o “casos y referentes”, solventa estas dificultades debido a que al ser un estudio epidemiológico, analítico y observacional, facilita la identificación de las causas que desarrollan un evento de interés, poniendo a prueba diferentes hipótesis propuestas por el investigador.1
Este diseño de estudio inicia con la selección de individuos que presentan la característica o el evento deseado a estudiar; los cuales son denominados como “casos” y son comparados con un grupo de participantes que no poseen dicha característica (controles), con la finalidad de identificar y analizar los factores de riesgo asociados al desarrollo del evento y calcular las probabilidades para que un sujeto presente el desenlace, generando de esta manera información de gran utilidad para la elaboración de estudios posteriores con diseños prospectivos.2,3
Una de las principales características de este diseño es que permite analizar varios factores al mismo tiempo, ya sean intrínsecos (edad, sexo, predisposición genética, etc.) o extrínsecos a los participantes (medio ambiente, fármacos, hábitos, entre otros), reduciendo el tiempo y costo de la realización del estudio.2
Para llevarse a cabo este diseño es necesario que el investigador identifique y seleccione a los participantes que constituirán el grupo de casos y a los controles, para que, posteriormente, busque en el pasado las características a los que estuvieron expuestos ambos grupos (factores de riesgo); por esta razón, los estudios de casos y controles son considerados como “retrospectivos”.4,5
Un ejemplo de este diseño fue el realizado en Alemania en 19626 en el que se identificó que la ingesta de talidomida durante el embarazo era causante de una malformación congénita irreversible llamada focomelia, cuya incidencia se incrementó en la década de los 60s. Para la realización de este estudio, los autores incluyeron a 112 casos de focomelia y los contrastaron con 188 niños sin esta malformación; observaron que del grupo de casos 90 mujeres habían consumido este medicamento, mientras que en el grupo control sólo dos mujeres consumieron dicho fármaco; lo cual permitió analizar su fuerza de asociación con la malformación congénita y generar cambios en las políticas sanitarias, prohibiendo su venta y distribución en las mujeres gestantes por el elevado riesgo para desarrollar malformaciones en sus productos.
Una estrategia empleada por algunos investigadores para facilitar la realización de estos estudios es utilizar la misma fuente de datos de un estudio de cohorte, a lo cual se le denominan estudios “híbridos” o “anidados a una cohorte”.7 Un ejemplo es el estudio publicado por Casagrande8 en el que en una cohorte de 2907 pacientes pediátricos con primera neoplasia antes de los 15 años, se anidó un estudio de casos y controles, definiendo como casos a 64 pacientes con segunda neoplasia maligna y como controles a 190 pacientes que no la desarrollaron.
En años recientes se han desarrollado algunas otras variantes al diseño de casos y controles, por lo cual, presentamos la siguiente información detallada para facilitar a los investigadores el entendimiento, análisis y correcta ejecución de estos estudios.
MÉTODOS
Selección de casos
Para realizar la selección de los casos es necesario asegurar que todos estos individuos verdaderamente presenten el desenlace de interés.9 Inicialmente se definen conceptual y operacionalmente los criterios diagnósticos para etiquetarlos correctamente; sin embargo, en ocasiones estos pueden ser subjetivos o poco claros, lo que facilita la existencia de falsos casos, generando sesgo de selección. Ante dicha problemática, una de las alternativas que utilizan los investigadores es separar a los participantes en dos estratos: aquellos constituidos por los casos comprobados o ciertos y aquellos como casos probables, sin importar el tiempo que tengan con el evento de interés.10,11
Selección de controles
Para garantizar una correcta comparación entre los participantes del estudio es necesario realizar una selección adecuada de los controles, mediante un ajuste de las características de los sujetos y su tipo de muestreo.
La forma más apropiada de la selección de los controles es considerarlos como una subpoblación de individuos que está en riesgo de desarrollar el evento, y de los cuales se puede asegurar con cierta certeza que, en caso de que desarrollaran el evento, serían incluidos en el estudio como participantes en el grupo de los casos.12
Para obtener una muestra representativa de la población su selección debe cumplir algunas consideraciones:
Los controles deben ser seleccionados de la misma fuente poblacional que los casos.
Todos los posibles controles deben de tener la misma probabilidad de ser elegidos en el estudio; lo cual puede llevarse a cabo mediante diferentes métodos probabilísticos (aleatorio simple, estratificado o por conglomerados).
Los controles deben compartir características con los individuos que conforman los casos con la finalidad de reducir factores confusores que pudieran modificar las comparaciones entre los grupos; para lo cual se utiliza una estrategia llamada pareamiento, que consiste en identificar sujetos que comparten ciertas características específicas: edad, sexo, etc.; con sus respectivos casos.13
La forma de medición y registro de información de los controles debe ser igual a la utilizada en los casos, con lo cual se reduce el sesgo de observación y se garantiza la validez interna del estudio.14
Además de lo anterior, el investigador debe seleccionar una fuente adecuada de la que se obtenga a los sujetos que conformarán el grupo control, para lo cual, existen las siguientes alternativas:
Base poblacional: los controles se obtienen de la misma población y tiempo de los cuales se eligieron los casos; estos son fáciles de identificar cuando se cuenta con registros poblacionales (ejem. registros del censo epidemiológico del país).
Controles vecindarios: los participantes viven en la misma zona residencial que los casos incluidos en el estudio; esta forma de selección no garantiza la correcta comparabilidad entre los grupos.
Controles hospitalarios: los controles son aquellos sujetos que acuden al mismo centro sanitario al que asisten los casos, solo que solicitan atención para eventos diferentes; no obstante, pueden presentar múltiples factores confusores que pueden alterar la comparación.
Controles a partir de números telefónicos: se seleccionan los controles de forma aleatoria a partir de un listado de números telefónicos de un área determinada. Una limitante es su tasa de respuesta durante el estudio.
Controles a partir de amigos o familiares: son sujetos relacionados con los casos, incrementando la probabilidad de que pertenezcan a la misma base poblacional, sin embargo, pueden no compartir las características de los participantes del estudio. Una forma útil que limita este sesgo es la realización de estudios en gemelos, debido a que comparten las mismas características genéticas, facilitando la comparación entre los casos y sus controles.
Controles de registro de mortalidad: los casos son seleccionados de un registro poblacional de muertes de una región; sin embargo, esto no garantiza la comparabilidad entre los grupos.15
Una forma habitual de conducir estos estudios es la utilización de un sujeto control por cada caso, lo cual reduce los gastos e incrementa la factibilidad para realizar el estudio; no obstante, pueden utilizarse múltiples controles de una misma base poblacional para un mismo caso, con lo cual se incrementa el poder de las comparaciones hasta una relación de 4:1, ya que la inclusión de más controles únicamente incrementa los gastos del estudio sin mejorar significativamente su poder estadístico.16
Métodos estadísticos empleados para los diseños de casos y controles
Razón de momios
La cuantificación clave del análisis estadístico en un estudio de casos y controles es la razón de momios. La cual se calcula a través de la construcción de la tabla de contingencia de 2 × 2, que se caracteriza por colocar el número de individuos con y sin el evento de interés de acuerdo al factor de riesgo que se desea investigar. La parte más importante de la construcción de esta tabla radica en que la variable dependiente va en las columnas y la independiente en las filas.
Ejemplo: La celda “a” se conforma por aquellos casos que tuvieron el factor de exposición, mientras que la celda “b” se constituye por los controles que también presentaron la exposición; a diferencia de la celda “c”, en la cual se contabilizan los casos que no están expuestos a el factor estudiado, y la celda “d” representada por los controles que no presentan el factor de interés (Cuadro 1).17
La razón de momios (RM) es una medida de asociación expresada en términos de posibilidad de ocurrencia de un evento en los individuos que cuentan con el factor de riesgo y es comparado con aquellos participantes que no lo presentan; en otras palabras, es un cociente de dos probabilidades para la ocurrencia de un evento. Para calcularlo, se requiere obtener la razón de dos momios: a) el constituido por el resultado de la división de las celdas de casos expuestos con los controles expuestos, y b) el momio que se conforma por la división de los casos no expuestos con los controles no expuestos (a/b)/(c/d); esta expresión algebraica también se obtiene mediante la “razón de productos cruzados” (a * d)/(b * c) (Figura 1).16
El primer momio cuantifica “cuántas veces es mayor la probabilidad de presentar el evento de interés dado que se está expuesto”, mientras que el segundo analiza “cuántas veces es mayor la probabilidad de presentar el evento de interés, dado que el sujeto NO está expuesto al factor”. Si la división de estos dos momios es igual a “1”, la probabilidad de presentar el evento de desenlace es el mismo entre los casos y los controles; es decir, no hay asociación entre el factor y el evento estudiado; mientras que si el resultado es mayor de “1”, indica que existe riesgo de presentar el evento de interés por presentar el factor; mientras que un valor menor de “1” significa que los individuos que presentan el factor, están protegidos para desarrollar el desenlace.
Cuando la prevalencia de una enfermedad es baja (menor a 5%), la RM se aproxima al riesgo relativo, la cual es una medida de asociación frecuentemente usada en ensayos clínicos o estudios de cohorte, y que será explicada en próximos artículos de esta serie de documentos.
Tanto en las ciencias biológicas como en las ciencias sociales es frecuente no encontrar una asociación clara entre la variable de desenlace y el factor de riesgo, debido a la presencia de otras variables que pueden confundir o modificar la relación. Las variables confusoras son aquellas que están relacionadas tanto con el factor de exposición como con el desenlace; mientras que una variable modificadora de efecto, es aquella que solo está relacionada con el desenlace, y su presencia puede incrementar o disminuir la relación investigada.
Debido a lo anterior, el investigador requiere tomar en consideración estas variables para llevar a cabo el análisis estadístico; por lo que es habitual que realice las comparaciones divididas en estratos por cada variable confusora, siempre y cuando sean pocos los estratos, en los cuales se calcule la RM y posteriormente analice la RM global; dicho análisis estadístico recibe el nombre de RM ajustada de Mantel-Haenszel17 (Figura 2).
En caso contrario, si se requiere tomar en cuenta múltiples factores confusores, el método adecuado para analizar la asociación, es la realización de regresión logística múltiple.18
Intervalo de confianza al 95% de una razón de momios
Para toda medida de cálculo es necesario expresar su dispersión, en el caso de la RM es mediante el intervalo de confianza (IC). El IC es un rango acotado por dos valores, los límites inferior y superior, en el cual se espera encontrar la RM real, si el estudio se realizará en la población, con un 95% de certeza; por lo tanto, si éste es construido y no incluye el valor de “1”, se puede interpretar que el factor de interés es de riesgo (si es mayor de 1) o protector (si es menor de 1). Para calcularlo es necesario construir la fórmula de la Figura 3.17 Los parámetros contenidos en el paréntesis constituyen el estimador aproximado del error estándar. La fórmula presentada es la que permite calcular un IC con un 95% de confianza para un estudio de casos y controles sin pareamiento, sin estratificación y sin ajuste por covariables.2,3 Para más detalles consultar Schlesselman 1982 y Szklo 2007.
Cálculo del tamaño de muestra en estudio de casos y controles
Una fuente de sesgo en los estudios de casos y controles es aquella en la que el número de participantes no fue suficiente para demostrar estadísticamente los hallazgos. Por este motivo es indispensable que el investigador calcule el tamaño muestral para asegurar la validez de sus resultados. Para los estudios sin pareamiento y sin ajuste se requieren los siguientes cuatro datos:2,3
Valor α (probabilidad del error tipo I);
Valor β (probabilidad del error tipo II);
Proporción de individuos expuestos al factor de riesgo dentro del grupo control.
Riesgo relativo hipotetizado del evento de interés en el grupo de casos (R).
Los dos primeros elementos tienen convencionalmente los valores de: α<0.05 y β<0.2 (o también β<0.1), respectivamente, y los valores de Z correspondientes son 1.96 y 0.84 (o 1.28). Para constituir el tercer elemento, se requiere de estimadores de efecto previamente publicados, ya sea a partir de registros o por un estudio piloto. El cuarto elemento requiere del conocimiento del riesgo esperado del factor de exposición3 (Figura 4). Este cálculo, se ilustra con el siguiente ejemplo: con la finalidad de analizar la asociación entre el consumo de un anticonceptivo oral y el desarrollo de cardiopatía congénita se planeó un estudio en que los autores estimaron tener un error α de 0.05, un error β de 0.2, que el 30% de mujeres del grupo control tomaban anticonceptivo oral en el primer trimestre del embarazo y que el riesgo del neonato para tener cardiopatía era de 3. Anotando estos valores en la fórmula de la Figura 5 se obtiene un tamaño muestral de 55 participantes en cada grupo.19
Aprovechando el ejemplo, el cálculo del intervalo de confianza al 95%, resulta ser de la siguiente manera: las frecuencias de a, b, c y d que satisfacen aproximadamente la condición dada son 43, 17, 12 y 38. Al aplicar la fórmula presentada anteriormente en la Figura 3 tenemos el cálculo representado en la Figura 6 . Por ende, RM [IC 95%] = 8.01 [5.16, 12.43].
En general, podemos observar que los estudios de casos y controles son relativamente fáciles de realizar. Presentan ventajas y desventajas que deben ser consideradas por los investigadores para ser llevados a cabo; entre estas encontramos las siguientes:
Es un diseño útil para estudiar problemas de salud poco frecuentes (prevalencia < 5%) o que tienen un periodo largo de latencia.
Son rápidos de realizar y poco costosos en comparación con otros diseños de estudio.
Tiene pocas restricciones éticas, pero existen peculiaridades que se deben cumplir; es necesario mantener la confidencialidad y el resguardo de los datos, cumplir con la reglamentación del cuidado del expediente clínico cuando se tiene una base hospitalaria y si se trata de un estudio prospectivo en que se van a entrevistar a los participantes del estudio, obtener las Cartas de Consentimiento y Asentimiento bajo información, dependiendo de la edad del participante o Consentimiento Verbal bajo amparo del aviso de privacidad de la ley de protección de datos personales.20,21
Permite analizar varios factores de riesgo, pero no para analizar varios eventos de forma simultánea.
Sin embargo, en ocasiones es difícil establecer la secuencia temporal de la exposición y el evento.
Debido a que la gran mayoría de los datos son obtenidos en forma retrospectiva se puede incurrir en diferentes tipos de sesgo (Cuadro 2).10
CONCLUSIONES
El diseño de Ca-CO permite a los investigadores explorar ciertos factores de riesgo cuando sospechan que están asociados con alguna enfermedad; generando evidencia que posteriormente puede ser analizada en otros diseños más robustos que permitan analizar dicha asociación.
Es susceptible a diferentes fuentes de sesgo, las cuales aunque sean minimizadas, debilitan la evidencia que podemos obtener de dichos estudios.