En las últimas décadas, con el propósito de mejorar la inferencia estadística, en el mundo se está retomando el análisis bayesiano. Si bien, estamos conscientes de que pasará tiempo para su aceptación e incorporación, muy probablemente no sustituirá a la estadística clásica, es decir, la estadística frecuentista. De esta forma, consideramos importante que los investigadores y lectores de la literatura médico-científica la conozcan para que puedan comprenderla mejor.1
En general, la estadística busca simplificar o resumir información de una investigación para entender,analizar e inferir conclusiones útiles al tomar decisiones. Sus dos objetivos principales son la estimación de parámetros (ej. medias, proporciones, porcentajes, tasa, etc.) y ejecución de pruebas de significancia estadística de la hipótesis nula (PSEHN).1-3
Bajo la estadística clásica o frecuentista, cuando se estima un parámetro es necesario agregar su precisión mediante el intervalo de confianza al 95% (IC95%). Por otro lado, la PSEHN permite determinar la plausibilidad de los datos obtenidos en un estudio, para rechazarla o no, bajo el criterio de un nivel crítico preestablecido, siendo el más común p < 0.05.2
A pesar de su alta aceptación y difusión, la estadística frecuentista ha sido criticada por lo siguiente: 1. En la determinación y precisión de un parámetro. Cualquier valor que esté dentro del IC95% tiene la misma probabilidad de certeza; además, este intervalo pudiera no incluir al verdadero parámetro.2,4 2. Bajo la PSEHN, sólo se contrasta la hipótesis nula, la cual por definición es cierta. Por tanto, no es posible confirmar la validez de la hipótesis alterna, la cual es de interés del investigador.4,5 3. En un intento por mejorar la interpretación de los resultados de una investigación, se ha sugerido la presentación del tamaño del efecto considerando umbrales clínicos de decisión.6,7 4. El análisis estadístico frecuentista no incorpora la evidencia previa a un estudio, es decir, los cálculos de las pruebas estadísticas sólo utilizan los datos obtenidos del estudio en cuestión.3,5
La estadística bayesiana (Tabla 1), aunque surgida un siglo antes de la frecuentista, ha resurgido en años recientes.8 Contrario a la frecuentista, el cálculo es más complicado, pero su crecimiento se debe al desarrollo de nueva tecnología (mejores procesadores y software).5-10 Es conveniente señalar que este tipo de estadística también permite estimar parámetros y contrastar hipótesis de investigación, pero tiene fundamentos distintos a la frecuentista. El primero consiste en que para la estadística bayesiana se asume que realizamos estudios con base en observaciones previas o razonamientos teóricos, los cuales son traducidos en probabilidades de credibilidad de la verdad o veracidad. El investigador realiza “solo” su estudio para ganar información y, posiblemente, modificar su nivel de certidumbre a su conocimiento previo. Los resultados del estudio actualizan su credibilidad, lo que se denomina probabilidad posterior.11-13
Para la estimación de un efecto (por ejemplo, diferencia de un promedio entre grupos), los investigadores antes de realizar su estudio determinan las probabilidades de encontrar cada tamaño del efecto (es decir, el parámetro). Estas probabilidades se resumen en una distribución previa (para más detalles, consultar la referencias). Después, tras la realización de la investigación y con base en los resultados se calculan nuevamente las probabilidades de parámetros posibles y se estima el más probable. Los parámetros más probables son resumidos en “el intervalo de credibilidad” (o intervalo de mayor densidad) al 95%. Este intervalo sí se interpreta como las cifras más posibles en el 95% de las veces que se haría un estudio y el valor puntual encontrado es “el más probable”. Por eso, aunque el intervalo de credibilidad al 95% incluya al valor nulo, si éste no es el más probable podemos hablar de un efecto con un grado de credibilidad. Si el intervalo no incluye al valor nulo, la credibilidad es al menos del 95% (Tabla 1). Si el intervalo está más allá de un rango equivalente a la nulidad (ROPE), la evidencia es muy fuerte hacia la hipótesis alterna; mientras que si éste se encuentra dentro de ese rango de equivalencia, se apoya fuertemente a la hipótesis nula.14-18
Estadística frecuentista | Estadística bayesiana | |
---|---|---|
Criterio de prueba de hipótesis | Solo contrasta la hipótesis nula, valor de “p” | Contrasta dos hipótesis (pueden ser más) |
Criterio dicotómico (se rechaza o no) | H nula contra H alterna, | |
El factor Bayes da sustento a la más probable o escasa evidencia para concluir | ||
Estimación del valor de parámetro y la incertidumbre | Intervalo de confianza del efecto estimado bajo un nivel preestablecido (valor-p) | Distribución posterior del efecto, intervalo de credibilidad o de alta densidad |
Todos los valores dentro del intervalo tienen la misma probabilidad de ser el estimado paramétrico | Muestra los valores posibles del parámetro y señala el valor más probable | |
Interpretación de resultados | p < nivel crítico: se rechaza hipótesis nula | Interpretación factor Bayes (Figura 1) |
p ≥ nivel crítico: no se rechaza hipótesis nula | Intervalo de credibilidad al 95% posterior a la actualización de los datos no incluye al valor nulo o equivalente al nulo: 95% de certeza del efecto | |
Intervalo de confianza al 95% no incluye al valor nulo: significancia estadística | Intervalo de credibilidad al 95% posterior a la actualización de los datos que incluye al valor nulo o equivalente al nulo: estimar el % de certeza del efecto por arriba de ese valor | |
Intervalo de confianza al 95% incluye al valor nulo: no significancia estadística | ||
IC95% estrecho: alta precisión | ||
IC95% amplio: baja precisión |
La prueba de hipótesis bayesiana no se basa en el rechazo de una hipótesis nula, sino en poder contrastar dos o más. En general, los estudios sólo contrastan dos hipótesis: la nula o no-efecto (H0) contra la alterna o efecto (H1). Una vez realizado el estudio se estima la probabilidad de los datos bajo la hipótesis nula y, la misma, bajo la alterna. La relación entre estas dos hipótesis se resume en el “factor Bayes o FB”.
Con el factor Bayes, existen dos formas: FB10 o razón H1:H0 y FB01 o razón H0:H1. La primera nos dice cuántas veces son más compatibles los datos con la H1 contra H0 y la segunda la relación inversa. La información del FB de un estudio permite realmente hablar de apoyo a una hipótesis (tanto nula como la alterna). Entre más alejado este el FB del valor 1 (valor de no predominio de alguna hipótesis, o escasa información para tomar una decisión) una de las dos hipótesis tendrá mayor credibilidad (Figura 1).19-22
La decisión final sobre la validez de una hipótesis se basa en la probabilidad final del estimado actualizado con la conjunción de su probabilidad previa, por la aportación de los datos del estudio (verosimilitud de los datos). Así, entre mayor evidencia exista en los estudios previos a favor de una hipótesis, los datos aportados en un estudio podrían modificar poco las conclusiones. Por el contrario, ante escasa evidencia o contraria a la previa, un estudio debe aportar datos muy contundentes para cambiar nuestra impresión inicial. Es importante señalar que la selección de cuál información previa usar para el cálculo inicial, ha sido una objeción al uso de la estadística bayesiana. Esto último se puede superar con un análisis de sensibilidad, considerando información previa, ya sea ausente (no informativa), optimista (a favor de una hipótesis de estudio) o escéptica (en contra de la hipótesis de estudio).23-26
Finalmente, destacamos que en el presente y un futuro inmediato, la estadística bayesiana se podrá incorporar en dos áreas donde la estadística frecuentista tiene limitaciones: a) en investigaciones donde el tamaño de muestra es pequeño, como ocurre en muchos estudios clínicos y, b) al realizar análisis complejos pero, sin la problemática de cumplir los supuestos de normalidad.5,11,19,25,27