Introducción
La esclerosis múltiple (EM) es una enfermedad autoinmune de causa desconocida, posiblemente por exposición temprana a un agente desconocido (posiblemente un retrovirus o herpesvirus)1, en la cual podrían confluir factores genéticos y, principalmente, ambientales2. Se caracteriza por la destrucción de la vaina de mielina del sistema nervioso y médula espinal, que afecta a la transmisión de señales, y disfunción mitocondrial en células gliales y neuronas3, que se manifiesta como alteraciones autonómicas, visuales, motores y sensoriales, entre ellas, pérdida de visión, dolor oftálmico, debilidad muscular, alteraciones en la sensibilidad y coordinación, disfagia, disartria e incontinencia urinaria4. La enfermedad adopta diferentes fenotipos, siendo los más comunes el remitente-recurrente (EMRR) (ataques aislados) y el progresivo (daño acumulativo), el cual puede ser primario (EMPP) o secundario (EMSP)5.
Afecta aproximadamente a 2.80 millones de personas mundialmente6, aunque su incidencia no es uniforme, variando entre diferentes regiones y poblaciones7. Por ello el uso de sistemas de aprendizaje automático supervisado, como el árbol de decisiones mediante detector automático de interacciones de chi-cuadrado (CHAID), el cual es una herramienta que encuentra patrones en datos que tienen muchas variables categóricas o numéricas, crea segmentos y luego presenta los datos en una representación visual para predicción y clasificación, podría permitir determinar y clasificar características más próximas al fenotipo remitente-recurrente o progresivo en poblaciones de pacientes con EM en función de características de fácil acceso en historias clínicas o entrevistas con el paciente, facilitando rápidamente la toma de decisiones clínicas y preventivas según el perfil epidemiológico de cada población. En ese sentido, se ha explorado este algoritmo en el campo de la neurología, en la cual el árbol CHAID fue empleado por Bombois et al. para la clasificación y predicción de enfermedad de Alzheimer (EA) mediante biomarcadores como el péptido amiloide Ab1-42, tau total (t-tau) y tau fosforilada en Thr181 (p-tau), hallando una alta sensibilidad para diagnóstico de EA8, lo que muestra el potencial del desarrollo de árboles de decisión para generar modelos de clasificación y predicción para otros tipos de enfermedades neurológicas. Por ello, el objetivo de esta investigación fue determinar la capacidad del aprendizaje automático basado en arboles de decisión para la caracterización del fenotipo remitente y progresivo de una población de pacientes con EM.
Método
Diseño y población de estudio
Estudio analítico y transversal, proveniente de una base de datos secundaria del repositorio Physionet (https://physionet.org/content/patient-level-data-covid-ms/1.0.1/)9. La base de datos secundaria se llama Patient-level dataset to study the effect of COVID-19 in people with multiple sclerosis (en español: Conjunto de datos a nivel de paciente para estudiar el efecto de COVID-19 en personas con esclerosis múltiple), publicada el año 2024 (https://www.nature.com/articles/s41597-024-02978-x)10, la cual fue una base de datos internacional cuyo objetivo fue determinar la influencia de los medicamentos modificadores de la enfermedad sobre la enfermedad por coronavirus-19 (COVID-19). En ella, los pacientes, desidentificados de nombre, edad y nacionalidad, consignaron información sobre su enfermedad y antecedentes personales. Si bien el total de la población de la base de datos fue de 1,141 pacientes con EM, se excluyó a los pacientes que fueron diagnosticados con COVID-19, así como aquellos con datos incompletos, por lo que el total de pacientes incluidos en esta investigación fue de 1,010.
Variables y mediciones
Las variables fueron: fenotipo de EM (variable dicotómica) dividido en: EMRR y progresivo, que incluyó al primario progresivo (EMPP) y el secundario (EMSP). Grupo etario, dicotomizado en 18 a 50 años y 51 años o más (consignado en la base de datos secundaria). Sexo (mujer y hombre). Uso de terapia modificadora de la enfermedad, dicotomizado en sí y no. Uso actual de glucocorticoides, dicotomizado en sí y no. Antecedente de fumar, dicotomizado en sí (si el paciente fuma o ha fumado antes) y no (si nunca ha fumado). Fármacos modificadores de la enfermedad, referido como el tratamiento usado por el paciente, que incluyó alguno de los siguientes fármacos: dimetilfumarato, fingolimod, interferón, ocrelizumab, natalizumab, glatiramero, teriflunomida, cladribina, rituximab y alemtuzumab.
Análisis estadístico
Se usaron tablas para la estadística descriptiva, frecuencias absolutas y relativas, así como el aprendizaje supervisado de redes neuronales mediante árbol CHAID, que es un algoritmo de árbol multidireccional, que produce segmentos y perfiles11. En cada paso, elige la variable predictora independiente con la mayor interacción con la dependiente12. Se eligen los nodos principales según el mayor valor de chi-cuadrado, descendiendo hasta el nodo terminal, obteniendo variables con la mayor interacción con la variable dependiente. También se utilizó el análisis multivariante mediante regresión logística binaria, con el fin de comparar si ambos modelos generan predictores similares o si existen diferencias en la cantidad de variables con asociación estadísticamente significativa. El análisis y procesamiento, incluyendo el uso de métodos de aprendizaje automático, se realizó por medio del programa SPSS v. 25TM.
Consideraciones éticas
La base de datos fue puesta a disposición por sus autores junto al artículo en la base de datos Physionet, que publica datos bajo licencia de dominio público Creative Commons (CC0)13, y no admite la publicación de datos confidenciales.
Resultados
Del total de casos (n = 1,010), el fenotipo más frecuente fue el recurrente remitente (79.40%). Hubo un mayor porcentaje de mujeres (79.23%), de pacientes de 18 a 50 años (77.39%) y de uso actual de terapia modificadora de la enfermedad (77.13%). La mayoría de los pacientes no está usando glucocorticoides como parte del tratamiento (89.66%). Asimismo, el 43.38% de los pacientes refirió tener antecedentes de consumo de cigarros actual o pasado (Tabla 1).
Tabla 1 Características de la población estudiada (n = 1,010)
| Recuento | Porcentaje | |
|---|---|---|
| Fenotipo EM | ||
| Progresiva | 104 | 9.11 |
| Recurrente-remitente | ||
| Sexo | ||
| Mujer | 906 | 79.40 |
| Hombre | ||
| Edad | ||
| 18 a 50 años | 800 | 79.23 |
| 51 a 70 años | ||
| Terapia modificadora de la enfermedad actual | ||
| Sí | 210 | 20.77 |
| No | ||
| Uso actual de glucocorticoides | ||
| Sí | 782 | 77.39 |
| No | ||
| Antecedente de fumar | ||
| Sí | 228 | 22.61 |
| No |
EM: esclerosis múltiple.
Los fármacos más utilizados en EM progresiva en esta población de pacientes fueron el ocrelizumab (48.50%) y la teriflunomida (15.20%). En EMRR fueron el dimetilfumarato (20.90%) y el fingolimod (17.70%). La relación entre ambos grupos fue estadísticamente significativa (p < 0.001) (Tabla 2).
Tabla 2 Fármacos modificadores de la enfermedad, utilizados en pacientes con EM progresiva y EMRR
| Fármacos modificadores de la enfermedad | EM progresiva | EMRR | Total |
|---|---|---|---|
| Dimetilfumarato | 2 (6.10%) | 124 (20.90%) | 126 (20.20%) |
| Fingolimod | 2 (6.10%) | 105 (17.70%) | 107 (17.10%) |
| Interferón | 2 (6.10%) | 75 (12.70%) | 77 (12.30%) |
| Ocrelizumab | 16 (48.50%) | 62 (10.50%) | 78 (12.50%) |
| Natalizumab | 2 (6.10%) | 57 (9.60%) | 59 (9.40%) |
| Glatiramero | 1 (3%) | 56 (9.50%) | 57 (9.10%) |
| Teriflunomida | 5 (15.20%) | 55 (9.30%) | 60 (9.60%) |
| Cladribina | 0 (0%) | 34 (5.70%) | 34 (5.40%) |
| Rituximab | 3 (9.10%) | 11 (1.90%) | 14 (2.20%) |
| Alemtuzumab | 0 (0%) | 13 (2.20%) | 13 (2.10%) |
| Total | 33 (100%) | 592 (100%) | 625 (100%) |
EM: esclerosis múltiple; EMRR: esclerosis múltiple remitente recurrente.
Al incluir el tratamiento con glucocorticoides y con diferentes tipos de terapias modificadoras de la enfermedad, el fenotipo progresivo fue más frecuente en pacientes principalmente de 51 a 70 años con antecedentes de fumar, en tratamiento con teriflunomida, rituximab, glatiramero y ocrelizumab. Otro grupo relevante asociado al fenotipo progresivo fue el compuesto por pacientes hombres entre 18 a 50 años en tratamiento con ocrelizumab y rituximab. Para la EMRR se observó un grupo compuesto por mujeres de 18 a 50 años en tratamiento con ocrelizumab y rituximab, así como un grupo compuesto por pacientes de 18 a 50 años en tratamiento con dimetilfumarato, teriflunomida, interferón, glatiramero, fingolimod, natalizumab, cladribina y alemtuzumab (Tabla 3).
Tabla 3 Análisis multivariante mediante regresión logística binaria para factores asociados a fenotipo remitente-recurrente de EM
| Paso 5* | B | Error estándar | Wald | p | Exp (B) (IC 95%) |
|---|---|---|---|---|---|
| Grupo etario | 1.723 | 0.427 | 16.274 | < 0.001 | 5.60 (2.426-12.94) |
| Sexo | 1.342 | 0.421 | 10.163 | 0.001 | 3.82 (1.67-8.73) |
B: valores de la ecuación de regresión para predecir la variable dependiente a partir de la variable independiente; error estándar: distancia promedio que recorren los valores observados con respecto a la línea de regresión; Wald: evalúa si un conjunto de variables independientes son colectivamente «significativas» para un modelo; Exp (B): cambio previsto en las probabilidades para un aumento unitario del predictor.
*Variables incluidas en el modelo: antecedente de consumo de cigarro, sobrepeso, uso de glucocorticoides, sobrepeso.
EM: esclerosis múltiple; IC 95%: intervalo de confianza del 95%.
Se observó que el árbol de decisiones clasificó como características asociadas al fenotipo progresivo con un mayor porcentaje a pacientes de sexo indistinto con antecedentes previos o actuales de fumar y con edades comprendidas entre 51 a 70 años. Para la variable remitente-recurrente se observó que el grupo con mayor asociación fue el de mujeres entre 18 y 50 años (Fig. 1).

Figura 1 Árbol de decisiones mediante detector automático de interacciones mediante chi-cuadrado para clasificación de fenotipo de esclerosis múltiple según factores personales. Variables incluidas: tipo de fenotipo, edad, sexo, glucocorticoides, consumo de cigarro, uso actual de terapia modificadora de la enfermedad.
Al incluir el tratamiento con glucocorticoides y con diferentes tipos de terapias modificadoras de la enfermedad, el fenotipo progresivo fue más frecuente en pacientes principalmente de 51 a 70 años con antecedentes de fumar, en tratamiento con teriflunomida, rituximab, glatiramero y ocrelizumab. Otro grupo relevante asociado al fenotipo progresivo fue el compuesto por pacientes hombres entre 18 y 50 años en tratamiento con ocrelizumab y rituximab. Para el EMRR, se observó un grupo compuesto por mujeres de 18 a 50 años en tratamiento con ocrelizumab y rituximab, así como un grupo compuesto por pacientes de 18 a 50 años en tratamiento con dimetilfumarato, teriflunomida, interferón, glatiramero, fingolimod, natalizumab, cladribina y alemtuzumab (Fig. 2).

Figura 2 Árbol de decisiones mediante detector automático de interacciones mediante chi-cuadrado para clasificación de fenotipo de esclerosis múltiple basado en fármacos modificadores de la enfermedad. Variables incluidas: tipo de fenotipo, edad, sexo, glucocorticoides, consumo de cigarro, uso actual de terapia modificadora de la enfermedad y medicamento utilizado.
Discusión
El análisis mediante regresión logística binaria señaló al sexo y la edad como variables predictoras del fenotipo de EM, descartando el antecedente tabáquico, el cual posee fundamentos de antecedentes teóricos y experimentales en la literatura médica, y tampoco consideró el tipo de medicamento utilizado, lo que refleja algunas de las limitaciones de los métodos de regresión en el manejo de características categóricas y numéricas, así como para las relaciones no lineales, siendo esta una ventaja del árbol de decisión, ya que permite la clasificación de datos donde la relación y respuesta no es modelable mediante ecuaciones lineales, además del manejo de valores atípicos, faltantes y de datos grandes, permitiendo la búsqueda de patrones y realización de predicciones.
Se observó que el árbol de decisión clasificó como predictor de fenotipo progresivo a pacientes del grupo etario de 51 a 70 años, lo que concuerda con aspectos relacionados con la epidemiología de este fenotipo, el cual suele iniciar a partir de los 45 años14, mientras que el fenotipo remitente-recurrente clasificó como predictor a la edad entre 18 a 50 años, acorde con las características epidemiológicas de estudios previos, si bien hubo porcentajes menores al 80% en el grupo etario de 51 a 70 años, lo que concuerda con la tendencia actual hacia un incremento en la edad de presentación de la EMRR en algunos países donde la edad de inicio promedio pasó de 35 a 39 años a 55 a 59 años, incluso en 65 años15.
El sexo fue una variable predictora importante para el fenotipo remitente-recurrente, pero no para el fenotipo progresivo, siendo más frecuente en mujeres, lo que concuerda con Thränhardt, quien utilizó un modelo de regresión lineal multivariante, hallando que el fenotipo remitente-recurrente fue predominante en mujeres menores de 50 años16. Ramagopalan analizó un conjunto de datos de 11,868 pacientes con EM, calculando la proporción de sexos, hallando un aumento de casos de EMRR en mujeres respecto a hombres17. Valadkeviciene analizó los cambios temporales de la EM los últimos 15 años en Lituania, encontrando que la tendencia en los próximos años es que el número de mujeres afectadas sea el doble que el de hombres18. La mayor presencia en mujeres, más allá del posible componente hormonal asociado a los estrógenos, requiere de estudios que exploren la patogénesis relacionada con el aumento de EMRR en el sexo femenino, lo podría conjeturarse, estaría posiblemente relacionado con el aumento de la edad de presentación de la enfermedad en los últimos 50 años, ya que las concentraciones de hormonas sexuales disminuye con los años, lo cual reduciría los efectos protectores de los estrógenos19, lo que explicaría la mayor relación hallada entre el sexo femenino y el fenotipo remitente-recurrente, así como su mayor incidencia, respecto al sexo masculino.
El antecedente de consumo de cigarro fue clasificado como un fuerte predictor de este fenotipo, a diferencia del fenotipo remitente-recurrente, donde el porcentaje de casos y asociación fue muy bajo. Esto concuerda con lo hallado por Makkawi, quien, en un estudio sobre el efecto del tabaquismo en pacientes con EM en Arabia Saudita, encontró que el porcentaje de casos de fenotipo primario progresivo fue el doble en personas con antecedente actual o pasado de tabaquismo que en personas que nunca fumaron20. Además, revisiones de estudios epidemiológicos evidenciaron que el tabaquismo incrementa el riesgo anual de transición a EM secundaria progresiva en casi un 5%, e incluso, los pacientes que dejaron de fumar tuvieron una probabilidad dos veces mayor de desarrollar el fenotipo progresivo de la enfermedad, presentando síntomas más tempranos si el inicio de consumo de cigarro fue en la adolescencia21. El mecanismo por el cual el tabaquismo se relaciona con la EM es complejo y aún está en proceso de comprensión22: el efecto del tabaquismo estaría relacionado con los efectos desmielinizantes del monóxido de carbono23, neurotoxicidad por monóxido de carbono24, fenómenos inflamatorios25, incremento de la sensibilidad a la apoptosis celular26 y alteración de mecanismos epigenéticos de metilación, acetilación y centralización de genes relacionados con la inflamación y mielinización27.
La figura 2 representa el perfil farmacológico prescrito por los médicos en esta población, ya que se añadió al árbol de decisiones los medicamentos utilizados para los fenotipos estudiados. Se observó que los medicamentos que se asociaron al perfil de tratamiento del fenotipo progresivo fueron teriflunomida, ocrelizumab, rituximab y glatiramero, siendo medicamentos con perfiles de efectividad y tolerancia importantes en la reducción de las recaídas en este fenotipo en ambos sexos28.
El rituximab y el ocrelizumab también fueron utilizados para el tratamiento del fenotipo remitente-recurrente en mujeres de 18 a 50 años, probablemente debido al creciente aumento de la incidencia y gravedad de esta enfermedad en el sexo femenino. Sin embargo, en el fenotipo remitente-recurrente, la mayor parte de pacientes, independientemente del sexo, fueron tratados principalmente con dimetilfumarato, teriflunomida, interferón, glatiramero, fingolimod, natalizumab, cladribina y alemtuzumab, los cuales son tratamientos inmunomoduladores e inmunosupresores con diferentes grados de efectividad y tolerancia, que han mostrado perfiles similares para la reducción de las recaídas en este fenotipo de EM29. Sin embargo, este hallazgo también indica que la variedad de medicamentos disponibles requiere de estudios que determinen evaluar y comparar los perfiles de seguridad y eficacia de estos fármacos en escalas de tiempo prolongadas, así como la determinación de los fármacos más eficientes, ya que este fenotipo, a diferencia del fenotipo progresivo, se desarrolla durante décadas debido a su inicio más temprano30.
Las limitaciones de esta investigación estuvieron relacionadas con las características del origen secundario de la base de datos: el tamaño poblacional (el cual fue de 1,010 casos), sin embargo el objetivo de la investigación fue determinar la capacidad del árbol de decisiones para que dicho modelo pudiera ser aplicado a diferentes grupos de pacientes, por lo cual es recomendable reproducir este método de aprendizaje supervisado en diferentes países y regiones. Asimismo, pudo existir el sesgo de información, ya que los datos no pudieron ser evaluados al provenir de un repositorio. No se pudo determinar la efectividad del tratamiento prescrito en cada paciente, como tampoco el tipo de fenotipo progresivo, habiéndose agrupado el fenotipo secundario progresivo y primario progresivo en uno solo, siendo que ambos subtipos de EM pueden presentar diferencias respecto a los años de edad y años con y sin tratamiento. Respecto al antecedente tabáquico, la limitación más importante fue que no se contó con datos relevantes como el número de cigarrillos, el tipo de tabaco y la frecuencia y duración del tabaquismo, por no estar disponibles en la base de datos. Las comorbilidades tuvieron muchos valores faltantes (en torno al 70%), por lo que no aportaron significativamente al árbol de decisiones. Asimismo, no se contó con aspectos relacionados con la dosis y tiempo de administración de los medicamentos empleados para tratar la EM.
En conclusión, el aprendizaje automático mediante arboles de decisión con datos fácilmente disponibles es eficiente en la clasificación rápida de factores personales y perfiles farmacológicos asociados a los fenotipos remitente-recurrente y progresivo de la EM, hallando relaciones no lineales no encontradas en la regresión logística binaria. Además, el antecedente tabáquico es un predictor de fenotipo progresivo. Las características halladas podrían diferir en diferentes grupos poblacionales, por lo que el uso de árboles de decisión es un instrumento que podría ser incluido como complemento en la toma de decisiones clínicas y terapéuticas y en epidemiología para neurólogos y otras profesiones de la salud relacionadas en diferentes regiones, países y localidades.










nueva página del texto (beta)


