Introducción
La pandemia de la Covid-19 a partir del año 2020 ha causado conmoción en la salud pública afectando alrededor de 230 países (WHO, 2022), colapsando sus sistemas sanitarios y causando afectación de índole económica-social.
En Ecuador se reportó el primer caso el 29 de febrero de 2020, situación que se complicó a las pocas semanas después, provocando el confinamiento total desde el 17 de marzo del mismo año. Las cifras de fallecidos llegaron a sus picos más altos los días del 22 de marzo al 9 de junio de ese mismo. De acuerdo con Cevallos-Valdiviezo et al. (2021) los reportes generales descritos por el Ministerio de Salud Pública del Ecuador (MSP) no contemplaban o ajustaban al verdadero impacto que generó esta pandemia desde los meses de febrero a octubre 2020.
El análisis de datos se convirtió en una herramienta más para combatir el virus, pues su manejo e integración con metadatos previnieron en ciudades como Taiwán la saturación de hospitales (Chen et al., 2021), manejando de manera más apropiada los servicios médicos durante los días más fuertes del brote. Además, mediante modelos estadísticos se logró determinar el efecto del sexo, edad y comorbilidades en personas infectadas (Li et al., 2020; Zhang et al., 2020; Ruiz Cantero, 2021).
En Ecuador, según el Instituto Nacional de Estadísticas y Censos (INEC) se registró en 2020 un exceso de 41 mil muertes con respecto al 2019 (INEC, 2021). De este excedente más de 50 por ciento de las defunciones fueron causadas por la Covid-19, siendo el resto como efecto de enfermedades respiratorias, cardiacas y diabetes. Medir el impacto que tuvo el año 2020 en distintos campos de estudio es fundamental para todo país que desee conocer con precisión la magnitud de este suceso en la población.
El método XSTATIS (X Structuration des Tableaux a Trois Indices de la Statistique) analiza la estructura de correlación entre diversas tablas y dentro de cada tabla mediante el uso de variables latentes (combinación lineal de variables estudiadas), obtenidas a través la descomposición de valores singulares de una matriz compromiso. Esta matriz compromiso resulta de combinar linealmente las tablas originales. En las secciones 2 y 3 se explica más sobre este método. El presente trabajo tiene como objetivo utilizar esta metodología para analizar las principales causas de muerte en Ecuador en 2020 comparándolo con los periodos 2018 y 2019, además de construir indicadores que muestren por género qué grupo de edades son más vulnerables a las diversas causas de muerte de este estudio. Entonces, tenemos tres tablas, cada una definida por el año (2018, 2019, 2020), esto para hombres y mujeres. Cada tabla tiene como filas y columnas dos factores en este caso las filas son la edad y las columnas las causas de muerte y cada celda de cada tabla tiene los conteos de esas muertes. Entonces, como la descomposición de valores singulares, permite obtener proyecciones tanto de las filas y columnas en dimensiones de máxima variabilidad, es posible entender las relaciones causa de muerte y edad por género y construir indicadores a través de variables latentes obtenidas que muestren las subpoblaciones más vulnerables a las diversas causas de muerte. Adicionalmente, a través de los eigenvectores de la descomposición de valores singulares de la matriz compromiso, es posible proyectar cada tabla (2018, 2019 y 2020) para analizar cómo fue la estructura de muertes en el año 2020 y cómo varió en relación a los dos años previos. Como premisa, se espera que haya un incremento en las muertes en el año 2020 con respecto a los años previos en todas las edades, pero con mayor énfasis en las edades más jóvenes.
Antecedentes
Existen varios trabajos sobre la evolución e impacto de la Covid-19 dentro del territorio ecuatoriano. Estudios realizados como el de Cuéllar et al. (2021) indican que hubo una correlación positiva entre la movilidad humana y los excesos de muertes en distintas provincias del Ecuador durante los primeros seis meses de 2020.
Otros investigadores han desarrollado modelos para estimar contagios como Fernández-Naranjo et al. (2021) quienes construyeron un modelo bayesiano para predecir la tendencia de contagios durante la pandemia. Por otro lado, otros también investigaron sobre correlación entre fallecer por Covid-19 y otros padecimientos (García-Bustos et al., 2021), además del impacto a la salud mental y emocional de habitantes del Ecuador (Puchaicela et al., 2022). Otros trabajos del impacto de la Covid-19 en Ecuador son Carrión-Bósquez et al. (2022) y Zerna-Bravo et al. (2022).
Estos estudios dejan abiertas nuevas líneas de investigación al incrementar covariables relacionadas al desarrollo de la Covid-19 en Ecuador. Las metodologías de estadística multivariada buscan estudiar las varianzas y covarianzas entre variables, muchas de estas metodologías construyen variables ficticias para modelar las correlaciones entre variables (Castro, J. & Galindo, P., 2000). Una de estas metodologías, es el Análisis Triádico Parcial (Thioulouse & Chessel,1987; Kroonenberg, 1989; Thioulouse et al., 2004; Rossi et al., 2014).
El Análisis triádico Parcial (PTA) o XSTATIS, analiza arreglos tridimensionales; que para el presente estudio las dimensiones serían: la causa de muerte, el grupo de edad y la tercera los años; esto, debido a que se analizan los conteos de muertes por edades y por año. En este trabajo se estudian tres tablas simultáneas, una por año (2018-2020) para cada género, cada tabla estructurada en filas conformada por los grupos etarios y en columnas por las causas de muerte. Dado que el objetivo de este estudio es definir una estructura estable multivariante entre los diferentes años, es decir estudiar simultáneamente las submatrices para encontrar patrones comunes, el PTA es el método indicado para determinar la parte estable de las ocurrencias de las causas de muerte según la edad a través del tiempo y a su vez, medir cuánto difieren cada año en particular con respecto a esa estructura estable, para de esa forma determinar condiciones particulares de determinadas causas de muerte según determinado rango de edad en algún año en particular (González-Narváez et al., 2020).
Existen otras metodologías de análisis multivariante de tres vías o con arreglos tridimensionales a las que pertenece el PTA denominada familia STATIS (Rodriguez, 2020); sin embargo, se aplica PTA debido a que es la única en la cual se mantienen estables las filas (grupos etarios) y columnas (causas de muerte) a través de la profundidad de la tercera dimensión (años). Las otras metodologías de análisis de tres vías requieren condiciones diferentes como, el no tener las mismas observaciones o individuos en las filas (STATIS Dual); el no medir las mismas características o variables en cada momento de la tercera dimensión (STATIS); contar solo con variables cualitativas (DISTATIS), entre otras (González-Narváez et al., 2020).
El PTA usa la descomposición de valores singulares para poder representar la estructura de correlación entre tablas, filas y columnas de modo que construye variables latentes usando combinaciones lineales de las variables originales para representar las relaciones de filas, columnas y tablas (Medina, 2015), por lo que esas variables latentes servirán como indicadores en el presente trabajo.
Esta metodología ha sido utilizada en varios trabajos: Silmani et al. (2020) utilizaron PTA para la evaluación de la variabilidad espacio temporal de la calidad del agua en la cuenca del río Medjerda. Los autores analizaron 14 variables fisicoquímicas en 12 sitios de muestreo mensualmente durante 2013, es decir trabajaron con 12 tablas que eran los meses. Ellos destacaron que el análisis PTA les permitió identificar estructuras espaciales multivariantes comunes y problemas asociados con el mantenimiento de la calidad del agua, identificar los patrones consistentes en la química del agua, y permitir el análisis de la variabilidad temporal de la química del agua. Otros investigadores también han usado PTA para caracterizar variabilidad espaciotemporal en conjunto de datos ecológicos (Jiménez et al., 2006; Rolland et al., 2009; González-Narváez, 2021)
Varias investigaciones han hecho uso de variables latentes para construir indicadores como por ejemplo en el trabajo presentado por Vyas & Kumaranayake (2006) se utiliza análisis de componentes principales (PCA) para construir índices de estatus socioeconómico cuando hay ausencia de datos de ingresos y consumo. En ese trabajo se construyeron los indicadores usando PCA sobre la propiedad de activos duraderos, el acceso a servicios públicos e infraestructura, y las variables características de la vivienda. La principal ventaja de este método sobre los métodos más tradicionales basados en los ingresos y los gastos de consumo es que evita muchos problemas como el sesgo de recuerdo, la estacionalidad y el tiempo de recopilación de datos. Rygel et al. (2006) también propusieron una metodología para construir indicadores compuestos de vulnerabilidad en las que combinaban un análisis de Pareto y PCA.
Datos y metodología usada en la investigación
Datos
Para este estudio se han considerado las bases de datos de las defunciones generales de Ecuador publicadas por el INEC (2021) para los años 2018, 2019 y 2020. El INEC utiliza el formulario estadístico de defunción como requisito para el registro de los fallecidos en las oficinas del registro civil. De esta herramienta se obtienen luego las bases de datos de defunciones generales dentro del territorio ecuatoriano.
Ecuador tiene cuatro regiones: costa, sierra, oriente e insular, y la mayor parte de sus regiones sierra y oriente están formadas por poblaciones rurales (Mera-Intriago, 2023). Además, Ecuador presenta subregistros en mortalidad, el cual es más persistente en las áreas rurales y en la pandemia ese problema se agravó (Vera et al., 2019). A fin de minimizar el problema de los subregistros, solo se han considerado variables como sexo, edad, causa de muerte y año de defunción para el estudio de las causas de mortalidad. La variable edad ha sido categorizada considerando las edades mayores a cinco años, y formando grupos considerando un rango de cinco años, es decir de (5,10], (10,15] ,…, (85 o más), en total 17 grupos de edades. Mientras que para la variable causas de muerte, categórica también, se seleccionaron las 18 principales causas de muerte registradas en el informe anual de 2020 del INEC codificadas de acuerdo a la CIE-10 (WHO, 2019), la Décima Revisión de la Clasificación Internacional de Enfermedades (INEC, 2021b). De modo, que los valores dentro de cada tabla construida son de tipo conteo de muertes ocurridas por edad y causa. La Tabla 1 presenta el código de estas causas:
Tabla 1 Causas de muertes analizadas
Causas | Grupo de enfermedad |
---|---|
C16, C22, C34 | Tumores Malignos neoplasias (T) |
E11, E14 | Diabetes mellitus (D) |
I10, I11 | Enfermedades hipertensivas (H) |
J12, J15, J18 | Influenza, gripe y neumonía (VR) |
K74 | Fibrosis y cirrosis del hígado (HP) |
N18 | Insuficiencia renal crónica (RN) |
COVID-19 | Covid-19(CV) |
I21 | Infarto agudo del miocardio (I) |
I61, I63, I64, I67 | Enfermedades cerebrovasculares (C) |
Fuente: elaboración del autor a partir de la CIE-10
Análisis Triádico Parcial o XSTATIS
Esta metodología multivariante tiene como objetivo analizar el comportamiento de un grupo de variables medidas a través del tiempo en un conjunto de unidades de investigación (González-Narváez et al., 2020). Las variables y las unidades de investigación son las mismas a través del tiempo (n unidades de investigación, p variables y k periodos analizados) (Slimani et al., 2020), es decir, se estudian las interrelaciones entre k tablas X i, i = 1,…, k organizadas en n filas y p columnas
Para este trabajo, n =17 son los grupos de edades, p = 18 categorías para la variable causas de muerte y k es igual a tres años (2018, 2019, 2020).
Cada uno de los k periodos tiene los tripletes (X 1 , D n , D p ),…, (X k , D n , D p ), siendo D n la matriz diagonal con los pesos para las filas y D P la matriz diagonal con los pesos para las columnas (González-Narváez et al., 2020). A partir de esto, se desarrollan los tres pasos que requiere la metodología y que se describen a continuación.
El paso de la interestructura permite obtener los pesos para construir una tabla que resuma las k tablas estudiadas (Thioulouse, 2011). Los pesos son obtenidos a partir del primer eigenvector de la matriz RV o de correlaciones vectoriales entre las matrices. La matriz RV indica como están correlacionadas las tablas de datos. Por ejemplo, para el presente estudio esta matriz RV sería de 3x3, y una correlación alta positiva indicaría que ambas tablas tienen una tendencia similar, es decir a mayores valores de muertes en una celda mayores valores en la misma celda en la otra tabla. La matriz RV o de correlaciones vectoriales entre cada combinación de par de tablas de datos (X i , X j ) se la define como:
Para el presente trabajo cada matriz de datos X i es de dimensión 17 (grupo de edades) por 18 (causas de muerte) y se tiene una matriz de datos por cada año; además, D n es la matriz diagonal de pesos de las edades, es decir Dn=diag(w 1 ,w 2 ,…w n ) y w i = 1/n; mientras que Dp es la matriz identidad de dimensión p correspondiente a los pesos para las causas de muerte.
El siguiente paso fue obtener la matriz compromiso a través de una combinación lineal de las k tablas, los coeficientes de la combinación lineal son obtenidos del primer eigenvector de la matriz RV. La matriz compromiso maximiza la media de las correlaciones entre las variables de cada matriz. X i Proporciona una imagen de las estructuras que son comunes a todas las tablas (Medina, 2015).
Cabe mencionar aquí que la descomposición de valores singulares de una matriz M, utilizada en este método, está dada por la siguiente identidad, Mnxp = U∑ VT. En el caso de este estudio M es la matriz compromiso. Donde ∑ es una matriz diagonal formada por las raíces cuadradas de los valores propios no nulos ordenados de mayor a menor de las matrices MTM y MMT; U y V son bases ortonormales formadas por los vectores propios correspondientes de la matrices MMT y MTM. Entonces a través de las combinaciones lineales tomando como coeficientes los vectores que corresponden a los mayores eigenvalores de U y V en las filas o columnas de la tabla se pueden construir proyecciones en esos espacios de máxima variabilidad.
Por último, el análisis intraestructural resume la variabilidad en las tablas en torno a la estructura común definida por el compromiso y en él se destacan los elementos que mejor encajan (o no encajan) a la estructura del compromiso (Silmani et al., 2020). Entonces, a través de una descomposición de valores singulares de la matriz compromiso y de cómo las proyecciones de las filas y columnas se visualizan el mapa de factores, se pueden interpretar las similitudes de las tablas.
Más detalle de este método se pueden encontrar en Abdi et al. (2012). El cálculo y la presentación gráfica fueron obtenidos utilizando el paquete ade4 (Thioulouse et al., 2018) para el software R (R Core Team, 2022).
Con la finalidad de dar soporte a los resultados obtenidos con el PTA, se aplicó la versión multivariante no paramétrica del análisis de varianza, conocida como PERMANOVA (Permutational multivariate analysis of variance) propuesto por Anderson, M. (2001 y 2017), el cual es un método estadístico que sirve para comparar grupos de elementos con el fin de probar la hipótesis nula, la cual indica que los centroides y la dispersión son equivalentes entre todos los grupos. Basa su cálculo en la distancia -generalmente Bray-Curtis- entre dos objetos incluidos en el estudio.
Para el caso de un solo factor, escalable para múltiples factores, es el siguiente: Se obtiene la Suma Cuadrática Total, SS T , calculando el cuadrado de las distancias entre todas las observaciones, dividido para N el número total de observaciones. Luego se obtiene la Suma Cuadrática dentro de grupos, SS W , calculando el cuadrado de las distancias entre las observaciones de un mismo grupo, dividido para n el tamaño del grupo. Seguidamente se obtiene por diferencia la Suma Cuadrática entre los m grupos, SS A = SS T - SS W . Con ello se obtiene el pseudo estadístico F = [SS A /(m-1)] / [SS W /(N-m)]. Finalmente se obtiene el valor-p = [número de permutaciones con F* > F] / [Total de permutaciones], siendo F* un nuevo valor de F obtenido en cada permutación; y con este valor se toma la decisión de rechazar o no la hipótesis nula; por tal motivo, el número de permutaciones es importante, esto brinda mayor solidez al resultado obtenido.
Para nuestro caso en particular se probó el modelo multifactorial multinivel con interacciones, considerando como factores de interés o como efectos principales la edad en rangos, el género y los años. El cálculo del valor -p se realizó con 999 permutaciones (valor sugerido por el autor), y fue obtenido utilizando el paquete vegan (Oksanen et al., 2022) versión 2.6-4, para el software R (R Core Team, 2022); se consideró un nivel de significación de cinco por ciento.
Resultados
Estadística descriptiva de las causas de muerte por género y edad
El presente trabajo considera 56,317 muertes ocurridas en el año 2020, 27,025 para mujeres y 29,292 para hombres, pues se excluyen los casos de niños menores de cinco años para ambos sexos y solo se está tomando en cuenta las causas mencionadas en la Tabla 1. Para mayor facilidad se van a usar para esta sección los códigos T, D, H, VR, HP, RN, CV, I y C, tal como está en la Tabla 1.
La Tabla 2 presenta una comparación porcentual entre los totales de muertes por las causas analizadas en este trabajo para los años 2018, 2019 y 2020, tanto para hombres y mujeres, valores en negro y rojo respectivamente. Si consideramos los años 2019 y 2018, se puede apreciar incrementos en muertes de hombres y mujeres para las causas analizadas del grupo T (Tumores malignos), I (Infartos), RN (Insuficiencia renal crónica), esos incrementos son alrededor de diez por ciento. Si nos enfocamos en el 2020, año en que aparece la Covid-19 y lo comparamos con 2019, se puede apreciar que en las mujeres hubieron incrementos considerables en las causas relacionadas con Diabetes (D), Hipertensión (H), Infartos (I), Virales respiratorias (VR), e Insuficiencia renal crónica (RN) de 49, 59, 79, 31 y 31 por ciento, respectivamente. Mientras que, en los hombres, casi todas las causas presentaron reducción menos VR. Cabe mencionar que en la base de datos analizada se registraron 15,670 y 8,068 casos para hombres y mujeres de la Covid-19 (CV) respectivamente.
Tabla 2 Comparativo porcentual de los casos de muerte analizados
Año | T | D | H | I | C | VR | HP | RN |
---|---|---|---|---|---|---|---|---|
2019 vs 2018 |
8% | 10% | -5% | 8% | -2% | -2% | -1% | 8% |
9% | 12% | 1% | 9% | 1% | 4% | -3% | 10% | |
2020 vs 2019 |
-6% | 7% | -27% | -11% | -43% | 36% | -27% | -35% |
-7% | 49% | 59% | 79% | 7% | 31% | -12% | 31% |
Tumores malignos (T), Diabetes mellitus (D), Hipertensión (H), Influenza, gripe y neumonía (VR), Covid-19 (CV), Fibrosis y cirrosis hepática (HP), Insuficiencia Renal (RN), Infarto Agudo de miocardio (I), Enfermedad cerebrovascular (C).
Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
La Tabla 3 resume la distribución porcentual de los registros totales (2018-2020) de muerte por causa, edad y género.
Tabla 3 Distribución de muertes en Mujeres y hombres por grupo de edades 2018-2020
Mujeres | |||||||||
---|---|---|---|---|---|---|---|---|---|
Edades | T | D | H | I | C | VR | HP | RN | Covid-19 |
(5,50] | 15% | 13% | 3% | 18% | 10% | 13% | 4% | 3% | 21% |
(50,60] | 12% | 20% | 4% | 17% | 7% | 8% | 6% | 4% | 22% |
más de 60 | 8% | 15% | 10% | 26% | 9% | 12% | 4% | 3% | 14% |
Hombres | |||||||||
T | D | H | I | C | VR | HP | RN | Covid-19 | |
(5,45] | 9% | 7% | 2% | 26% | 8% | 17% | 5% | 3% | 23% |
(45,55] | 8% | 13% | 3% | 21% | 7% | 10% | 7% | 3% | 29% |
más de 55 | 8% | 11% | 7% | 26% | 8% | 11% | 4% | 3% | 22% |
Tumores malignos (T), Diabetes mellitus (D), Hipertensión (H), Influenza, gripe y neumonía (VR), Covid-19 (CV), Fibrosis y cirrosis hepática (HP), Insuficiencia Renal (RN), Infarto Agudo de miocardio (I), Enfermedad cerebrovascular (C).
Fuente: elaboración del autor a partir de los datos de INEC.
La Figura 1 presenta diagramas de Pareto para hombres y mujeres, en los cuales se puede ver los conteos de muerte en el año 2020 por cada una de las 18 causas consideradas en este estudio y que por grupos de enfermedad a los que pertenecen de acuerdo a la CIE-10 mencionados en la Tabla 1.

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
Figura 1 Diagrama de Pareto, muertes analizadas 2020, hombres y mujeres
La Figura 1 presente dos ejes y, el primero con las frecuencias absolutas y el otro con las frecuencias relativas acumuladas. Las barras se rigen con la frecuencia absoluta y la línea naranja es una ojiva que grafica la frecuencia relativa acumulada. Por ejemplo, para el primer gráfico de esta figura (hombres), la causa CV presentó aproximadamente 16 mil defunciones para los hombres, es decir cerca de 60 por ciento de muertes por esta causa, además, aproximadamente 80 por ciento de las muertes fueron por las causas codificadas como CV, I VR, mientras que en las mujeres (segundo gráfico) se aprecia que cerca de 80 por ciento de las muertes analizadas fueron por las causas CV, I, D y VR.
La Figura 2 muestra las muertes por edades de las tres principales causas para hombres y mujeres.

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
Figura 2 Muertes por edades hombres y mujeres 2020
Para ambos casos hombres y mujeres la principal causa de muerte registrada fue el Covid-19, para todas las edades, teniendo un incremento importante a partir de los 35 años.
Método XSTATIS: Interestructura
La interestructura parte del cálculo de la matriz de correlaciones vectoriales RV entre los distintos años. En hombres, las muertes del 2018 tuvieron una correlación de 0.94 con las de 2019, mientras que las correlaciones entre las muertes de 2020 con las del año 2018 y 2019 fueron de 0.69, positiva pero no tan alta. Por otro lado, en las mujeres, las muertes del año 2018 tuvieron una correlación de 0.98 con las del año 2019, habiendo un descenso en las correlaciones entre las muertes del año 2020 con las de 2019 y 2018, siendo de 0.78.
A partir de la matriz RV se obtienen los eigenvalores y scores, en este caso la primera dimensión explica 90 y 85 por ciento de la variabilidad de las muertes ocurrida entre los años para hombres y mujeres, respectivamente. Mientras que la segunda dimensión explica 9.7 y 13 por ciento de la variabilidad entre los años para hombres y mujeres, respectivamente.
La Figura 3 muestra la representación de los scores en las dos dimensiones, se puede apreciar la alta correlación entre los años 2018 y 2019, mientras que 2020 se presenta diferente que los años 2018 y 2019.
Cálculo de la matriz compromiso
La matriz compromiso se obtiene combinando linealmente las tablas de datos de los años 2018, 2019, 2020, como se mencionó anteriormente se lo obtiene mediante el primer eigenvector de la matriz RV. Para el caso de hombres, los coeficientes fueron 0.954, 0.955 y 0.852, mientras que para las mujeres fueron 0.974, 0.972 y 0.896 para los años 2018, 2019 y 2020, respectivamente. Es decir, en ambos casos se dio mayores ponderaciones a los años 2018 y 2019.
Al realizar la descomposición de valores singulares en la matriz compromiso se retuvieron dos dimensiones que explicaban 97.5 por ciento para hombres y 98.65 por ciento para mujeres. Los de los grupos de edad y de las variables se pueden visualizar en las Figuras 4 y 5.

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
Figura 4 Grupos Etarios matriz compromiso hombres y mujeres

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
Figura 5 Scores causas de muerte para hombres y mujeres
En la Figura 4, se puede destacar que desde los cinco años hasta antes de los 45 años están representados por puntuaciones negativas en la primera dimensión para hombres y en el caso de mujeres desde los cinco años hasta 50 años, es decir que en estos grupos es a donde se registró menos muertes en todas las causas (debido a que los coeficientes de las variables en la primera dimensión son positivos) y si consideramos las coordenadas negativa de la segunda dimensión las principales causas de muerte fueron las enfermedades Covid-19, Infartos (I), Influenza, Gripe y Neumonía (VR).
Mientras que las edades de 45 a 55 años en hombres y de 50 a 60 años en mujeres tienen puntuaciones positivas en la segunda dimensión y negativas en la primera dimensión, es decir que en estos grupos ya empiezan a aparecer como causas principales de muerte, las enfermedades tumores malignos (T) y diabetes mellitus D (D).
Por otra parte, las edades mayores a 55 en hombres y a 60 en mujeres ya muestran puntuaciones positivas en ambas dimensiones, pudiendo morir por cualquier causa, en especial se presentan puntuaciones altas en la primera dimensión en las edades mayores a 85 años.
En la Figura 5 se puede visualizar que todas las causas analizadas en este estudio tienen cargas vectoriales positivas en la dimensión uno. En relación a la dimensión dos tienen cargas positivas las relacionadas a HP, T, D, RN y la causa I61, hemorragia intraencefálica que está dentro del grupo (C) de enfermedades cerebrovascular y cargas negativas las relacionadas a los grupos VR, CV, I, H, las restantes del grupo C. Las líneas más cercanas indican una mayor correlación entre sí. Por ejemplo, en hombres aparecen muy relacionadas entre sí Diabetes mellitus (E11, E14) y Tumores malignos (C16, C22, C34) y en mujeres, Diabetes mellitus, insuficiencia renal (N18). También se resalta la alta correlación entre la COVID-19 y los grupos de influenza, neumonía y gripe, infarto, hipertensión, lo que coincide con resultados de algunos estudios (Wu & McGoogan, 2020, García-Bustos et al., 2021).
La Intraestructura
Finalmente, en la intraestructura se proyectan las filas y columnas de cada una de las k tablas iniciales en el espacio compromiso, lo cual está representado en las Figuras 6 y 7.
Las Figuras 6 y 7 presenta las puntuaciones factoriales para las diferentes edades considerando dos dimensiones y las cargas vectoriales de las causas para los años 2018-2020 y por género, hombre y mujer. Durante el 2020 se observa como todos los rangos de edad se están agrupando de forma muy distinta con respecto al 2018 y 2019. Además, como durante el año 2020 todas las causas de muerte se están agrupando en la parte inferior del plano, lo que indica la alta correlación entre Covid-19 y las demás causas de muerte afectando tanto a hombres y a mujeres.

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC
Figura 6 Análisis de intraestructura en hombres

Fuente: elaboración del autor usando datos de Defunciones Generales, 2018-2020, INEC.
Figura 7 Análisis de intraestructura en mujeres
Los resultados obtenidos a través del PTA, fueron validados con el PERMANOVA, el cual mostró que existen diferencias significativas entre los niveles de los efectos principales: año, edad, género; así también entre las interacciones de segundo orden: edad-año y edad-género (val-p < 0.05); no así con la interacción año-género (F = 0.944; val-p = 0.443), ni la interacción de tercer orden edad-año-género (F = 0.303; valor-p = 1.000) (Tabla 4).
Tabla 4 Resultados Permanova
Variación | Grados de libertad |
Sumas cuadráticas |
Medias Cuadráticas |
F | Valor p | Sign. |
---|---|---|---|---|---|---|
Año | 1 | 1.9098 | 1.90984 | 41.583 | 0.001 | *** |
Edad | 16 | 20.2468 | 1.26543 | 27.552 | 0.001 | *** |
Gen | 1 | 0.2729 | 0.27287 | 5.941 | 0.002 | ** |
Año:Edad | 16 | 1.6361 | 0.10226 | 2.226 | 0.001 | *** |
Año:Gen | 1 | 0.0433 | 0.04334 | 0.944 | 0.443 | |
Edad:Gen | 16 | 1.4145 | 0.08841 | 1.925 | 0.003 | ** |
Año:Edad:Gen | 16 | 0.2223 | 0.0139 | 0.303 | 1 | |
Residuals | 34 | 1.5616 | 0.04593 | |||
Total | 101 | 27.3075 |
Fuente: elaboración del autor a partir de los datos de INEC.
Construcción de Indicadores a través de PTA
PTA utiliza descomposición de valores singulares de la matriz compromiso para poder construir los scores tanto para filas (edades) y columnas (causas de muerte). Estos scores para las filas y columnas tanto para hombres y mujeres se presentan en la Tabla 5. Se trabajó con solo una dimensión debido a que explicaba alrededor de 87 por ciento tanto para hombres como para mujeres, es decir un valor singular de 0.93.
Tabla 5 Primera Dimensión, Scores Hombres y mujeres
Grupo etario | Score Hombre | Score Mujeres | Causas | Score Hombre | Score Mujeres |
---|---|---|---|---|---|
(5,10] | -0,81 | -0,66 | C16 | 0,23 | 0,23 |
(10,15] | -0,82 | -0,67 | C22 | 0,24 | 0,21 |
(15,20] | -0,8 | -0,66 | C34 | 0,24 | 0,22 |
(20,25] | -0,78 | -0,66 | Covid-19 | 0,08 | 0,08 |
(25,30] | -0,76 | -0,63 | E11 | 0,23 | 0,24 |
(30,35] | -0,69 | -0,61 | E14 | 0,23 | 0,24 |
(35,40] | -0,64 | -0,56 | I10 | 0,26 | 0,25 |
(40,45] | -0,58 | -0,51 | I11 | 0,26 | 0,25 |
(45,50] | -0,44 | -0,42 | I21 | 0,26 | 0,26 |
(50,55] | -0,16 | -0,29 | I61 | 0,24 | 0,24 |
(55,60] | -0,01 | -0,08 | I63 | 0,26 | 0,25 |
(60,65] | 0,29 | 0,05 | I64 | 0,26 | 0,25 |
(65,70] | 0,46 | 0,34 | I67 | 0,26 | 0,26 |
(70,75] | 0,72 | 0,41 | J12 | 0,17 | 0,24 |
(75,80] | 0,94 | 0,63 | J15 | 0,25 | 0,25 |
(80,85] | 0,94 | 0,81 | J18 | 0,26 | 0,25 |
(85 o Más] | 3,13 | 3,51 | K74 | 0,19 | 0,19 |
N18 | 0,26 | 0,25 |
Fuente: elaboración del autor a partir de los datos de INEC.
Los índices se construyeron a través del producto matricial Scoregrupo etareo Scorecausas t, es decir, se multiplicó score (proyección) en la dimensión de mayor variabilidad de los grupos etarios por la transpuesta del score en la dimensión de mayor variabilidad de las causas. De esa manera se obtienen unos indicadores que puntúan más alto mientras más edad tengas, además da mayores puntuaciones a las enfermedades cerebrovasculares, hipertensivas e infarto agudo de miocardio e insuficiencia renal crónica y menor peso a la Covid-19 porque estos indicadores se han obtenido de la matriz compromiso que se obtiene combinando linealmente las matrices de los años 2018, 2019 y 2020.
Estos indicadores se presentan en la Tabla 6 para hombres y mujeres. Para las categorías joven, mediana y mayor edad se han colocado los cuantiles de orden 20, 50 y 80 que corresponden a las edades menores a 45 años, entre 45 y 55 y mayores a 60.
Tabla 6 Indicadores multivariantes Hombres y mujeres
Hombres | Mujeres | |||||
---|---|---|---|---|---|---|
Causas | Jóvenes | Mediana edad |
Personas mayores |
Jóvenes | Mediana edad |
Personas mayores |
Tumores Malignos neoplasias | -0,064 | -0,008 | 0,099 | -0,061 | -0,013 | 0,036 |
Diabetes mellitus | -0,067 | -0,009 | 0,098 | -0,068 | -0,01 | 0,107 |
Enfermedades hipertensivas | -0,07 | -0,007 | 0,111 | -0,069 | -0,011 | 0,108 |
Influenza, gripe y neumonía | -0,063 | -0,007 | 0,099 | -0,071 | -0,012 | 0,107 |
Fibrosis y cirrosis del hígado | -0,052 | -0,006 | 0,078 | -0,051 | -0,008 | 0,082 |
Insuficiencia renal crónica | -0,072 | -0,006 | 0,112 | -0,068 | -0,011 | 0,109 |
Covid-19 | -0,022 | -0,002 | 0,034 | -0,022 | -0,004 | 0,036 |
Infarto agudo del miocardio | -0,073 | -0,007 | 0,114 | -0,072 | -0,011 | 0,116 |
Enfermedades cerebrovasculares | -0,069 | -0,008 | 0,109 | -0,069 | -0,01 | 0,115 |
Fuente: elaboración del autor a partir de los datos de INEC.
Se puede apreciar que de manera general los indicadores son mayores en hombres que en mujeres. Siendo los indicadores similares para la categoría de jóvenes en ambos sexos, y el de mayor valor el de la Covid-19, que fue la causa que ocasionó la mayor cantidad de muertes para ese grupo de edad en relación a las causas analizadas en este estudio. Situación similar ocurre en la mediana edad, mientras que para la categoría “personas mayores”, aunque la Covid-19 fue la que ocasionó mayor cantidad de muertes en comparación con las demás causas analizadas y en todos los años analizados, el infarto agudo de miocardio generó una cantidad similar de muertes en el 2020 y ha sido la que mayor cantidad de registros de muerte ha ocasionado en los años analizados, por eso tiene la mayor puntuación.
Como se mencionó antes, estos indicadores fueron obtenidos con la matriz compromiso, que ha dado mayor peso a las matrices de datos de los años 2018 y 2019, sería importante compararlos con los indicadores obtenidos solamente para 2020, por ello a continuación en la Tabla 7 se los presenta:
Tabla 7 Indicadores multivariantes Hombres y mujeres, año 2020
Hombres | Mujeres | |||||
---|---|---|---|---|---|---|
Causas | Jóvenes | Mediana edad |
Personas mayores |
Jóvenes | Mediana edad |
Personas mayores |
Tumores Malignos neoplasias | -0,9933 | -0,0520 | 0,9467 | -1,0067 | -0,1067 | 0,9367 |
Diabetes mellitus | -1,0300 | -0,0610 | 0,9845 | -1,0350 | -0,0950 | 0,9940 |
Enfermedades hipertensivas | -0,9800 | -0,0400 | 0,9600 | -1,0060 | -0,0985 | 0,9620 |
Influenza, gripe y neumonía | -0,9767 | -0,0573 | 0,9433 | -1,0133 | -0,1077 | 0,9543 |
Fibrosis y cirrosis del hígado | -0,8000 | -0,0600 | 0,7500 | -0,8300 | -0,0800 | 0,7900 |
Insuficiencia renal crónica | -1,0600 | -0,0800 | 1,0070 | -1,0600 | -0,1000 | 1,0010 |
Covid-19 | -0,9600 | -0,0800 | 0,9000 | -0,9180 | -0,0890 | 0,8855 |
Infarto agudo del miocardio | -1,0400 | -0,0700 | 0,9900 | -1,0600 | -0,1230 | 0,9740 |
Enfermedades cerebrovasculares | -1,0150 | -0,0600 | 0,9850 | -1,0530 | -0,1153 | 0,9840 |
Fuente: elaboración del autor a partir de los datos de INEC.
Los indicadores obtenidos para el año 2020 (Tabla 7) son diferentes y se alejan a los indicadores del compromiso, esto se debe al cambio de la intraestructura de 2020 en relación a los otros años (ver Figuras 6 y 7), lo que refleja la situación fuera de control que se vivió por la pandemia de la Covid-19.
Discusión y conclusiones finales
En este trabajo se aplica la metodología XSTATIS a datos de mortalidad de las principales causas de muerte de Ecuador durante los años 2018, 2019 y 2020. Se puede apreciar la gran utilidad de esta técnica multivariante que va desde analizar las interestructura, intraestructura de cada tabla de datos, hasta la construcción de indicadores que pueden resumir las características importantes para cada subpoblación de estudio.
En la interestructura se refleja el comportamiento atípico del año 2020 en relación a los anteriores, mientras que a través de los scores obtenidos de la matriz compromiso se refleja las relaciones entre causas principales de muerte y grupo de edad durante el período 2018-2020 (Figuras 4 y 5) de manera resumida usando una menor dimensión de trabajo (dos dimensiones). Lo visualizado en la matriz compromiso puede ser contrastado con los conteos de muerte observados durante el período 2018-2020 (Tabla 3).
En las Figuras 4 y 5 se formaron grupos o estratos de edades tanto en hombres como en mujeres que se pueden visualizar por las burbujas incorporadas en los gráficos. En mujeres se contabilizaron siete por ciento y nueve por ciento de casos en los grupos de los más jóvenes y de la mediana edad, respectivamente con valores negativos en la primera dimensión, esto se debe a que el conteo de casos en esos datos es menor. Se puede apreciar como a través de esta metodología se resaltan las similaridades entre filas y variables a través del estudio de la matriz compromiso y de la interestructura.
La matriz compromiso nos permitió observar las asociaciones que se mantuvieron estables a través del tiempo en cuanto a causas de muerte según los rangos de edad; indicando que las principales causas de muerte fueron Covid-19, infartos (I), influenza, gripe y neumonía (VR); y que en las edades de 45 a 55 años en hombres y de 50 a 60 años en mujeres las causas principales fueron tumores malignos (T) y diabetes mellitus (D).
La construcción de indicadores a través de variables latentes de la forma que se presenta en este trabajo permite ver la interacción causa y grupo a través de los años. Como es de esperarse la mayor cantidad de muertes se registran en edades mayores, sin embargo, en el año 2020 se incrementó las muertes en los grupos jóvenes y de mediana edad por lo que en los indicadores se reflejó que la Covid-19 tenía la mayor puntuación en estos grupos de edades para hombres y mujeres (Tabla 4), mientras que, en las edades mayores, el infarto agudo de miocardio fue la que obtuvo mayor puntuación. Estos indicadores al compararse con los obtenidos en el año 2020 reflejan que ese año fue atípico, por lo que los indicadores se pueden también usar para diseño de gráficos de control de calidad de variables que sea de interés monitorear para los investigadores.
Una vez más, a través de una aplicación a datos de mortalidad, se puede apreciar como la metodología XSTATIS es muy útil en diversos ámbitos de estudios, como en el presente trabajo, en el que se analizó la interacción de variables en diversos grupos a través del tiempo. Adicionalmente, para realizar el presente estudio no se requirió del total de subpoblaciones que, en el caso de Ecuador, se basan en proyecciones porque los censos se hacen cada diez años. Estas proyecciones se hacen de manera general y no se estiman para todos los posibles subgrupos de la población ecuatoriana (INEC, 2023). Métodos como regresión logística y Poisson requieren de los totales éxitos, fracasos, que para este caso (Población viva, Población muerta).