Servicios Personalizados
Revista
Articulo
Indicadores
- Citado por SciELO
- Accesos
Links relacionados
- Similares en SciELO
Compartir
Revista Chapingo serie ciencias forestales y del ambiente
versión On-line ISSN 2007-4018versión impresa ISSN 2007-3828
Rev. Chapingo ser. cienc. for. ambient vol.20 no.2 Chapingo may./ago. 2014
https://doi.org/10.5154/r.rchscfa.2013.09.034
Selección de predictores ambientales para el modelado de la distribución de especies en Maxent
Selection of environmental predictors for species distribution modeling in Maxent
Gustavo Cruz-Cárdenas1*; José Luis Villaseñor2; Lauro López-Mata4; Enrique Martínez-Meyer3; Enrique Ortiz2
1 Instituto Politécnico Nacional, CIIDIR-IPN-Michoacán, COFAA, Justo Sierra 28. C. P. 59510. Jiquilpan, Michoacán, MÉXICO. Correo-e: guscruz@ipn.mx Tel.: 353 53 3 00 83 (*Autor para correspondencia).
2 Departamento de Botánica, Instituto de Biología, Universidad Nacional Autónoma de México. Tercer Circuito s/n, Ciudad Universitaria, Delegación Coyoacán. C. P. 04510. México, D. F.
3 Depto. de Zoología, Instituto de Biología, Universidad Nacional Autónoma de México. Tercer Circuito s/n, Ciudad Universitaria, Delegación Coyoacán. C. P. 04510. México, D. F.
4 Colegio de Postgraduados, campus Montecillo. Carretera México-Texcoco km 36.5. C. P. 56230. Texcoco, Estado de México, MÉXICO.
Recibido: 17 de septiembre, 2013
Aceptado: 07 de mayo, 2014
RESUMEN
Antes de realizar el modelado de la distribución potencial de una especie, se recomienda hacer una preselección de covariables pues la redundancia o variables irrelevantes pueden inducir sesgos en la mayoría de los modelos. En este estudio, se propuso un método automatizado para la selección a priori de covariables utilizadas en el modelado. Se emplearon cinco especies típicas de la flora mexicana (Catopheria chiapensis, Liquidambar styraciflua, Quercus martinezii, Telanthopora grandifolia y Viburnum acutifolium) y 56 covariables ambientales. Se generaron matrices de presencia-ausencia para cada especie y se analizaron empleando regresión logística; el modelo resultante de cada especie se evaluó mediante un remuestreo bootstrap. La distribución de las cinco especies se modeló usando el algoritmo de máxima entropía y con el empleo de tres conjuntos de covariables ambientales. La precisión de los modelos generados se evaluó con intervalos de confianza de cada curva característica operativa del receptor (COR). Los intervalos de confianza de las curvas COR resultantes no mostraron diferencia significativa (P < 0.05) entre los tres modelos predictivos generados; sin embargo, el modelo más parsimonioso se obtuvo con el método propuesto.
Palabras clave: Datos de sensores remotos, propiedades de suelos, selección automatizada de covariables.
ABSTRACT
Prior to conducting the modeling of the potential distribution of a species, it is advised to make a pre-selection of covariables because redundancy or irrelevant variables may induce errors in most modeling systems. In this study, we propose an automated method for a priori selection of covariables used in modeling. We used five typical species of the Mexican flora (Catopheria chiapensis, Liquidambar styraciflua, Quercus martinezii, Telanthopora grandifolia and Viburnum acutifolium) and 56 environmental covariables. Presence-absence matrices were generated for each species and were analyzed using logistic regression, and the resulting model of each species was evaluated via a bootstrap resampling. We modeled the distribution of five species using maximum entropy and employed three sets of environmental covariables. The precision of the models generated was evaluated with the confidence intervals for each receiver operating characteristic (ROC) curve. The confidence intervals of the resulting ROC curves showed no significant difference between (P < 0.05) the three predictive models generated; nevertheless, the most parsimonious model was obtained with the proposed method.
Keywords: Remote sensing data, soil properties, automated selection of covariables.
INTRODUCCIÓN
Los algoritmos utilizados para la inferencia de las distribuciones potenciales de las especies son herramientas precisas, rápidas y útiles en el campo de la biogeografía (Phillips, Anderson, & Schapire, 2006; Phillips & Dudik, 2008). El modelado de nicho ecológico se ha convertido en la principal herramienta para el modelado de distribución de especies. Se necesitan dos fuentes de entrada de datos para la generación de modelos de distribución basados en nichos, es decir, la presencia/ausencia de la especie o sólo la presencia de datos y un conjunto de variables ambientales relevantes. La pre-selección de covariables candidatas para el modelado de la distribución de las especies se debe hacer antes del modelado (Elith et al., 2011), por lo que es necesario realizar análisis para eliminar la autocorrelación entre covariables, y por lo tanto, evitar la inestabilidad en el modelado. Se han empleado diversas técnicas para este propósito, tales como el uso del coeficiente de correlación de Pearson (Kumar & Stohlgren, 2009), donde se evalúa la multicolinealidad, o la regresión múltiple, que utiliza el factor de inflación de la varianza (Der & Everitt, 2002). Otra alternativa es el uso de análisis de decisión del árbol, donde la parsimonia (el número mínimo de covariables con el mejor ajuste posible) es uno de los principales enfoques para evaluar la mejor clasificación. Por ejemplo, D'heygere, Goethals, y De Pauw (2003) aplicaron este análisis para reducir el conjunto original de covariables a 62.5 % sin afectar a la precisión del modelo predictivo. Las redes neuronales artificiales también se han utilizado para pre-seleccionar las covariables, en los que se aplican los mismos criterios como en el análisis de árbol de decisión para evaluar la parsimonia de los modelos predictivos. Con la aplicación de esta técnica, el conjunto original de covariables se redujo de 17 a 9 y la precisión del modelo predictivo se incrementó del 78 al 80 % (D'heygere, Goethals, & De Pauw, 2006). Como alternativa, Austin y Tu (2004a) proponen el uso de remuestreo bootstrap, donde se espera que las covariables verdaderamente independientes estén presentes en el mayor número de muestras bootstrap, mientras que las variables de ruido están presentes como predictores en un menor número de muestras bootstrap. La ventaja de la técnica de bootstrap sobre los demás es que se realiza de forma automática, permite la estimación de una función de distribución empírica a través del remuestreo de los datos observados, y el modelo más seleccionado no se ve afectado por autocorrelación (Austin & Tu , 2004a). La última afirmación se basa en el hecho de que, dadas dos variables de autocorrelación, X1 y X2, si X2 se excluye del proceso de selección del modelo, entonces es posible que X1 puede ser identificada como un predictor independiente en todas las muestras bootstrap.
El objetivo de este estudio fue evaluar y proponer una metodología para la selección de covariables con remuestreo bootstrap que se debe utilizar en el modelado de las distribuciones potenciales de las especies. Este método reduce el sobreajuste del modelo porque las covariables se seleccionan a priori, disminuye la autocorrelación ya que el remuestreo bootstrap permite varias combinaciones de datos y covariables, y selecciona las covariables más significativas para cada especie en particular.
MATERIALES Y MÉTODOS
Área de estudio
Catopheria chiapensis A. Gray ex Benth., Liquidambar styraciflua L., Quercus martinezii C.H. Müll., Telanthopora grandifolia (Less.) H. Rob. & Brettell, Viburnum acutifolium Benth., especies características del bosque húmedo de montaña (BHM) en México, fueron seleccionadas porque el BHM siendo el bioma con mayor riqueza de especies de plantas vasculares por unidad de superficie, aunque estas especies pueden estar presentes en otros tipos de vegetación, son características del BHM (Rzedowski, 1996; Villaseñor, 2010) (Cuadro 1). Los estados donde se presentan las cinco especies fueron 13, mientras que los estados con mayor número de registros (82) fueron Oaxaca y Veracruz, y los que tienen un solo registro fueron el Estado de México, Jalisco, Tabasco y San Luis Potosí (Figura 1). A pesar de esta gran riqueza el estar situado en una superficie relativamente pequeña de terreno montañoso, el bioma tiene una heterogeneidad elevada de ambientes (clima, suelos y altitud) y un alto grado de fragmentación del hábitat en toda su área (Ramírez-Marcial, González-Espinosa, & Williams-Linera, 2001; Vázquez-García, 1995). Este bioma incluye un amplio conjunto de asociaciones vegetativas heterogéneas, que varían geográficamente tanto en la composición y estructura de la flora, así como en el estado de conservación y el nivel de perturbación a los que están siendo o han sido sometidos (Challenger & Caballero, 1998; Luna-Vega, Alcantara-Ayala, Ruíz-Pérez, & Contreras-Medina, 2006; Ramírez-Marcial et al., 2001; Rzedowski, 1996).
Registros de presencia-ausencia de especies
Los lugares para la colección de cinco especies se obtuvieron mediante la georreferenciación de los ejemplares depositados en el Herbario Nacional de México (MEXU) del Instituto de Biología de la UNAM. En el Cuadro 1 se muestra una base de datos con 336 registros de cinco especies presentes en el BHM. El segundo grupo consistió en especies de biomas diferentes al BHM (100 registros de 25 especies), tales como el matorral desértico, y de sitios en los estados donde no se ha registrado el BHM.
Covariables ambientales
Se utilizaron 56 covariables en el análisis para evaluar cuáles están mejor asociadas con una distribución específica, todas ellas con una resolución de pixel de 1 km2:
a) La información sobre el clima (26 covariables), que incluyen 19 covariables tomadas de WORLDCLIM (Hijmans, Cameron, Parra, Jones, & Jarvis, 2005), y cuatro derivados de los siguientes subgrupos: precipitación total en la temporada de lluvias del año (mayo a octubre), precipitación total en la época seca del año (noviembre a abril), temperatura media de la temporada de lluvias del año (mayo a octubre), y temperatura media de la estación seca del año (noviembre a abril). Las tres variables restantes son: tasa de evapotranspiración, evapotranspiración real anual (ETRA), evapotranspiración real de la temporada de lluvias del año (ETRAH, mayo a octubre) y evapotranspiración real de la época seca del año (ETRAS, noviembre a abril). La evapotranspiración se calculó basándose en el modelo de Turc (1954), como se muestra a continuación:
ETRA = P / [0.9 + (P/L)2]½
Donde:
ETRA = Evapotranspiración real anual (mm)
P = Precipitación anual total (mm)
T = Temperatura media anual (°C)
L = 300 + 25T +0.05T3
b) Atributos topográficos (nueve covariables). El modelo digital de elevación (MDE) fue descargado desde el sitio web del USGS (Servicio Geológico de los Estados Unidos, 2010) y se utilizó para generar los siguientes ocho atributos topográficos con SAGA GIS (Cimmery, 2010): pendiente, orientación (de 0° a 359°), escorrentía, índice de convergencia, índice de humedad topográfica, índice de rugosidad del terreno (Riley, DeGloria, & Elliot, 1999), medida de rugosidad del vector (Sappington, Longshore, & Thompson, 2007) y calentamiento anisotrópico.
c) Propiedades del suelo (nueve covariables). Estas covariables fueron generadas por Cruz-Cárdenas et al. (2014), que incluyen: materia orgánica, relación de absorción de sodio, pH, conductividad eléctrica, carbono orgánico, K, Na, Mg y Ca.
d) Índices de vegetación (12 covariables). Los índices de vegetación medios mensuales fueron descargados para el año 2009 de la página web de la USGS (2010) del satélite MODIS. Son siete escenas que cubren el territorio de México y se encuentran en proyección sinusoidal. Se generó un mosaico con las siete escenas, las cuales se transforman a coordenadas geográficas para que sea compatible con las covariables previas. Este procedimiento permitió la generación de 12 índices de vegetación mensuales para todo el país.
Configuración de matrices de presencia-ausencia para la evaluación de modelos predictivos
Se generó una matriz de datos para cada una de las cinco especies analizadas desde el BHM. La matriz contiene 100 filas de ausencias más N filas que corresponden al número de registros de presencia. El número de columnas fue de 57, que incluye las 56 covariables ambientales más una de presencia (1) o ausencia (0). Elith et al. (2011) recomiendan datos de modelos de presencia y ausencia (cuando sea posible), ya que al usar ambos se proporciona más y mejor información sobre la prevalencia (es decir, las zonas donde la especie está presente) que solo con los datos de presencia.
Aplicación del método bootstrap
Se aplicó una regresión binomial para cada matriz de presencia-ausencia. Posteriormente, el siguiente proceso se aplicó 1000 veces (muestras bootstrap) para el modelo predictivo resultante de esta regresión, con este número de repeticiones es apropiado porque se obtienen modelos predictivos parsimoniosos (Austin & Tu, 2004b), utilizando la biblioteca bootStepAIC (Dimitris, 2009) del software R (R Development Core Team, 2010): 1) se simuló un nuevo conjunto de datos tomando una muestra con reemplazo de las filas de la matriz, 2) el modelo predictivo se ajustó utilizando el conjunto de datos en el paso 1, al ejecutar el algoritmo StepAIC (Venables & Ripley, 2010), que aplica un proceso «hacia atrás» (la eliminación se inicia al usar todas las covariables en el modelo y estos se excluyen de forma secuencial desde el modelo hasta que se cumpla el nivel de significación), con P = 0.01 para la eliminación de una covariable a partir del modelo. Los valores de salida de bootstrap que se usaron para la selección de covariables componen la matriz (cuántas veces se seleccionó la covariable de las 1000 muestras bootstrap para formar el modelo predictivo) y la matriz de significancia (de las veces que fue seleccionada, ¿cuántas veces fue significativa la variable?). Las dos matrices se multiplicaron entre sí y se dividieron entre 100, para ponderar las variables tomando en cuenta el porcentaje en su selección significativa por el modelo. Finalmente, el tercer cuartil de la matriz resultante se calculó con el objetivo de seleccionar aquellas covariables que fueron iguales o mayor a ese valor.
Modelado de distribución
Una vez que las covariables fueron seleccionadas con el método bootstrap, se realizó el modelado de la distribución potencial de la especie en Maxent (Phillips et al., 2006). La finalidad de Maxent es estimar la distribución de probabilidad del objetivo a través de la distribución de probabilidad de máxima entropía (cercana a la uniforme), delimitado por un conjunto de reglas para representar la información incompleta acerca de la distribución de destino. La información disponible acerca de la distribución de destino por sí misma se presenta como un conjunto de covariables conocidas como características y se esperan restricciones de cada característica que debe corresponder a sus valores medios de la muestra (la media muestral para un conjunto de puntos de muestreo se han extraído de la distribución destino). Ya que Maxent se utiliza para modelar la distribución de especies con sólo registros de presencia, los píxeles del área de estudio se han convertido en el espacio en el que se delimita la distribución de probabilidad, los píxeles para registrar las ocurrencias de especies conocidas son los puntos de muestreo, las características son las covariables de clima, topografía, suelos, vegetación y otras covariables ambientales. Maxent se configuró solo con los registros de presencia de la especie; los puntos totales de ocurrencia de cada especie se dividieron en: registros de entrenamiento (75 %) y validación (25 %). Se seleccionaron 10,000 puntos de trasfondo, la configuración predeterminada de los tipos de niveles de regularización y de características (Phillips & Dudik, 2008), y el formato de salida fue logístico. La misma configuración de Maxent se utilizó para el modelado con dos grupos de covariables adicionales, uno con todas las covariables (56) y otro con covariables bioclimáticas de wordclim (19) para comparar la diferencia entre los modelos resultantes. Los modelos logísticos finales se convirtieron en mapas binarios utilizando el valor de probabilidad de 10 % como umbral, para maximizar la sensibilidad y minimizar la especificidad (Phillips et al., 2006).
Análisis de modelos de distribución
Se realizó una evaluación inicial mediante la aplicación de una prueba binomial para cada modelo generado con la finalidad de determinar si el resultado era mejor que una distribución aleatoria. En una segunda prueba, se utilizó el análisis de la curva característica de operación del receptor (COR) para comparar los niveles de precisión de los tres modelos que se generan en Maxent: con las 56 covariables (Modelo 1), las 19 covariables Bioclim (Modelo 2), y la variable número determinado de covariables seleccionadas mediante el método bootstrap (Modelo 3). La curva COR evalúa la configuración de un modelo en términos de errores de omisión y comisión por medio de un solo número, mientras que el área bajo la curva (ABC) puede evaluar diferentes modelos (Fawcett, 2006). Se emplearon los intervalos de confianza bootstrap (BCα) con 10,000 repeticiones para encontrar si las diferencias de los valores de ABC entre los tres modelos fueron significativos. Los intervalos de percentiles se definen como la diferencia entre la mediana de del bootstrap, y la estimada a partir de la muestra original. El sesgo constante estimado se denota por y se define como:
Donde Φ-1 simboliza el inverso de distribución normal acumulativa y # "número de" medias. Entonces, un intervalo de confianza percentil de 100 (1-α) por ciento del sesgo corregido para θ se origina por:
Donde α1 y α2 son el cuantil revisado en el que se basa la valoración de los intervalos de confianza percentil. Estos cuantiles se definen como:
y
Donde Φ es distribución normal estándar acumulativa. El método BCα es un algoritmo automático para la producción de intervalos de confianza con alta precisión de una distribución bootstrap (DiCiccio & Efron, 1996).
Por último, se evaluó la incertidumbre de la distribución potencial de las especies mediante una validación cruzada 10-fold usando Maxent (Elith & Leathwick, 2009). Dicha validación consistió en dividir los datos sobre la presencia de especies en 10 subconjuntos. Uno de los subconjuntos se utilizó como validación de datos y los nueve restantes como datos de entrenamiento en el modelado. El proceso de validación cruzada se repite durante 10 iteraciones, con cada uno de los posibles subconjuntos de datos de validación. Los resultados de la validación cruzada son grids de promedio, la mediana y la desviación estándar de las iteraciones. El grid de la desviación estándar se utilizó para determinar la incertidumbre de los modelos de las especies.
RESULTADOS Y DISCUSIÓN
En el Cuadro 2 se muestran las covariables seleccionadas para cada especie. El número de covariables oscila de 13 a 14. Las covariables con la frecuencia más alta para este conjunto de especies fueron: rango promedio de temperaturas diarias (bio2), precipitación anual (bio12), y evapotranspiración real anual (ETRA), se presentan en cuatro de las cinco especies. Los resultados concuerdan con los de Bruijzeel, Waterloo, Proctor, Kuiters & Kotterink (1993), quienes también señalan como característica distintiva del BHM las lluvias abundantes, así como una tasa baja de pérdida de la evapotranspiración. Vogelman (1973) sugirió que las temperaturas moderadas y la humedad atmosférica alta son los principales determinantes ambientales de la vegetación en el BHM. Por otra parte, la covariable más importante (con la puntuación total más alta en la matriz resultante de la técnica de bootstrap) para cada especie fue: el índice normalizado de vegetación de mayo (NDVIMAY2009) para C. chiapensis, el modelo digital de elevación (MDE) para L. styraciflua y V. acutifolium, pH para Q. martinezii, y el rango promedio de temperaturas diarias (bio2) para T. grandifolia.
La técnica aquí propuesta para la selección de covariables evita el problema encontrado por Austin y Tu (2004b) con el remuestreo bootstrap. Estos autores identificaron 940 subgrupos de covariables como predictores independientes de 1000 muestras bootstrap y menos del 1% de esos subgrupos se repitieron cuatro veces. En este caso, se tomaron en cuenta otros criterios para seleccionar las covariables, y la prueba COR mostró una mayor consistencia. La técnica bootstrap es eficiente para la selección de las covariables, ya que permite una reducción a priori del número de covariables utilizados en el modelado de la distribución potencial de especies sin reducir la precisión. Por el contrario, se recomienda reducir el número de variables para evitar el sobreajuste del modelo, sobre todo cuando el número de registros es bajo (Stockwell & Peterson, 2002).
En cuanto a la validación del modelo con la prueba binomial, todos los modelos, excepto el modelo 1 para V. acutifolium fueron mejores que las expectativas al azar (Cuadro 3). Por otra parte, los análisis de la curva COR indicaron que no hubo diferencias significativas (P < 0.05) en la precisión existente entre los tres modelos para cada especie (Figura 2). La distribución de las especies de plantas de los tres modelos es mejor que la distribución al azar como se observa en las curvas de la Figura 2 que se proyectan hacia el noroeste o mayor a 0.95 ABC (Fawcett, 2006), concluyendo que las predicciones de los modelos generados contienen principalmente verdaderos positivos (sensibilidad) y un menor número de falsos negativos (1-especificidad). En el Cuadro 4 se muestran los intervalos de confianza bootstrap (BCα) de los tres modelos para cada especie. El BCα del área bajo la curva (ABC) indica que no hubo diferencias significativas (P < 0.05) entre los tres modelos; sin embargo, el modelo más parsimonioso fue consistentemente el modelo 3. En especies con menos de 50 registros, el valor BCα del modelo 1 fue bastante grande, a diferencia del modelo 3, lo que sugiere que con pocos registros, la selección de variables con el método bootstrap resulta más adecuada.
En la Figura 3 se muestra la incertidumbre de los modelos de distribución de especies. Se observó diferencia significativa (P < 0.05) de la incertidumbre de los modelos generados con 56 variables y las generadas con las variables seleccionadas por el método bootstrap (Figuras 3a). Por el contrario, no se mostraron diferencias entre los modelos, ya que se usaron tanto las 19 covariables WorldClim y las covariables seleccionadas por la técnica propuesta. Sin embargo, los modelos de incertidumbre eran más pequeños utilizando las covariables seleccionadas. La gráfica de cajas muestra que hay una variación mayor en los valores de incertidumbre de los modelos de distribución de C. chiapensis. A partir de esto, se utilizaron los modelos de distribución de C. chiapensis para ilustrar la variación geográfica de incertidumbre (Figura 3c y 3d). En la Figura 3c (con 56 covariables) se muestra una incertidumbre mayor en casi toda el área prevista en comparación con la Figura 3d (con las covariables seleccionadas por bootstrap). Esto sugiere que una selección a priori de las covariables permite reducir la incertidumbre desde el punto de vista espacial.
Las covariables que explican mejor la distribución potencial del conjunto de especies evaluadas están estrechamente relacionadas con el medio ambiente en el que se distribuye el BHM en México (Instituto Nacional de Estadística y Geografía [INEGI], 2005; Figura 4). Sin embargo, algunas de las especies analizadas no son exclusivas del BHM, por lo tanto, los modelos se ampliaron a los sitios con otros biomas (Figura 5). Por ejemplo, C. chiapensis también se encuentra en ambientes tropicales y templados del sureste de México, tal y como preside su modelo de distribución potencial (Figura 5a). Lo mismo sucede para Q. martinezii, cuya distribución potencial incluye áreas húmedas y templadas de montaña en el centro y sureste de México (Figura 5d).
Las áreas de co-ocurrencia de las cinco especies coinciden con las delimitaciones anteriores del BHM en México (Figura 4) (Challenger & Caballero, 1998; Luna-Vega et al., 2006; Ramírez-Marcial et al., 2001; Rzedowski, 1996; Villaseñor, 2010), respaldando nuestros resultados. Este bioma se encuentra principalmente a lo largo de las cadenas montañosas, en la Sierra Madre Occidental, desde Sonora hasta Jalisco, en la Sierra Madre Oriental, desde el sur de Tamaulipas al centro de Veracruz, en la Sierra Madre del Sur, en Guerrero y Oaxaca, en el Sierra Norte de Oaxaca, a lo largo de la Faja Volcánica Transmexicana, y en la Sierra Madre de Chiapas.
CONCLUSIONES
Los modelos de distribución de especies analizados fueron mejorados con la inclusión de covariables de suelo, topografía y datos de sensores remotos. Por lo tanto, se recomienda el uso de covariables auxiliares y bioclimáticas, para el modelado de la distribución de especies. El método de bootstrap es útil para la selección a priori de covariables utilizadas en el modelado. Sin embargo, se requiere la presencia y la ausencia de datos para que este método pueda ser aplicado. Una alternativa para la definición de la ausencia se basa en el conocimiento de la historia de vida de las especies objetivo; por ejemplo, al conocer los requisitos climáticos o el rango de altitud donde se encuentra una especie, es posible definir los sitios que pueden funcionar como ausencias.
AGRADECIMIENTOS
El primer autor agradece a la Dirección General de Asuntos del Personal Académico de la Universidad Nacional Autónoma de México (UNAM), por dos años de beca postdoctoral (2010-2012) para llevar a cabo esta investigación bajo la supervisión del Dr. José Luis Villaseñor del Instituto de Biología.
LITERATURA CITADA
Austin, P. C., & Tu, J. V. (2004a). Bootstrap methods for developing predictive models. The American Statistician, 58(2), 131-137. Obtenido de http://www.jstor.org/discover/10.2307/27643521?uid=3738664&uid=2129&uid=2&uid=70&uid=4&sid=21102531764551 [ Links ]
Austin, P. C., & Tu J. V. (2004b). Automated variable selection methods for logistic regression produced unstable models for predicting acute myocardial infarction mortality. Journal of Clinical Epidemiology, 57(11), 1138-1146. doi: 10.1016/j.jclinepi.2004.04.003 [ Links ]
Bruijzeel, L. A., Waterloo, M. J., Proctor, J., Kuiters, A. T., & Kotterink, B. (1993). Hydrological observations in montane rain forest on Gunung Silam, Sabah, Malasya, with special reference to the 'Massenerhebung' effect. Journal of Ecology, 81(1), 141-167. http://www.jstor.org/discover/10.2307/2261231?uid=3738664&uid=2&uid=4&sid=21103215050991 [ Links ]
Challenger, A., & Caballero, J. (1998). Utilización y conservación de los ecosistemas terrestres de México: Pasado, presente y futuro. México: Comisión Nacional para el Conocimiento y Uso de la Biodiversidad. [ Links ]
Cimmery, V. (2010). SAGA User Guide, updated for SAGA version 2.0.5. USA: Geosystem Analysis. Obtenido de http://www.saga-gis.org/en/index.html [ Links ]
Cruz-Cárdenas, G., López-Mata, L., Ortiz-Solorio, C. A., Villaseñor, J. L., Ortiz, E., Silva, J. T., & Estrada-Godoy, F. (2014). Interpolation of Mexican soil properties at a scale of 1: 1,000,000. Geoderma, 213, 29-35. doi: 10.1016/j.geoderma.2013.07.014 [ Links ]
Der, G., & Everitt, B. S. (2002). Handbook of statistical analyses using SAS. USA: CRC Press. [ Links ]
D'heygere, T., Goethals, P. L., & De Pauw, N. (2003). Use of genetic algorithms to select input variables in decision tree models for the prediction of benthic macroinvertebrates. Ecological Modelling, 160(3), 291-300. doi: 10.1016/S0304-3800(02)00260-0 [ Links ]
D'heygere, T., Goethals, P. L., & De Pauw, N. (2006). Genetic algorithms for optimization of predictive ecosystems models based on decision trees and neural networks. Ecological Modelling, 195(1-2), 20-29. doi: 10.1016/j.ecolmodel.2005.11.005 [ Links ]
DiCiccio, T., & Efron, B. (1996). Bootstrap confidence intervals. Statatical Science, 11, 189-228. Obtenido de http://www.jstor.org/discover/10.2307/2246110?uid=3738664&uid=2129&uid=2&uid=70&uid=4&sid=21102531814331 [ Links ]
Dimitris, R. (2009). Bootstrap stepAIC. R package version 1.2-0. Vienna, Austria: R Foundation for Statistical Computing. Obtenido de http://cran.r-project.org/web/packages/bootStepAIC/bootStepAIC.pdf [ Links ]
Elith, J., & Leathwick, J. R. (2009). Species distribution models: Ecological explanation and prediction across space and time. Annual Review of Ecology, Evolution, and Systematics, 40(1), 677-697. doi: 10.1146/annurev.ecolsys.110308.120159 [ Links ]
Elith, J., Phillips, S. J., Hastie, T., Dudík, M., Chee, Y. E., & Yates, C. J. (2011). A statistical explanation of MaxEnt for ecologists. Diversity and Distributions, 17(1), 43-57. doi: 10.1111/j.1472-4642.2010.00725.x [ Links ]
Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861-874. doi: 10.1016/j.patrec.2005.10.010 [ Links ]
Hijmans, R. J., Cameron, S. E., Parra, J. L., Jones, P. G., & Jarvis, A. (2005). Very high resolution interpolated climate surfaces for global land areas. International Journal of Climatology, 25(15), 1965-1978. doi: 10.1002/joc.1276 [ Links ]
Instituto Nacional de Estadística y Geografía (INEGI). (2005). Mapa de uso de suelo y vegetación 1:250000. Obtenido de http://www.inegi.org.mx/geo/contenidos/recnat/usosuelo/ [ Links ]
Kumar, S., & Stohlgren, T. J. (2009). Maxent modeling for predicting suitable habitat for threatened and endangered tree Canacomyrica monticola in New Caledonia. Journal of Ecology and natural Environment, 1(4), 94-98. Obtenido de http://www.academicjournals.org/jene/PDF/Pdf2009/July/Kumar%20and%20Stohlgren.pdf [ Links ]
Luna-Vega, I., Alcantara-Ayala, O., Ruíz-Pérez, C. A., & Contreras-Medina, R. (2006). Composition and structure of humid montane oak forests at different sites in central and eastern Mexico. In Kapelle, M. (Ed.), Ecology and conservation of neotropical montane oak forests (pp. 101-112). New York, USA: Springer-Verlag. [ Links ]
Phillips, S. J., Anderson, R. P., & Schapire, R. E. (2006). Maximum entropy modeling of species geographic distributions. Ecological Modelling, 190(3), 231-259. doi: 10.1016/j.ecolmodel.2005.03.026 [ Links ]
Phillips, S. J., & Dudik, M. (2008). Modeling of species distributions with Maxent: New extensions and a comprehensive evaluation. Ecography, 31(2), 161-175. doi: 10.1111/j.0906-7590.2008.5203.x [ Links ]
R Development Core Team (2010). R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing. Obtenido de http://www.R-project.org/ [ Links ]
Ramıírez-Marcial, N., González-Espinosa, M., & Williams-Linera, G. (2001). Anthropogenic disturbance and tree diversity in montane rain forests in Chiapas, Mexico. Forest Ecology and Management, 154(1), 311-326. doi: 10.1016/S0378-1127(00)00639-3 [ Links ]
Riley, S. J., DeGloria, S. D., & Elliot, R. (1999). A terrain ruggedness that quantifies topographic heterogeneity. Intermountain Journal of Sciences, 5(1-4), 23-27. Obtenido de http://download.osgeo.org/qgis/doc/reference-docs/Terrain_Ruggedness_Index.pdf [ Links ]
Rzedowski, J. (1996). Análisis preliminar de la flora vascular de los bosques mesófilos de montaña de México. Acta Botánica de México, 35, 25-44. Obtenido de http://www.redalyc.org/articulo.oa?id=57403504 [ Links ]
Sappington, J., Longshore, K. M., & Thompson, D. B. (2007). Quantifying landscape ruggedness for animal habitat analysis: A case study using bighorn sheep in the Mojave Desert. Journal of Wildlife Management, 71(5), 1419-1426. doi: 10.2193/2005-723 [ Links ]
Stockwell, D. R., & Peterson, A. T. (2002). Effects of sample size on accuracy of species distribution models. Ecological Modelling 148(1), 1-13. doi: 10.1016/S0304-3800(01)00388-X [ Links ]
Turc, L. (1954). Le bilan d'eau des sols: Relations entre les precipitation, l'évaporation et l'écoulement. Annales Agronomiques, 5, 491-596. [ Links ]
United State Geological Survey (USGS). (2010). Global 30 Arc-Second Elevation (GTOPO30). Obtenido de https://lta.cr.usgs.gov/GTOPO30 [ Links ]
United State Geological Survey (USGS). (2010). The USGS global visualization viewer. Obtenido de http://glovis.usgs.gov/ [ Links ]
Vázquez-García, J. A. (1995). Cloud forests archipelagos: Preservation of fragmented montane ecosystems in tropical America. In L. S. Hamilton, J. O. Juvik, & and F. N. Scatena (Eds.), Tropical montane cloud forests (pp. 315-332). London: Springer. [ Links ]
Venables, W. N., & Ripley, B.D. (2010). stepAIC: MASS. R package version 7.3-9. Vienna, Austria: R Foundation for Statistical Computing. Obtenido de http://cran.stat.ucla.edu/ [ Links ]
Villaseñor, J. L. (2010). El bosque húmedo de montaña en México y sus plantas vasculares: Catálogo florístico-taxonómico. México: CONABIO-UNAM. [ Links ]
Vogelman, H. M. (1973). Fog precipitation in the cloud forest of Eastern Mexico. BioScience, 23(2), 96-100. Obtenido de http://www.jstor.org/stable/1296569 [ Links ]