Clasificación de uso del suelo y vegetación con redes neuronales convolucionales

Montiel González, Rodolfo; Bolaños González, Martín Alejandro; Macedo Cruz, Antonia; Rodríguez González, Agustín; López Pérez, Adolfo; Montiel González, Rodolfo; Bolaños González, Martín Alejandro; Macedo Cruz, Antonia; Rodríguez González, Agustín; López Pérez, Adolfo

doi:10.29298/rmcf.v13i74.1269

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Revista mexicana de ciencias forestales

Print version ISSN 2007-1132

Rev. mex. de cienc. forestales vol.13 n.74 México Nov./Dec. 2022 Epub Dec 09, 2022

https://doi.org/10.29298/rmcf.v13i74.1269

Artículo científico

Clasificación de uso del suelo y vegetación con redes neuronales convolucionales

Rodolfo Montiel González¹

Martín Alejandro Bolaños González¹^*

Antonia Macedo Cruz¹

Agustín Rodríguez González²

Adolfo López Pérez¹

^¹Colegio de Postgraduados. Campus Montecillo. México.

^²Hidráulica y Agricultura Consultores S.A. México.

Resumen

La clasificación de uso del suelo y vegetación es un ejercicio complejo y difícil de realizar con métodos tradicionales, por lo que los modelos de aprendizaje profundo son una alternativa para su aplicación debido a que son altamente capaces de aprender esta semántica compleja, lo que hace plausible su aplicación en la identificación automática de usos del suelo y vegetación a partir de patrones espacio-temporales extraídos de su apariencia. El objetivo del presente estudio fue proponer y evaluar un modelo de red neuronal convolucional de aprendizaje profundo para la clasificación de 22 clases distintas de cobertura y uso del suelo ubicadas en la cuenca río Atoyac-Salado. El modelo propuesto se entrenó utilizando datos digitales capturados en 2021 por el satélite Sentinel-2; se aplicó una combinación diferente de hiperparámetros en la cual la precisión del modelo depende del optimizador, la función de activación, el tamaño del filtro, la tasa de aprendizaje y el tamaño del lote. Los resultados proporcionaron una precisión de 84.57 % para el conjunto de datos. Para reducir el sobreajuste se empleó el método de regularización denominado Dropout, que resultó ser muy eficaz. Se comprobó con suficiente precisión que el aprendizaje profundo con redes neuronales convolucionales identifica patrones en los datos de la reflectancia captada por las imágenes del satélite Sentinel-2 para la clasificación el uso de suelo y vegetación en áreas con una dificultad intrínseca en la cuenca del río Atoyac-Salado.

Palabras clave: Aprendizaje de máquina; clasificación automática; cuenca Atoyac-Salado; imágenes Sentinel-2; inteligencia artificial; sensores remotos

Abstract

The classification of land use and vegetation is a complex exercise difficult to perform with traditional methods, thus deep learning models constitute a viable alternative because they are highly capable of learning this complex semantics, a trait which allows their application in the automatic identification of land use and vegetation, based on spatiotemporal patterns derived from their appearance. The objective of this study was to propose and evaluate a deep learning convolutional neural network model for the classification of 22 different land covers and land use classes located in the Atoyac-Salado basin. The proposed model was trained using digital data captured in 2021 by the Sentinel-2 satellite; a different combination of hyperparameters was applied in which the accuracy of the model depends on the optimizer, the activation function, the filter size, the learning rate and the batch size. The results provided an accuracy of 84.57 % for the data set. A regularization method called Dropout was used to reduce overadjustment, with great effectiveness. It was proven with sufficient accuracy that deep learning with convolutional neural networks identifies patterns in the reflectance data captured by Sentinel-2 satellite images for land use and vegetation classification in intrinsically difficult areas of the Atoyac-Salado basin.

Key Words Machine learning; automatic classification; Atoyac-Salado basin; Sentinel-2 images; artificial intelligence; remote sensing

Introducción

La información geográfica sobre el Uso del Suelo y Vegetación (USV) es un insumo importante para apoyar los estudios espacio-temporales del comportamiento de las comunidades vegetales presentes en el país, y con ello se contribuye al conocimiento del estado que guarda la cobertura del suelo (^{Inegi,
2017}), lo cual es fundamental para los investigadores y tomadores de decisiones. A partir de los mapas de USV se deducen escenarios sobre la pérdida del capital natural o biodiversidad, se generan modelos sobre posibles efectos del cambio global y se fundamentan las estrategias de planificación de uso del suelo (^{Mas et al., 2009}).

En México, de acuerdo a los mapas de USV del Instituto Nacional de Estadística y Geografía (Inegi), la tasa de cambio de uso de suelo en el periodo de 1992 a 2016 para el caso de bosques y selvas fue, en promedio, de -133 000 ha año^-1, con una evidente disminución de las superficies de vegetación primaria y un incremento de los usos del suelo asociados a las actividades agropecuarias (agricultura de riego, agricultura de temporal, pastizal inducido y pastizal cultivado, principalmente), aunque en los últimos años de análisis, del 2010 a 2016, la tasa de cambio se estabilizó (^{Paz-Pellat
et al., 2019}).

El cambio de cobertura del suelo implica la modificación en ciertas características de la superficie como el tipo de vegetación; mientras que el cambio en el uso del suelo consiste en una alteración en la forma en que los seres humanos usan o gestionan cierta área de la Tierra (^{Patel et
al., 2019}). El cambio de la cobertura del suelo tiene numerosas consecuencias ecológicas, físicas y socioeconómicas (^{Pellikka et al., 2013}). A pesar de su importancia, esta se identifica generalmente mediante la clasificación efectuada por un experto, incluso se realiza con una interpretación visual de imágenes satelitales, lo cual es costoso, dispendioso e impreciso. Implementar métodos computacionales permite generar la clasificación de coberturas con imágenes satelitales de manera automática, rápida, precisa y económica (^{Suárez et al., 2017}), por lo que la teledetección de los cambios en la cobertura y el uso del suelo, tiene la ventaja de ofrecer métodos automatizados y repetibles a gran escala para monitorear indicadores de la condición de la vegetación (^{Lawley et
al., 2015}).

En los últimos años, ha aumentado el interés y la necesidad de disponer de información de usos y coberturas del territorio confiable y actualizada (^{Borràs et al., 2017}). Derivar la cobertura terrestre a partir de datos de sensores remotos, es fundamental para la elaboración de mapas, además de proporcionar información básica para respaldar las actividades científicas, ya que las imágenes de satélite son de acceso gratuito y abierto, además de que poseen un mayor almacenamiento y poder computacional (^{Hermosilla et al., 2022}). Sin embargo, la clasificación detallada es una tarea extenuante debido a la ilimitada cantidad de los datos obtenidos por la teledetección y de la complejidad de los patrones y composiciones espaciales de las especies, así como de la falta de enfoques adecuados (^{Xie et al.,
2019}).

Dada esta problemática, se necesitan utilizar nuevas técnicas como la inteligencia artificial que centra la investigación de múltiples conceptos enfocados a imitar las funciones que el humano desarrolla (^{Ponce et
al., 2014}). Al respecto, destaca el aprendizaje automático o aprendizaje máquina (machine learning) como una herramienta común en la extracción de información de grandes conjuntos de datos (^{Shalev-Shwartz y Ben-David, 2014}), y en la que se sugiere el uso de una máquina/computadora para aprender de forma análoga cómo el cerebro aprende y predice, con el fin de automatizar operaciones para reducir la intervención humana en la detección automática en los datos de patrones significativos (^{Theodoridis, 2015}).

El aprendizaje profundo es una de las técnicas modernas más versátiles para la extracción y clasificación de características (^{Bhosle
y Musande, 2019}), además, analiza de forma inteligente los datos a gran escala (^{Sarker, 2021}). Los algoritmos de aprendizaje profundo extraen abstracciones complejas de alto nivel (^{Najafabadi et al., 2015}), entre ellos destacan dos tipos que se distinguen por el método de entrada de datos: supervisado y no supervisado. El aprendizaje supervisado se realiza con datos conocidos (datos de entrenamiento) de la clase por identificar (^{Suárez et al., 2017}), mientras que en el aprendizaje no supervisado, no se requiere conocimiento de las clases por determinar (^{Pérez y Arco, 2016}). La entrada de un algoritmo de aprendizaje son los datos de entrenamiento y la salida suele adoptar la forma de otro programa informático que puede efectuar alguna tarea (^{Shalev-Shwartz y Ben-David, 2014}).

En el campo del aprendizaje automático, las redes neuronales convolucionales (CNN, por sus siglas en inglés) han logrado mejoras considerables y han despertado un gran interés en las comunidades académicas e industriales (^{Krizhevsky et al., 2017}) porque utilizan conexiones locales para extraer eficazmente la información espacial y los pesos compartidos (^{Chen et al.,
2016}). La CNN puede extraer características más eficaces con la ayuda de información específica de la clase (^{Chen et
al., 2016}), por lo que se requieren conjuntos de datos de entrenamiento grandes, y si es un problema de múltiples clases, que los datos estén balanceados (^{Suárez et al.,
2017}).

Existen diversos métodos para clasificar imágenes, pero no todos son aplicables a la clasificación de la cubierta terrestre (^{Macedo-Cruz
et al., 2010}). Por eso, y con la finalidad de valorar la precisión con la cual el aprendizaje profundo puede con redes neuronales convolucionales identificar patrones en la clasificación del uso de suelo y vegetación mediante datos de la reflectancia captada por los sensores remotos a bordo de plataformas satelitales, se planteó el estudio en las condiciones de la cuenca del río Atoyac-Salado, que debido a su diversidad de ecosistemas y sistemas productivos, desarrollo urbano, orografía y en particular la gran diversidad de clases de USV que convergen en ella, hacen que sea una zona idónea y desafiante para aplicar métodos de clasificación supervisada con inteligencia artificial.

El objetivo fue proponer y evaluar el desempeño de un método computacional basado en redes neuronales convolucionales para la clasificación supervisada de 22 clases distintas de USV en la cuenca del río Atoyac-Salado en el estado de Oaxaca.

Materiales y Métodos

La cuenca Río Atoyac-Salado se localiza en la parte central del estado de Oaxaca (Figura 1), entre los paralelos 16°49'25.86" y 17°11'34.09" de latitud norte y 96°17'23.60" y 96°43'41.66" de longitud oeste. Comprende desde el nacimiento del río Salado hasta la estación hidrométrica Oaxaca. Este tiene sus orígenes en San Francisco Telixtlahuaca, donde lleva el nombre de río Nariz, a una altitud aproximada de 2 418 m. Al sur de San Pablo Huitzo se denomina río Atoyac, y cruza la ciudad de Oaxaca de Juárez hasta la estación hidrométrica Oaxaca a una altitud aproximada de 1 500 m (^{Semarnat, 2017}).

Figura 1 Localización de la cuenca del río Atoyac-Salado y principales corrientes de agua.

La delimitación de la cuenca del río Atoyac-Salado se realizó en ArcSWAT™ (2012.10_4.21) como una extensión del software ArcGIS™ (14.4.1), a partir del modelo digital de elevación de alta resolución LiDAR de Inegi con resolución de 15 m, proyección Universal Transversa de Mercator (UTM) zona 14. La salida de la cuenca se ubicó en la estación hidrométrica Paso Ancho.

Las unidades de análisis correspondieron a las distintas coberturas y usos del suelo del conjunto de datos vectoriales Serie VI escala 1:250 000 (^{Inegi, 2017}). De las 22 clases de USV (Cuadro 1), se distinguen dos con mayor extensión: agricultura de temporal anual con 21.41 % de la superficie total y vegetación secundaria arbustiva de bosque de encino con 17.78 %. Se registraron tres tipos de agricultura: temporal, riego y humedad, que por su duración se dividieron en anuales, semipermanentes y permanentes. Con base en esta variabilidad de usos del suelo, la cuenca del río Atoyac-Salado resultó adecuada para aplicar métodos de clasificación supervisada con inteligencia artificial.

Cuadro 1 Asignación de clase y clave por tipo de USV.

Clase	Clave	Tipo de uso del suelo y vegetación	Superficie (ha)
0	AH	Urbano construido	21 690.4
1	BP	Bosque de pino	1 384.1
2	BPQ	Bosque de pino-encino	10 157.7
3	BQP	Bosque de encino-pino	630.6
4	HS	Agricultura de humedad semipermanente	358.6
5	PI	Pastizal inducido	41 935.9
6	RA	Agricultura de riego anual	2 915.4
7	RAS	Agricultura de riego anual y semipermanente	3 836.2
8	RS	Agricultura de riego semipermanente	1 032.2
9	TA	Agricultura de temporal anual	79 647.6
10	TAP	Agricultura de temporal anual y permanente	15 552.3
11	VSa/BP	Vegetación secundaria arbustiva de bosque de pino	9 473.3
12	VSa/BPQ	Vegetación secundaria arbustiva de bosque de pino-encino	4 378.7
13	VSa/BQ	Vegetación secundaria arbustiva de bosque de encino	66 145.4
14	VSa/BQP	Vegetación secundaria arbustiva de bosque de encino-pino	11 682.1
15	VSa/MK	Vegetación secundaria arbustiva de bosque de mezquite	772.8
16	VSa/SBC	Vegetación secundaria arbustiva de selva baja caducifolia	8 138.4
17	VSA/BP	Vegetación secundaria arbórea de bosque de pino	10 569.2
18	VSA/BPQ	Vegetación secundaria arbórea de bosque de pino-encino	20 728.7
19	VSA/BQ	Vegetación secundaria arbórea de bosque de encino	19 473.6
20	VSA/BQP	Vegetación secundaria arbórea de bosque de encino-pino	6 210.4
21	VSh/BQ	Vegetación secundaria herbácea de bosque de encino	726.5
Total			372 068.3

Imágenes de satélite

La misión Copernicus Sentinel-2 consta de dos satélites idénticos (2A y 2B) en la misma órbita, desarrollados por la Agencia Espacial Europea (ESA, https://www.esa.int/Applications/Observing_the_Earth/Copernicus/Sentinel-2). Equipados con un sensor óptico, el instrumento multiespectral tiene una resolución espacial que varía de 10 a 60 m en función de la banda espectral (^{Drusch et al.,
2012}), con 13 bandas en los intervalos visible, infrarrojo cercano e infrarrojo de onda corta del espectro electromagnético, y con un tiempo de revisita de 5 días en el Ecuador (^{Gascon
et al., 2017}).

Las imágenes utilizadas correspondieron a los Tiles T14QQD y T14QQE y a las bandas RGB y NIR de escenas multitemporales con resolución espacial de 10 m, adquiridos el 13 de abril de 2021 y el 3 de mayo de 2021, respectivamente. Ambas imágenes fueron capturadas por el satélite Sentinel-2A, con un nivel de procesamiento 2-A. Se seleccionaron escenas con poca o ninguna nube o neblina, y se descargaron del portal Copernicus Open Access Hub (https://scihub.copernicus.eu/). La unidad de muestreo consistió en recortes de 20×20 píxeles. El método de muestreo fue aleatorio estratificado (^{Congalton y Green, 2009}) mediante conocimiento previo del área de estudio a partir de recorridos de campo para dividir el área en grupos o estratos, los cuales se muestrearon aleatoriamente.

Muestras de entrenamiento

Para extraer muestras de entrenamiento y delimitar el área de estudio se usó QGIS (3.18.3), las cuales se obtuvieron de 20×20×4 píxeles (alto, ancho y número de bandas) en formato .tiff, se consideró que al menos 80 % del recorte pertenecía a una sola clase. Se empleó un conjunto de entrenamiento balanceado para evitar realizar la clasificación con datos desequilibrados (^{Gnip et al.,
2021}). De cada clase de USV se extrajeron 6 000 muestras de entrenamiento, con excepción de las clases Agricultura de humedad de ciclo semipermanente con 2 280 y Agricultura de riego de ciclo semipermanente con 4 356 que por tener menor superficie, se evitó el sobremuestreo. En total, se generaron 126 636 muestras de entrenamiento.

Modelo de CNN

La programación del algoritmo del modelo de CNN se realizó en lenguaje Python en un entorno de desarrollo Jupyter notebook en el que se usaron bibliotecas de código abierto como Tensorflow y Keras para el aprendizaje automático. El modelo aplicado fue de tipo Secuencial, las capas de la red se ordenaron y apilaron linealmente (^{Xie et
al., 2020}). Todas las neuronas de una capa conectan con todas las de la capa siguiente, basado en secuencias de tres tipos de capas: convolucionales, de agrupación y totalmente conectadas. La convolución y las capas totalmente conectadas suelen ir seguidas de una función de activación no lineal (^{Rousset et al.,
2021}).

La arquitectura del modelo constó de tres capas convolucionales y tres de agrupación, de acuerdo a las sugerencias de ^{Chen
et al. (2016)} para equilibrar la complejidad y la solidez de la red. Se usaron en cada capa 128 neuronas, un tamaño de Kernel de 3 por 3, con un mismo relleno (Padding). Se agregaron ceros alrededor de las imágenes de entrada; las salidas de la capa tuvieron las mismas dimensiones espaciales que sus entradas. Una función de activación denominada como Unidad Rectificada Lineal (ReLu) que devuelve 0 por cada valor negativo en la imagen de entrada y regresa el mismo valor por cada valor positivo, seguido de un filtro de submuestreo de agrupación promedio (Average-Pooling) que considera la media de los valores de activación de una ventana, además de una capa de regulación (Dropout) con 20 % de posibilidades de establecer las entradas en cero.

A continuación, una capa (Flatten) que aplana las salidas multidimensionales de la última capa de convolución en un formato unidimensional, y dos capas densas: una de 512 neuronas ocultas con una activación ReLu y capa Dropout a 20 %, y la última con 22 neuronas de salida que correspondieron al número de clases por identificar, con función de activación softmax para predecir la probabilidad de cada clase.

El entrenamiento es el proceso para que las entradas produzcan las salidas deseadas. Se lleva a cabo a partir del establecimiento de pesos conocidos con anterioridad (^{Vinet y Zhedanov, 2011}). Para el ajuste de los pesos de las conexiones, se dividió el conjunto de datos en dos grupos: entrenamiento (80 %) y prueba (20 %). Los primeros, a su vez, se dividieron en entrenamiento (80 %) y evaluación (20 %), los cuales se introdujeron varias veces en la red y se denominó época a cada reiteración. El modelo se entrenó con 100 épocas.

Durante la fase de aprendizaje, se aplicó una función de transferencia a través de una serie de iteraciones para comparar los valores predichos con los valores observados (^{Bocco et al.,
2007}). El conjunto de pruebas no es visto por el modelo en el entrenamiento y se utiliza después, tras el ajuste de los hiperparámetros para proporcionar una evaluación imparcial del modelo final. Al realizar las épocas y ajustar los pesos, se ingresan los datos de validación. El entrenamiento finaliza cuando se alcanza un error bajo para todos los patrones de aprendizaje (^{Bocco et al., 2007}). En la evaluación y prueba se utilizaron hiperparámetros: tamaño de Kernel, la tasa de abandono, las capas ocultas, la profundidad de las capas y las funciones de activación.

La compilación del modelo incluyó tres parámetros: optimizador, pérdida y métricas. Se usó Adam como algoritmo optimizador, ya que es computacionalmente eficiente, tiene pocos requisitos de memoria, es invariable al cambio de escala diagonal de los gradientes y adecuado para problemas grandes en términos de datos o parámetros (^{Kingma y Ba,
2014}). Se compiló con la función entropía cruzada categórica y la métrica de rendimiento de interés fue la exactitud (accuracy), que se relaciona con la observación correctamente predicha y el total de observaciones.

La clasificación se evaluó con la matriz de confusión, ya que resume la evaluación de la precisión y representa una buena práctica (^{Olofsson et al., 2014}). La matriz de doble entrada confronta los valores reales con los resultados de la clasificación, por lo que es fácil detectar dónde está confundiendo dos clases. Los elementos en la diagonal corresponden a la predicción correcta y los que están fuera de esta corresponden a predicciones incorrectas, tanto en forma horizontal como vertical (^{Yeturu, 2020}). La proporción de puntos correctamente asignados expresa la confiabilidad (^{Mas et al., 2003}). Además, se calcularon otras métricas de evaluación: la precisión, la sensibilidad y la puntuación.

Adicionalmente, el rendimiento del modelo se analizó con las variaciones de su sensibilidad y especificidad mediante la curva de características operativas del receptor (ROC), un parámetro para evaluar la bondad de la prueba. La exactitud de la prueba aumenta a medida que la curva se desplaza desde la diagonal hacia el vértice superior izquierdo. Un valor mayor indica que el modelo puede lograr un mejor rendimiento (^{Liu
et al., 2022}).

Resultados y Discusión

Los conjuntos de datos de entrenamiento y validación se utilizaron para proporcionar una evaluación insesgada del modelo entrenado, con el ajuste de los hiperparámetros para obtener el mejor rendimiento del modelo de red neuronal desarrollado (Figura 2).

Figura 2 Resultados de la precisión del modelo.

La relación entre el número total de entradas identificadas correctamente y el número total de entradas dio la precisión global de la clasificación, la cual alcanzó un máximo de 89.44 % sobre los datos de entrenamiento y 84.57 % en validación durante 100 épocas.

Los resultados de la clasificación de imágenes se evaluaron utilizando la matriz de confusión. En la Figura 3, se muestran en color más claro las clases con mayor precisión en la clasificación y también con qué clase se confundió la clase ingresada. En este caso, la red confundió más las etiquetadas como 19 y 20, que correspondieron a vegetación secundaria arbórea de bosque de encino y vegetación secundaria arbórea de bosque de encino-pino debido a que son ecosistemas de vegetación natural similares, con predominio de formas de vida arbóreas, en las cuales cambia parcialmente el componente florístico, lo que puede explicar la confusión entre clases.

Figura 3 Matriz de confusión.

De acuerdo con los resultados, para las métricas de evaluación (Cuadro 2 y Figura 4), se aprecia un conjunto de puntuaciones medias (macro y ponderada) y exactitud con rendimiento general estimado de 85 % para todas las métricas, por lo que se consideró que el modelo de clasificación de uso del suelo y vegetación fue robusto. Estos resultados indican que el modelo tiene una baja dispersión del conjunto de valores obtenidos, con 85 % de casos positivos que fueron identificados correctamente por el algoritmo.

Cuadro 2 Métricas de evaluación del modelo.

Clase	Precisión	Sensibilidad	Puntuación F1
0	0.89	1	0.94
1	0.97	0.96	0.97
2	0.78	0.79	0.79
3	0.97	0.99	0.98
4	0.98	0.98	0.98
5	0.86	0.77	0.82
6	0.93	0.93	0.93
7	0.83	0.79	0.81
8	0.98	0.99	0.99
9	0.72	0.82	0.77
10	0.88	0.77	0.82
11	0.84	0.85	0.85
12	0.91	0.90	0.91
13	0.82	0.74	0.78
14	0.86	0.81	0.83
15	0.99	0.98	0.99
16	0.84	0.89	0.86
17	0.81	0.82	0.82
18	0.72	0.78	0.75
19	0.56	0.51	0.53
20	0.62	0.69	0.65
21	0.99	0.98	0.98
Exactitud			0.85
Media macro	0.85	0.85	0.85
Media ponderada	0.85	0.85	0.85

Figura 4 Curva ROC por clase identificada.

Durante el entrenamiento, la red experimentó un cambio positivo cuando se utilizó una capa de regulación (Dropout) con 20 % de posibilidades de establecer las entradas en cero, lo que permitió al modelo el ajuste de los datos minimizando el error producido por estos en cada época. Mientras que, al no usarse, hubo un punto en que el error aumentó y generó sobreentrenamiento.

En este trabajo, se utilizaron 22 clases distintas cuando habitualmente se emplean alrededor de 10. Por ejemplo, ^{Suárez et
al. (2017)} usaron cuatro clases con 91.02 % de exactitud, ^{Hu et al. (2018)} clasificaron siete clases y 82 % en precisión, ^{Bhosle
y Musande (2019)} clasificaron 16 y cuatro clases con precisiones de 97.58 y 79.43 %, respectivamente.

Los resultados obtenidos en rendimiento fueron altos, presentaron respuestas acertadas y mostraron avances para el procedimiento realizado con CNN en la clasificación automatizada de USV con 22 clases, a pesar de que la escala para crear las series tuvo el problema de generar grandes polígonos de clases de USV no representativas de la escala local (^{Paz-Pellat
et al., 2019}). Los resultados del presente trabajo fueron mejores en comparación con otros previos de clasificación con CNN, en los cuales se registró una exactitud de 83.27 % en entrenamiento y 91.02 % en validación para identificar cuatro clases (^{Suárez et
al., 2017}), y con precisiones de 90.18 % en clasificación de cobertura vegetal y de 87.92 % para uso del suelo en 12 clases (^{Zhang et al., 2019}).

El modelo propuesto presentó resultados satisfactorios en un conjunto de datos muy desafiante, aun solo con el uso del aprendizaje supervisado. Una vez entrenado el conjunto de datos, la red experimentó un sobreajuste sustancial cuando se omite Dropout, pero no se informó sobreajuste cuando se agregó esta función (^{Srivastava et al.,
2014}).

Cabe destacar que al eliminar cualquiera de las capas intermedias, el rendimiento de la red se degrada (^{Krizhevsky et
al., 2017}) y supone una pérdida de alrededor de 5 % si se elimina una sola capa convolucional. La configuración de profundidad de la red CNN es fundamental en la precisión de la clasificación, ya que la calidad de las características aprendidas está influenciada por los niveles de representaciones y abstracciones (^{Zhang et al.,
2019}).

Los resultados muestran la idoneidad de las CNN para clasificar los USV en áreas complejas, sin embargo, su precisión puede variar a medida que se incremente el número de clases, como es el caso de los mapas de USV del Inegi en las que se consideran 70 clases con 15 agrupaciones (^{Paz-Pellat
et al., 2019}), por lo que probablemente se tendría que agrupar en clases espectralmente similares para hacer operativo un esquema de clasificación con aprendizaje profundo. En la actualidad, existen muchas otras opciones de aprendizaje profundo con arquitecturas más complejas con las que se podría avanzar en trabajos posteriores. Además, usar solo información de reflectancias de las bandas espectrales independientes puede ser limitante, por lo que se sugiere añadir capas de índices de vegetación.

Conclusiones

El modelo detecta correctamente las clases más separadas espectralmente y que poseen características diferenciales. No se afectan las clases con menor número de datos de entrenamiento, aunque clases próximas espectralmente registran índices de reconocimiento bajos. Los resultados mejoran al aumentar la red en número de capas y tiempo de entrenamiento, pero aún quedan órdenes de magnitud por superar para aumentar la precisión en la clasificación.

Se comprobó con suficiente precisión que el aprendizaje profundo con redes neuronales convolucionales, puede identificar patrones en los datos de la reflectancia captada por las imágenes del satélite Sentinel-2 para la clasificación del uso de suelo y vegetación en áreas con una dificultad intrínseca en la cuenca del Río Atoyac-Salado.

Agradecimientos

Al Colegio de Postgraduados por facilitar los recursos necesarios para realizar esta investigación, y al Consejo Nacional de Ciencia y Tecnología (Conacyt) por la beca otorgada para estudios de Maestría en Ciencias de Rodolfo Montiel González.

Referencias

Bhosle, K. and V. Musande. 2019. Evaluation of deep learning CNN Model for Land Use Land Cover classification and crop identification using hyperspectral remote sensing images. Journal of the Indian Society of Remote Sensing 47(11):1949-1958. Doi: 10.1007/s12524-019-01041-2. [ Links ]

Bocco, M., G. Ovando, S. Sayago and E. Willington. 2007. Neural network model for land cover classification from satellite images. Agricultura Técnica 67(4):414-421. Doi: 10.4067/S0365-28072007000400009. [ Links ]

Borràs, J., J. Delegido, A. Pezzola, M. Pereira, G. Morassi y G. Camps-Valls. 2017. Clasificación de usos del suelo a partir de imágenes Sentinel-2. Revista de Teledetección 48:55-66. Doi: 10.4995/raet.2017.7133. [ Links ]

Chen, Y., H. Jiang, C. Li, X. Jia and P. Ghamisi. 2016. Deep feature extraction and classification of hyperspectral images based on Convolutional Neural Networks. IEEE Transactions on Geoscience and Remote Sensing 54(10):6232-6251. Doi: 10.1109/TGRS.2016.2584107. [ Links ]

Congalton, R. G. and K. Green. 2009. Assessing the Accuracy of Remotely Sensed Data: Principles and Practices. CRC Press Taylor & Francis Group. Boca Raton, FL, USA. 192 p. [ Links ]

Drusch, M., U. Del Bello, S. Carlier, O. Colin, … and P. Bargellini. 2012. Sentinel-2: ESA’s Optical High-Resolution Mission for GMES Operational Services. Remote Sensing of Environment 120:25-36. Doi: 10.1016/j.rse.2011.11.026. [ Links ]

Gascon, F., C. Bouzinac, O. Thépaut, M. Jung, … and V. Fernandez. 2017. Copernicus Sentinel-2A calibration and products validation status. Remote Sensing 9(6):584-664. Doi: 10.3390/rs9060584. [ Links ]

Gnip, P., L. Vokorokos and P. Drotár. 2021. Selective oversampling approach for strongly imbalanced data. PeerJ Computer Science 7:e604. Doi: 10.7717/peerj-cs.604. [ Links ]

Hermosilla, T., M. A. Wulder, J. C. White and N. C. Coops. 2022. Land cover classification in an era of big and open data: Optimizing localized implementation and training data selection to improve mapping outcomes. Remote Sensing of Environment 268:1-17. Doi: 10.1016/j.rse.2021.112780. [ Links ]

Hu, Y., Q. Zhang, Y. Zhang and H. Yan. 2018. A deep convolution neural network method for land cover mapping: A case study of Qinhuangdao, China. Remote Sensing 10(12):1-17. Doi: 10.3390/rs10122053. [ Links ]

Instituto Nacional de Geografía y Estadística (Inegi). 2017. Guía para la interpretación de cartografía: uso del suelo y vegetación, Escala 1:250 000. Serie VI. Instituto Nacional de Geografía y Estadística, Inegi. Aguascalientes, AGS, México. 200 p. https://books.google.com.mx/books?id=LCHZDwAAQBAJ&printsec=frontcover&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false . (20 de abril de 2022). [ Links ]

Kingma, D. P. and J. Ba. 2014. Adam: A Method for Stochastic Optimization. Cornell University. Ithaca, NY, USA. 15 p. [ Links ]

Krizhevsky, A., I. Sutskever and G. E. Hinton. 2017. ImageNet classification with deep Convolutional Neural Networks. Communications of the ACM 60(6):84-90. Doi: 10.1145/3065386. [ Links ]

Lawley, V., M. Lewis, K. Clarke and B. Ostendorf. 2015. Site-based and remote sensing methods for monitoring indicators of vegetation condition: An Australian review. Ecological Indicators 60:1273-1283. Doi: 10.1016/j.ecolind.2015.03.021. [ Links ]

Liu, R., X. Yang, C. Xu, L. Wei and X. Zeng. 2022. Comparative study of Convolutional Neural Network and conventional machine learning methods for landslide susceptibility mapping.Remote Sensing 14(2):321-351. Doi: 10.3390/rs14020321. [ Links ]

Macedo-Cruz, A., G. Pajares-Martinsanz y M. Santos-Peñas. 2010. Clasificación no supervisada con imágenes a color de cobertura terrestre. Agrociencia 44(6):711-722. https://agrociencia-colpos.org/index.php/agrociencia/article/view/833/833 . (25 de enero de 2022). [ Links ]

Mas, J. F., A. Velázquez y S. Couturier. 2009. La evaluación de los cambios de cobertura/uso del suelo en la República Mexicana. Investigación Ambiental 1(1):23-39. https://www.ccmss.org.mx/wp-content/uploads/2014/10/La_evaluacion_de_los_cambios_de_cobertura-uso_de_suelo_en_la_Republica_Mexicana.pdf . (12 de mayo de 2022). [ Links ]

Najafabadi, M. M., F. Villanustre, T. M. Khoshgoftaar, N. Seliya, R. Wald and E. Muharemagic. 2015. Deep learning applications and challenges in big data analytics. Journal of Big Data 2(1):1-21. Doi: 10.1186/s40537-014-0007-7. [ Links ]

Olofsson, P., G. M. Foody, M. Herold, S. V. Stehman, C. E. Woodcock and M. A. Wulder. 2014. Good practices for estimating area and assessing accuracy of land change. Remote Sensing of Environment 148(25):42-57. Doi: 10.1016/j.rse.2014.02.015. [ Links ]

Patel, S. K., P. Verma and G. S. Singh. 2019. Agricultural growth and land use land cover change in peri-urban India. Environmental Monitoring and Assessment 191(9):600. Doi: 10.1007/s10661-019-7736-1. [ Links ]

Paz-Pellat, F., V. M. Romero-Benítez, J. A. Argumedo-Espinoza, M. Bolaños-González, B. de Jong, J. C. de la Cruz-Cabrera y A. Velázquez-Rodríguez. 2019. Dinámica del uso del suelo y vegetación. In: Paz-Pellat, F. , J. M. Hernández-Ayón, R. Sosa-Ávalos y A. S. Velázquez-Rodríguez. (Edits.). Estado del Ciclo del Carbono en México, Agenda Azul y Verde, Primer Reporte. Programa Mexicano del Carbono. Texcoco, Edo. Méx., México. pp. 529-572. [ Links ]

Pellikka, P. K. E., B. J. F. Clark, A. G. Gosa, N. Himberg, … and M. Siljander. 2013. Agricultural expansion and its consequences in the Taita Hills, Kenya. In: Paron, P., D. Ochieng O. and C. Thine O. (eds.). Kenya: a Natural Outlook: Geo-Environmental Resources and Hazards. Developments in Earth Surface Processes 16. Elsevier. Amsterdam, AMS, The Netherlands. pp. 65-179. [ Links ]

Pérez V., I. C. y L. Arco G. 2016. Una revisión sobre aprendizaje no supervisado de métricas de distancia. Revista Cubana de Ciencias Informáticas 10(4):43-67. https://www.redalyc.org/articulo.oa?id=378349316004 . (14 de diciembre de 2021). [ Links ]

Ponce G., J. C., A. Torres S., F. S. Quezada A., A. Silva S., … y O. Pedreño. 2014. Inteligencia Artificial. Iniciativa Latinoamericana de Libros de Texto Abiertos (LATIn). Montevideo, MO, Uruguay. 255 p. [ Links ]

Rousset, G., M. Despinoy, K. Schindler and M. Mangeas. 2021. Assessment of deep learning techniques for land use land cover classification in Southern New Caledonia. Remote Sensing 13(12):1-22. Doi: 10.3390/rs13122257. [ Links ]

Sarker, I. H. 2021. Machine Learning: Algorithms, Real-World applications and research directions. SN Computer Science 2(3):160. Doi: 10.1007/s42979-021-00592-x. [ Links ]

Secretaría de Medio Ambiente y Recursos Naturales (Semarnat). 2017. Acuerdo por el que se dan a conocer los resultados del estudio técnico de las aguas nacionales superficiales en las cuencas hidrológicas Río Papagayo 1, Río Petaquillas, Río Omitlán, Río Papagayo 2, Río Papagayo 3, Río Papagayo 4, Río Nexpa 1, Río Nexpa 2, Río Quetzala, Río Infiernillo, Río Santa Catarina, Río Ometepec 1, Río Ometepec 2, Río Ometepec 3, Río Cortijos 1, Río Cortijos 2, Río Cortijos 3, Río Cortijos 4, Río Ometepec 4, Río La Arena 1, Río La Arena 2, Río La Arena 3, Río Atoyac-Salado, Río Atoyac-Tlapacoyan, Río Sordo-Yolotepec, Río Atoyac-Paso de la Reina y Río Verde, pertenecientes a la Región Hidrológica número 20 Costa Chica de Guerrero. Diario Oficial de la Federación, Cuarta Sección. https://dof.gob.mx/nota_detalle.php?codigo=5496053&fecha=04/09/2017#gsc.tab=0 . (8 de noviembre de 2021). [ Links ]

Shalev-Shwartz, S. and S. Ben-David. 2014. Understanding machine learning: From theory to algorithms. Cambridge University Press. New York, NY, USA. 449 p. [ Links ]

Srivastava, N., G. Hinton, A. Krizhevsky, H. Sutskever and R. Salakhutdinov. 2014. Dropout: A simple way to prevent neural networks from overfitting. Journal of Machine Learning Research 15:1929-1958. https://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf?utm_content=buffer79b43&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer . (28 de enero de 2022). [ Links ]

Suárez L., A. S., A. F. Jiménez L., M. Castro-Franco y A. Cruz-Roa. 2017. Clasificación y mapeo automático de coberturas del suelo en imágenes satelitales utilizando Redes Neuronales Convolucionales. ORINOQIUA 21(1):64-75. Doi: 10.22579/20112629.432. [ Links ]

Theodoridis, S. 2015. Introduction. In: Theodoridis, S. Machine Learning A bayesian and optimization perspective. Elsevier. Amsterdam, AMS, Netherlands. pp. 1-8. [ Links ]

Vinet, L. and A. Zhedanov. 2011. A "missing" family of classical orthogonal polynomials. Journal of Physics A Mathematical and Theoretical 44(8):1-16. Doi: 10.1088/1751-8113/44/8/085201. [ Links ]

Xie, G., A. Shangguan, R. Fei, W. Ji, W. Ma and X. Hei. 2020. Motion trajectory prediction based on a CNN-LSTM sequential model. Science China Information Sciences 63:1-21. Doi: 10.1007/s11432-019-2761-y. [ Links ]

Xie, Z., Y. Chen, D. Lu, G. Liand E. Chen. 2019. Classification of land cover, forest, and tree species classes with ZiYuan-3 Multispectral and Stereo Data. Remote Sensing 11(2):164-190. Doi: 10.3390/rs11020164. [ Links ]

Yeturu, K. 2020. Machine learning algorithms, applications, and practices in data science. In: Srinivasa R., A. S. R. and C. R. Rao (eds.). Handbook of Statistics 43 Principles and Methodsfor Data Science. Elsevier. Amsterdam, AMS, Netherlands. pp. 81-206. [ Links ]

Zhang, C., I. Sargent, X. Pan, H. Li, … and P. M. Atkinson. 2019. Joint deep learning for land cover and land use classification. Remote Sensing of Environment 221:173-187. Doi: 10.1016/j.rse.2018.11.014. [ Links ]

Recibido: 11 de Abril de 2022; Aprobado: 28 de Septiembre de 2022

^*Autor para correspondencia; correo-e: bolanos@colpos.mx, martinb72@gmail.com

^{Conflicto de intereses}

Los autores declaran que no tienen intereses en competencia.

^{Contribución por autor}

Rodolfo Montiel González: trabajo de campo, programación de código y elaboración del manuscrito; Martín Alejandro Bolaños González: conceptualización y elaboración del manuscrito; Antonia Macedo Cruz: revisión de código y revisión y corrección del manuscrito; Agustín Rodríguez González: revisión general y corrección del manuscrito; Adolfo López Pérez: revisión general y corrección del manuscrito.

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons