SciELO - Scientific Electronic Library Online

 
 número67Evaluación de confiabilidad del mapa del Inventario Forestal Nacional 2000: diseños de muestreo y caracterización difusa de paisajes índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Investigaciones geográficas

versión On-line ISSN 2448-7279versión impresa ISSN 0188-4611

Invest. Geog  no.67 Ciudad de México sep. 2008

 

Geografía física

 

Comparación de metodologías para el mapeo de la cobertura y uso del suelo en el sureste de México

 

Comparison of methodologies for mapping land use cover in Southeast Mexico

 

Tzitziki Janik García Mora* Jean–François Mas*

 

* Centro de Investigaciones en Geografía Ambiental (CIGA), Universidad Nacional Autónoma de México, Antigua Carretera a Pátzcuaro No. 8701, Col. Ex Hacienda San José de la Huerta, 58190, Morelia, Michoacán, México. E–mail: tzitziki@ igg.unam.mx; jfmas@ciga.unam.mx.

 

Recibido: 21 de enero de 2008.
Aceptado en versión final: 30 de abril de 2008.

 

Resumen

La clasificación digital de imágenes de satélite se ha convertido en una herramienta indispensable para monitorear la cobertura terrestre. Debido a los errores que se observan a menudo en los mapas derivados del análisis de datos de percepción remota, existe una búsqueda constante por desarrollar y probar alternativas que permitan la obtención de resultados precisos para la toma de decisiones. En la literatura se mencionan varios métodos para obtener mejores resultados que una clasificación convencional (clasificación píxel a píxel por el método de máxima probabilidad). En este trabajo se comparan diferentes métodos alternativos para clasificar una imagen Landsat de una región del sureste de México (clasificación contextual, clasificación por redes neurales, incorporación de datos auxiliares). Los resultados obtenidos muestran que la incorporación de datos auxiliares representados por imágenes de probabilidad a priori permite aumentar hasta un 20% la fiabilidad en comparación con una clasificación convencional, superando incluso los resultados obtenidos con métodos no paramétricos y contextuales.

Palabras clave: Clasificación contextual, redes neurales, datos auxiliares.

 

Abstract

Digital classification of satellite images has become an important tool for land use cover monitoring. There have been many studies and researches aiming to develop and assess classification methods which are capable of producing results with higher accuracies in order to support decision making. Through a literature review, we found various classification methods that have been tested and are able to produce better results than the conventional one. This work compares different classification methods in a southeast region of Mexico. Results show that with ancillary data which were represented by prior probabilities, the classifications obtained 20% more accuracy that those by conventional classification methods, and even better than those methods using non–parametric classifier and contextual information.

Key words: Contextual classification, neural networks, ancillary data.

 

INTRODUCCIÓN

El monitoreo de las coberturas terrestres es un tema de suma importancia en los ámbitos gubernamental, académico y social por las implicaciones que tienen los cambios de las coberturas y usos de suelo en temas como sustentabilidad, riesgos, conservación de la biodiversidad y servicios ambientales. En el ámbito de los estudios territoriales, la percepción remota (PR) y los sistemas de información geográfica (SIG), al ser capaces de obtener estos datos de manera ágil y a bajo costo, se han convertido en tecnologías fundamentales en el desarrollo de la geografía moderna.

Sin embargo, los mapas obtenidos a través de la clasificación digital de imágenes multiespectrales presentan a menudo errores (Franklin et al., 2000; Zhu et al., 2000; Couturier et al., 2007), como consecuencia, existe incertidumbre acerca de los datos derivados de los mapas como superficie de las coberturas de suelo y tasas de cambio, entre otros, lo que lleva a tomar malas decisiones por ejemplo en políticas de gestión territorial. Los métodos de clasificación estándares, como la máxima verosimilitud, están basados en estadísticas paramétricas y toman en cuenta únicamente la información espectral píxel–a–píxel, por lo cual utilizan solamente una pequeña parte de la información contenida en las imágenes y muchas veces fallan en identificar correctamente las categorías de cobertura del suelo. Ante estas limitaciones, muchas investigaciones se enfocaron en desarrollar nuevos métodos de análisis de las imágenes de percepción remota. Dentro de los métodos alternativos más prometedores se pueden mencionar: a) el enfoque "por objeto" que consiste en tomar como unidad de análisis grupos de píxeles, que corresponden a objetos reales en el terreno, en vez de píxeles aislados y, b) el enfoque de redes neural es que permite incorporar diferentes tipos de información (respuesta espectral, modelos de elevación, mapas temáticos) sin problema, relacionados con la distribución estadística de los datos.

El objetivo de este trabajo es evaluar y comparar el desempeño de cuatro diferentes métodos tanto convencionales como alternativos en la diferenciación de seis clases de cobertura del suelo a partir de una imagen multiespectral de una región del sureste de México. Estos métodos son: a) la máxima verosimilitud (píxel–a–píxel), b) el método de clasificación por región Sequential maximum a posteriori (SMAP), c) el método de redes neural es perceptrón multicapa (PM) y d) la incorporación de datos auxiliares representados por imágenes de probabilidad a priori tanto en una clasificación de máxima verosimilitud como en la clasificación de perceptrón multicapa.

 

ÁREA EN ESTUDIO

El área en la que se basa este estudio se encuentra ubicada en el centro del estado de Quintana Roo (Figura 1), entre las coordenadas geográficas –89°4'23" y –86°48'48" de longitud oeste y 19°15'56" y 21°11'15" de latitud norte. Esta región contiene variados tipos de usos y coberturas, además se cuenta con datos muy confiables sobre cada uno de ellos y su distribución espacial, resultado de estudios anteriores y conocimiento experto, por lo que la evaluación sobre los resultados puede ser muy precisa.

De acuerdo con el Inventario Nacional Forestal (Palacio et al., 2000), la mayor superficie del área en estudio (43%) está ocupada por la selva mediana subperennifolia. En segundo lugar por extensión se encuentra el pastizal con 22%, luego la selva mediana subcaducifolia y la agricultura con el 15 y 14%, respectivamente. Las categorías restantes suman en conjunto el 6%.

 

MATERIALES

Imagen multiespectral

La imagen utilizada proviene del sensor ETM+ de la serie de satélites LANDSAT de fecha 21 de abril de 2000, tiene seis bandas multiespectrales con una resolución espacial de 30 m. La imagen se obtuvo previamente corregida, mediante 40 puntos de control, con un error medio cuadrático (RMS error) reportado de 0.56 en el eje X y 0.50 en el eje Y. Las características del sistema de referencia de origen fueron Proyección Universal Transversa Mercator (UTM), zona 16, Datum Norte América (NAD) 1927, Ellipsoide de Clarke 1866.

 

Fotografías aéreas

El uso de fotografías aéreas para la verificación permitió enfrentar limitaciones de tiempo y presupuesto, de esta manera, el trabajo de campo se enfocó solamente a las áreas difíciles de interpretar visualmente en estos productos. Las fotografías utilizadas fueron imágenes digitales en color, tomadas en el 2000 en el ámbito del Inventario Forestal Nacional (Mas et al., 2002; Peralta et al., 2001). Cuentan con una resolución espacial aproximadamente de un metro. Del muestreo aéreo distribuido por todo el territorio nacional, se seleccionaron sólo los datos correspondientes a las diez líneas de vuelo que cruzan el área en estudio, las cuales tienen una separación de 50 km. En toda su longitud, permiten contar con la cobertura de una franja continua de entre 1.5 y 3 km de ancho, con una sobreposición entre tomas del 60% (Velázquez et al., 2001). Para el área en estudio se contó con 181 fotografías aéreas.

 

Cartografía del Inventario Nacional Forestal (IFN)

Se usó la información contenida en la cartografía de la cobertura vegetal del proyecto lnventario Forestal Nacional (IFN) 2000. Esta cartografía fue producida por SEMARNAP–INEGI–UNAM, mediante la interpretación visual de imágenes satelitales Landsat de 30 metros de resolución espacial. El sistema clasificatorio se basa en cuatro niveles jerárquicos: a) formación vegetal con ocho categorías, b) tipo de vegetación con 17 categorías, c) comunidad con 47 categorías y d) sub–comunidad obteniendo finalmente 75 categorías al nivel más detallado. Se mapeó a escala 1:250 000 todo el territorio nacional con una fiabilidad satisfactoria (Couturier et al., 2007).

 

METODOLOGÍA

Las imágenes multiespectrales se verificaron en cuanto a su posición geográfica, posteriormente se trazaron campos de entrenamiento, se calculó la separabilidad de las firmas espectrales de éstos y se hizo la clasificación supervisada mediante los diferentes métodos: máxima verosimilitud (MVS), una clasificación de contexto Secuential maximum a posteriori (SMAP) y redes neural es con perceptrón multicapa (PMC). En el caso de MVS y PMC se llevó a cabo una clasificación adicional utilizando datos auxiliares indicando espacialmente la probabilidad de encontrar cada una de las categorías. En la verificación de la fiabilidad se usó información de datos de campo así como derivados de la interpretación de fotografías aéreas. Cada uno de estos procedimientos se explica con más detalle a continuación (Figura 2).

 

Preprocesamiento

Elección del sistema clasificatorio

Se optó por utilizar una simplificación del sistema clasificatorio de INEGI, para tener categorías compatibles con la cartografía del Inventario Forestal Nacional 2000, cuyo sistema clasificatorio fue desarrollado a partir de los trabajos de Miranda y Hernández X., Flores et al. y Rzedowski (INEGI, 2006).

 

Campos de entrenamiento

Se delimitaron 250 campos de entrenamiento distribuidos de manera uniforme sobre la imagen, para representar a cada una de las categorías.

 

Análisis de separabilidad de firmas

Contando con los campos de entrenamiento, se crearon las firmas espectrales y se hizo un análisis de separabilidad que permite evaluar el grado en el cual las categorías pueden ser distinguidas espectralmente. Para este efecto, se optó por utilizar el método de divergencia transformada (DT), ya que éste ha mostrado obtener mejores resultados que métodos como distancia de Bhattacharayya y la divergencia. Este método es el más utilizado en estudios donde se emplea la clasificación de máxima verosimilitud (Maussel et al., 1990). Los valores que se obtienen a través del cálculo de separabilidad fluctúan entre 0 y 2 000, donde el valor de 2 000 representa la separabilidad máxima entre los pares de clases. Para la interpretación de los valores de separabilidad, se adoptaron las reglas mostradas en la Tabla 1.

 

CLASIFICACIÓN

Clasificaciones espectrales

Clasificador de máxima verosimilitud (MVS)

El clasificador de máxima verosimilitud (o máxima probabilidad) es el algoritmo más comúnmente utilizado en percepción remota, ya que es sencillo de aplicar, así como para interpretar los resultados que arroja, además de considerarse uno de los procedimientos de discriminación más acertados y eficientes, esto siempre que los datos sigan una función de distribución normal (Maselli et al., 1992). En la fase de aprendizaje, el algoritmo elabora el "retrato espectral" de cada categoría con base en la media y de la varianza/covarianza de un conjunto de sitios de entrenamiento localizados en la imagen. En la fase de clasificación se calcula, para cada píxel, la probabilidad de pertenencia a cada categoría con base en su respuesta espectral (ecuación 1). El pixel se asigna finalmente a la clase a la cual es más probable que pertenezca de acuerdo con la información espectral.

donde:

P(H | E) es la probabilidad condicionada de la hipótesis H dado evidencia E, es decir, la probabilidad que el píxel pertenezca a cierta categoría hipótesis H tomando en cuenta su respuesta espectral (Evidencia E);

p(H) es la probabilidad a priori de la hipótesis H, es decir, la probabilidad que un píxel pertenezca a la categoría considerada en la hipótesis H sin tomar en cuenta su información espectral;

p(E) es la probabilidad de la evidencia E;

p(H | E) es la probabilidad condicionada de la evidencia E dada la hipótesis H.

En ausencia de información sobre la probabilidad a priori de encontrar cierta categoría en determinado sitio, se asume que las probabilidades a priori p(H) son iguales para todas las clases y en toda el área de la imagen, es decir, que si se consideran n categorías, esta probabilidad es igual a 1/n (ecuación 2).

 

Sequential maximum a posteriori (SMAP)

El algoritmo Sequential maximum a posteriori (SMAP), es un método de clasificación contextual ya que no hace una clasificación de pixeles de manera separada sino por regiones, tomando en consideración que hay mayor probabilidad de que los píxeles cercanos en una imagen pertenezcan a la misma clase. Trabaja segmentando la imagen a varias resoluciones y usando la resolución de segmentación más gruesa para guiarse hasta llegar a la resolución más fina mediante un modelo espectral de clase conocido como distribución Gausiana de mezcla basándose en dos parámetros; la media espectral simple y la covarianza (Bouman y Shapiro, 1994; Cheng y Bouman, 2001).

 

Clasificadorperceptrón multicapa (PMC)

El clasificador perceptrón multicapa (PMC), es probablemente el algoritmo con la arquitectura de redes neurales más utilizado hoy en día debido a su capacidad de tolerancia ante información incompleta, inexacta o contaminada con ruido (Mas y Flores, 2008). Consiste en un modelo estadístico no paramétrico de regresión no lineal (Sarle, 1994), se describe como una red de alimentación hacia adelante compuesta por una capa de unidades de entrada (en este caso una unidad por banda de la imagen multiespectral), otra capa de unidades de salida (una unidad para cada clase) y un número determinado de capas intermedias de unidades de procesamiento, también llamadas capas ocultas porque no tienen conexiones con el exterior. Las unidades de cada capa están conectadas a todas las unidades de la capa siguiente (Figura 3). Con esta red se pretende establecer una correspondencia entre un conjunto de entrada (respuesta espectral por ejemplo) y un conjunto de salidas deseadas (categorías de cobertura del suelo).

Generalmente, el PMC usa una sola capa oculta para dividir completamente el espacio espectral por medio de hiperplanos a lo largo del cual el nivel de activación de las unidades ocultas es constante (Foody, 2000).

En el PMC, la señal que se transmite es un valor numérico. Cada conexión entre dos neuronas está asociada a un peso de ponderación que controla la fuerza de una interconexión. La neurona recibe como señal de entrada la suma de las señales de salida de cada neurona de la capa anterior, ponderada por su respectivo peso. Esta señal de entrada es transformada por una función de activación, generalmente sigmoidal, que permite generar una señal de salida que se transmite a las neuronas de las capas siguientes.

En un PMC, cuyo objetivo es clasificar, cada neurona de salida está asociada a una categoría, la categoría final corresponde a la neurona que presenta la señal, o valor de activación, más grande. Al inicio, los pesos están elegidos de manera aleatoria, y la respuesta del PMC es por lo tanto totalmente errónea. Con base en los datos de entrenamiento, se modifican los pesos de ponderación para obtener las respuestas correctas. El procedimiento de aprendizaje es sencillo: si la red da la respuesta equivocada, los pesos se corrigen de tal manera que el error disminuye. Los datos de entrenamiento se presentan iterativamente para ajustar los pesos y obtener el mejor ajuste entre valores esperado y obtenido por la red. El método de entrenamiento más conocido es el de retro–propagación (back–propagation). En este algoritmo se compara, con base en los datos de entrenamiento, la señal de salida de la red con el valor esperado para calcular el error. El error es entonces retroalimentado por la red y los pesos de las conexiones se alteran para minimizar este error (Bishop, 1995).

 

Clasificación con información auxiliar

La incorporación de datos auxiliares en la clasificación ha mostrado aumentar la fiabilidad de los mapas obtenidos (Hutchinson, 1982). En este trabajo se usaron probabilidades a priori en el clasificador de máxima verosimilitud y redes neural es. Las características del método de máxima verosimilitud lo hacen ideal para incorporar datos auxiliares para aumentar su flexibilidad y su capacidad en la estimación de áreas conservando las ventajas del método original (Maselli y Conese, 1995; Wulder et al., 2006). En este trabajo los datos auxiliares se usaron para generar mapas de probabilidades a priori p(H) para cada una de las categorías, las cuales permitieron modificar las reglas de decisión (ecuación 1).

En el caso de las redes neurales, en vez de probabilidades se obtuvieron los valores de activación. Sin información a priori, es la categoría que presenta el valor de activación más alto que se asigna al píxel. Utilizando información a priori, se consideró cada valor de activación como un grado de pertenencia a una clase y en este paso se multiplicó cada valor por la probabilidad a priori de cada una de las categorías de acuerdo con los mapas incorporados como datos auxiliares.

Para obtener las imágenes que definieron las probabilidades a priori, como primer paso se corrigió de manera visual el Inventario Forestal Nacional con datos de campo y conocimiento experto, y posteriormente se derivaron mapas que indican la posibilidad y/o imposibilidad de encontrar cada una de las categorías (uno por clase) que funcionaron como imágenes de probabilidad.

Para evitar que los mapas de probabilidades sean afectados por errores de posición (límites de los polígonos incorrectos) del mapa de cobertura del suelo del IFN, se extendió el límite de los polígonos de probabilidad de 250 m. Por ejemplo, para generar el mapa de probabilidades a priori del acahual, se utilizan las reglas de la Tabla 2 y se extiende la probabilidad de encontrar esta categoría alrededor de los polígonos originales (Figura 4).

 

Evaluación de la fiabilidad

Unidades de verificación

Para verificar cada una de las clasificaciones resultantes se seleccionaron fotografías aéreas, utilizando un método de muestreo aleatorio estratificado. Cada estrato corresponde a cada una de las clases del mapa. De esta manera se asegura que las categorías de pequeña superficie sean muestreadas (Mas et al., 2003). En el caso de dificultades para la interpretación de ciertas áreas, la información fue apoyada con trabajo de campo.

 

Interpretación

Cada una de las fotografías seleccionadas fueron interpretadas visualmente mediante un enfoque difuso adaptado del propuesto por Woodcock y Gopal (2000). En este caso cada fotografía se calificó con la categoría de mayor superficie presente y sólo en el caso en el que dos clases tuvieron superficies muy parecidas en extensión (40 y 60%) se calificó como válido el resultado del mapa si coincidía con cualquiera de las dos opciones.

 

Matrices de confusión y cálculo de índices defiabilidad

Para conocer la proporción de error obtenido en los mapas se hicieron matrices de confusión, las cuales permiten confrontar la información de los sitios de muestreo y la imagen clasificada. A esta matriz se le aplicó el método propuesto por Card (1982), incorporando los valores de proporción (áreas relativas) de cada una de las categorías consideradas para compensar el sesgo debido al muestreo estratificado. De esta manera, una clase con mayor área tendrá más peso que una de área pequeña al momento de calcular la fiabilidad.

Suponiendo una matriz con j columnas e i líneas (Tabla 3), Card calcula cada elemento Pij de la matriz corregida aplicando:

donde:

nij es el número en cada celda.

n+j es la suma de las celdas de la columna j.

Πj es la proporción en el mapa de la categoría j.

De la matriz resultante se obtuvieron los valores del error de omisión (EO) y de comisión (EC) para cada una de las categorías mediante las ecuaciones a continuación:

donde:

EC = Error de comisión.

EO = Error de omisión.

Pij es el valor de cada celda después de aplicar la corrección de Card.

ΣPi es la sumatoria de las celdas de la fila i.

Πj es la proporción en el mapa de la categoría j.

 

Comparación de la Habilidad obtenida de los diferentes métodos de clasificación (Prueba de McNemar)

Al obtener la fiabilidad de los resultados para cada clasificador se puede observar cual obtuvo el mayor error y el menor, sin embargo, no se puede concluir que uno es más eficiente que otro sólo con base en una diferencia, ya que es necesario conocer si las diferencias son estadísticamente significativas. Para este efecto se utilizó la metodología propuesta por Foody (2004), que permite evaluar la significancia estadística de diferencias en la fiabilidad de dos clasificaciones estimada con base en los mismos datos de verificación. Esta, es una prueba no paramétrica basada en una matriz de confusión de dos por dos que expresa las relaciones entre las confusiones de las dos clasificaciones en comparación (Tabla 4).

El índice de la prueba Z2 expresa la diferencia en los errores cometidos en las dos clasificaciones. Esta variable sigue una distribución de chi cuadrado con grado de libertad de uno y se compara en una tabla de valores críticos para determinar si esta diferencia en la fiabilidad es estadísticamente significativa.

El estadístico Z2 mide la diferencia de la fiabilidad en comparaciones pareadas de los diferentes clasificadores, en este caso se necesitaron nueve comparaciones. La prueba de Z2 es así una prueba no dirigida (prueba de planteamiento bilateral), que indica si existe o no una diferencia significativa entre las fiabilidades alcanzadas por las dos clasificaciones (Foody, 2004).

 

RESULTADOS Y DISCUSIÓN

El análisis de separabilidad realizado con el método de la divergencia transformada (DT) para las nueve categorías originales, arrojó valores de separabilidad pobre de acuerdo con la Tabla 1 (en un rango de 1 300 a 1 500) entre las categorías: a) agricultura de riego, agricultura de temporal y pastizales, b) mangle y vegetación hidrófila, c) selva mediana subcaducifolia y baja subcaducifolia y d) selva baja subperennifolia y mediana subperennifolia. Estas clases espectralmente confusas se reagruparon para utilizar finalmente seis categorías (agua, agropecuario, acahual, vegetación hidrófila, selva baja y mediana subperennifolia y selva baja y mediana subcaducifolia), obteniendo así un valor de separabilidad global de 1 958, el cual se encuentra dentro del rango más alto de separabilidad (Tabla 1).

El resultado de la interpretación de las fotografías aéreas y del trabajo de campo fue una base de datos con 181 sitios de verificación que indican el tipo de cobertura principal y una segunda cobertura en áreas fragmentadas, tal y como se explica de manera detallada en la metodología.

Las matrices de confusión resultantes de cada una de las clasificaciones contra los datos de verdad obtuvieron resultados de fiabilidad de entre 65% (máxima verosimilitud) y 84% (MVS con probabilidades a priori (Figura 5).

Como resultado del cálculo de los errores de omisión y comisión de cada uno de los clasificadores por categoría, se obtuvieron valores promedio en un rango de 16 a 45% (Tabla 5).

La categoría con valores de error más altos fue el acahual, por la gran similitud espectral que muestra con dos clases, la selva y la agricultura, pero mejora notablemente al aplicar los mapas de probabilidad a priori.

El clasificador que presentó mayor homogeneidad en el rango de error y el menor valor de error de comisión promedio fue perceptrón multicapa con probabilidades a priori. El clasificador que separa mejor la agricultura es máxima verosimilitud con probabilidades a priori.

Los métodos en los que no se aplicaron las probabilidades a priori muestran valores de errores promedio cercanos o mayores al 30%.

Al aplicar los mapas de probabilidades a priori, se logra una disminución del error de 20 a 24% (Tabla 6), el clasificador de máxima verosimilitud con datos a priori presenta mayor disminución del error. Esto coincide con resultados obtenidos en el centro de Costa Rica donde al aplicar un método similar la fiabilidad global se reduce un 20.3% gracias a una mejor separación de las clases espectralmente confusas. Estos resultados sugieren que la modificación de probabilidades a priori empleadas como datos auxiliares es útil al disminuir de manera significativa el error en paisajes complejos con categorías de respuesta espectral similar o mezcladas (Pedroni, 2003). De acuerdo con Zheng et al. (2005), utilizando un valor de probabilidad a priori para cada clase, derivado de la proporción esperada de la superficie cubierta por la misma, el cambio en la fiabilidad del usuario y la del productor depende del tamaño de las clases espectralmente mezcladas. En general, para las categorías de área grande MV a priori tiende a producir un menor error de omisión y mayor de comisión, mientras que para las categorías de tamaño pequeño la tendencia es la contraria, es decir, que el clasificador tiende a sobreestimar las categorías más comunes y subestimar categorías raras (con poca extensión). En el caso de este trabajo, este problema se evita al utilizar información a priori espacializada y no sólo un valor dependiendo de los porcentajes de cobertura esperados.

Con el uso de probabilidades a priori, la categoría que presentó la mayor disminución del error fue el acahual (EO disminuyó un 72% y EC disminuyó un 51%) en el caso de MVS, al igual que para PMC (EO disminuyó un 69%), pero en este caso la mayor disminución para el error de comisión fue para la categoría de SMSC con una disminución del EC de 35%.

En la Tabla 7 se presentan los datos de diferencia del porcentaje de fiabilidad global de cada comparación pareada y su significancia (Prueba de Mcnemar).

Los resultados indican que no existe diferencia significativa entre los tres métodos de clasificación sin la aplicación de los datos a priori. Al aplicar los datos a priori hay un aumento significativo en la fiabilidad. En cuanto a los dos métodos que consideran los datos a priori no existen diferencias significativas siendo estos dos los mejores métodos para estimar las categorías de vegetación propuestas en el área de Quintana Roo.

Los resultados también indican que la incorporación de probabilidades a priori usados como datos auxiliares es útil al elaborar un mapa significativamente más fiable, y que estos resultados pueden esperarse en otros tipos de ambientes.

 

CONCLUSIONES

Cada clasificador presenta un comportamiento diferencial de acuerdo con cada categoría, por lo que el "mejor" método de clasificación depende del interés del usuario para discriminar categorías específicas.

Sin usar la información a priori, los tres métodos de clasificación (máxima verosimilitud, clasificador de contexto SMAP y perceptrón multicapa) dan resultados cuya fiabilidad es parecida, la prueba de McNemar no encontró diferencia significativa entre ellos.

La implementación de datos auxiliares resultó en un aumento significativo en la fiabilidad de los mapas (20% en la fiabilidad global).

La fiabilidad alcanzada por los dos métodos para los cuales se utilizó la información a priori (máxima verosimilitud y perceptrón multicapa) es similar; no se encontró una diferencia estadísticamente significativa.

El único método que presentó una mejora significativa en la clasificación es la incorporación de datos adicionales y no el algoritmo de clasificación. La utilización de información adicional a la información espectral a través la utilización de probabilidades a priori es por lo tanto una alternativa promisoria para mejorar el mapeo y monitoreo de las coberturas del suelo con base en datos de percepción remota.

 

AGRADECIMIENTOS

Al Fondo Mixto de Fomento a la Investigación Científica y Tecnológica CONACYT, y al Gobierno del Estado de Quintana Roo por el apoyo financiero al proyecto a través del proyecto "Evaluación de la dinámica Espacio–Temporal de la frontera agrícola de Quintana Roo" (1978–2003), (CONACYT–Gobierno del Estado de Quintana Roo, ref. QROO–2003–C02–13228). Al Dr. Henricus F. M. Vester y la M. en C. Angélica Navarro Martínez de ECOSUR, Chetumal, Quintana Roo por su colaboración en la interpretación de las fotografías aéreas. La primera autora agradece a CONACYT por la beca de Doctorado otorgada en la convocatoria 290501.

 

REFERENCIAS

Bishop, C. M. (1995), Neural networks for pattern recognition, Oxford University Press, Oxford, UK.        [ Links ]

Bouman, C. and M. Shapiro (1994), "A multiscale random field model for bayesian image segmentation", IEEE Trans. on Image Processing, vol. 3, no. 2, pp. 162–177.        [ Links ]

Card, D. (1982) "Using map category marginal frequencies to improve estimates of thematic map accuracy", Photogrammetric Engineering and Remote Sensing, vol. 48, no. 3, pp. 431–439.        [ Links ]

Cheng, H. and C. Bouman (2001), "Multiscale bayesian segmentation using a trainable context model", IEEE Trans. on Image Processing, vol. 10, no. 4, pp. 1057–7149.        [ Links ]

Couturier, S., J. R Mas, E. López, G. Cuevas, A. Vega and V. Tapia (2007). "Accuracy assessment of land cover maps in sub tropical countries: a sampling design for the Mexican National Forest Inventory", Online Journal of Earth Sciences, vol. 1, pp. 127–135.        [ Links ]

Foody, G. M. (2000), "Mapping land cover from remotely sensed data with a softened feedforward neural network classification", Journal of Intelligent and Robotic Systems, vol. 29, pp. 433–449.        [ Links ]

Foody, G. M. (2004), "Thematic map comparison: evaluating the statistical significance of differences in classification accuracy", Photogrammetric Engineering and Remote Sensing, vol. 70, no. 5, pp. 627–633.        [ Links ]

Franklin, J., C. E. Woodcock and R. Warbington (2000), "Multi–attribute vegetation maps of forest services lands in California supporting resource management decisions", Photogrammetric Engineering and Remote Sensing, vol. 66, pp. 1209–1217.        [ Links ]

GRASS GIS 6.0.2 Reference Manual (2006), (www.grass.itc.it/grass60/manuals/html60_user/imagery.html: marzo de 2006).        [ Links ]

Hutchinson, C. F. (1982), "Techniques for combining Landsat and ancillary data for digital classification improvement", Photogrammetric Engineering and Remote Sensing, vol. 8, pp. 123–130.        [ Links ]

INEGI (2006), "Vegetación Primaria de México" (http://mapserver.inegi.gob.mx/map/datos_basicos/vegetacion/descripcion.cfm: junio de 2006).        [ Links ]

Internacional Institute for Geo–Information Science and Earth Observation (2006), "GRASS GIS 6.0.2 Reference Manual", (www.grass.itc/grass60/manuals/html60_user/imagery.html: marzo de 2006).        [ Links ]

Mas, J. F., J. R. Díaz–Gallegos y A. Pérez–Vega (2003). "Evaluación de la confiabilidad temática de mapas o de imágenes clasificadas: una revisión", Investigaciones Geográficas, Boletín, núm. 51, Instituto de Geografía, UNAM, México, pp. 53–72.        [ Links ]

Mas, J. F., A. Velázquez, J. L. Palacio–Prieto, G. Bocco, A. Peralta and J. Prado (2002), "Assessing forest resources in Mexico: wall–to–wall land use/cover mapping", Photogrammetric Engineering and Remote Sensing, vol. 68, no. 10, pp. 966–968.        [ Links ]

Mas, J. F. (2005), "Un método para combinar datos espectrales e información auxiliar en una red artificial neuronal", Anais XII Simpósio Brasileiro de Sensoriamento Remoto, Goiânia, INPE Brasil, 16–21 abril, pp. 3543–3549.        [ Links ]

Mas, J. F. and J. J. Flores (2008), "The application of artificial neural networks to the analysis of remotely sensed data", International Journal of Remote Sensing, vol. 29, no. 3, pp. 61–663.        [ Links ]

Maselli, F., C. Conese, T. D. Filippis and M. Romani (1995), "Integration of ancillary data into a maximum likelihood classifier with nonparametric priors", ISPRS Journal of Photogrammetry and Remote Sensing, vol. 50, no. 2, pp. 2–11.        [ Links ]

Maselli, F., C. Conese, L. Petkiv and R. Resti (1992), "Inclusion of prior probabilities derived from a nonparametric process into the maximum likelihood classifier", Photogrammetric Engineering and Remote Sensing, vol. 58, pp. 201–207.        [ Links ]

Maussel, P., J. Kramber and J. Lee (1990), "Optimum band selection for supervised classification of multispectral data", Photogrammetric Engineering and Remote Sensing, vol. 56, no. 1, pp. 55–60.        [ Links ]

Palacio–Prieto J. L., J. López–García, G. Bocco, M. Palma, A. Velázquez, I. Trejo–Vázquez, J. R Mas, A. Peralta, R Takaki–Takaki, J. Prado–Molina, A. Victoria, A. Rodríguez–Aguilar, L. Luna–González, R. Mayorga–Saucedo y G. Gómez–Rodríguez (2000), "La condición actual de los recursos forestales en México: resultados del Inventario Forestal Nacional 2000", Investigaciones Geográficas, Boletín, núm. 43, Instituto de Geografía, UNAM, México, pp. 183–203.        [ Links ]

PCI Geomatics (2006), "Signature separability", (http://www.pcigeomatics.com/cgi–in/pcihlp/SIGSEP: febrero de 2006).        [ Links ]

Pedroni, L. (2003), "Improved classification of Landsat Thematic Mapper data using modified prior probabilities in large and complex landscapes", International Journal of Remote Sensing, vol. 24, no. 1, pp. 91–113.        [ Links ]

Peralta–Higuera, A., J. Prado–Molina, J. L. Palacio–Prieto, G. Bocco, J. R Mas and A. Velázquez (2001), "Aerial sampling of Mexico by digital photography. A strategy for validating the interpretation of ETM+ Data", International Symposium on Spectral Sensing Research 2001, Québec City, Canada, junio 10–15, Trabajo no. 72, pp. 1– 9.        [ Links ]

Sarle, W. S. (1994), "Neural networks and statistical models", Proceedings of the 19th Annual SAS Group Conference, Cary, NC., pp. 1538–1550.        [ Links ]

Velázquez, A., J. R Mas, R. Mayorga–Saucedo, J. L. Palacio Prieto, G. Bocco, G. Gómez–Rodríguez, L. Luna–Gonzáles, I. Trejo, J. López–García, M. Palma, A. Peralta y J. Prado–Molina (2001), "El Inventario Forestal Nacional 2000: potencial de uso y alcances", Ciencias, vol. 64, pp. 13–19.        [ Links ]

Woodcock, C. and S. Gopal (2000), "Fuzzy set theory and thematic maps: accuracy assessment and area estimation", International Journal of Geographical Information Science, vol. 14, pp. 153–172.        [ Links ]

Wulder, M. A., S. R Franklin, J. C. White, J. Linke, and S. Magnusen (2006), "An accuracy assessment framework for large area cover classification products derived from medium–resolution satellite data", International Journal of Remote Sensing, vol. 27, no. 4, pp. 663–683.        [ Links ]

Zheng, M., Q. Cai and Z. Wang (2005), "Effect of prior probabilities on maximum likelihood classifier", Geoscience and Remote Sensing Symposium, IGARSS '05. Proceedings, IEEE International vol. 6, pp. 3753– 3756.        [ Links ]

Zhu, Z. L., L. M. Yang, S. V. Stehman and R. L. Czaplewski (2000), "Accuracy assessment for the U.S. Geological Survey Regional Land–Cover Mapping Program: New York and New Jersey Region", Photogrammetric Engineering and Remote Sensing, vol. 66, pp. 1425–1435.        [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons