SciELO - Scientific Electronic Library Online

 
vol.47 número3Identificación de bacterias patógenas en peces capturados en el Pacífico frente a Nicaragua índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


Ciencias marinas

versão impressa ISSN 0185-3880

Cienc. mar vol.47 no.3 Ensenada Jul./Set. 2021  Epub 09-Dez-2022

https://doi.org/10.7773/cm.v47i3.3027 

Artículos

Un enfoque estadístico para modelar perfiles someros (<200 m) de temperatura en el océano Pacífico en el noroeste de México

Emigdio Marín-Enríquez1  * 

1CONACYT-Universidad Autónoma de Sinaloa, Facultad de Ciencias del Mar, Paseo Claussen S/N, 82000, Mazatlán, Sinaloa, Mexico. Tel: 0152(669)9828656


Resumen

La temperatura quizá sea la propiedad del agua marina más importante. Es una medida del contenido energético del océano y afecta las tasas metabólicas, la distribución y la abundancia de especies económicamente y ecológicamente importantes. Los datos oceanográficos derivados de satélites han sido utilizados para evaluar las variaciones espaciotemporales de la temperatura superficial del mar a escalas amplias; sin embargo, los satélites no alcanzan niveles subsuperficiales, y los datos de temperatura subsuperficial confiables se obtienen mediante modelamiento numérico u observaciones directas, estas últimas una alternativa costosa. Este artículo presenta un método para modelar perfiles de temperatura. Se utilizó un modelo mixto aditivo generalizado (GAMM, por sus siglas en inglés) con distribución de error gamma y una función de enlace inversa para modelar perfiles someros (<200 m) de temperatura en el Pacífico frente al noroeste de México. Los datos incluyeron 656 perfiles linealmente interpolados en profundidad, resultando en 127,595 observaciones que cubrieron un área de 18.5º a 25.8º N y de -114.5º a -105.9º W, y un periodo de junio de 2007 a noviembre de 2016. El modelo incluyó la temperatura como variable de respuesta; la profundidad, la topografía dinámica superficial, el rotacional del esfuerzo del viento, la latitud, la longitud y el Índice Oceánico de El Niño como covariables; y el mes como efecto aleatorio. El GAMM final explicó el 86% de la desviación total del conjunto de datos. Aunque se observaron importantes desviaciones entre las observaciones y las predicciones del modelo, los resultados del proceso de validación y de las predicciones hechas sobre un conjunto de datos independiente (correlación de temperatura observada vs. temperatura predicha, ~0.93; raíz del error cuadrático medio, ~1.5 ºC) fueron comparables a resultados obtenidos con técnicas de modelamiento más complejas, lo cual sugiere que este enfoque estadístico es una herramienta valiosa para modelar datos oceanográficos.

Palabras clave: modelos de efectos mixtos; campañas oceanográficas; océano Pacífico oriental; perfiles de temperatura

Abstract

Temperature is perhaps the most important seawater property. It is a measure of the energy content in the ocean and it affects the metabolic rates, distribution, and abundance of species that are important from the economic and ecological points of view. Satellite-derived oceanographic data have been widely used to assess spatiotemporal variations of sea surface temperature on broad scales; satellites, however, are unable to reach subsurface levels, and obtaining reliable subsurface water temperature data is achieved by either numerical modeling or direct observations, the latter representing a very high-cost alternative. In this paper, a method for modeling temperature profiles is presented. A generalized additive mixed model (GAMM) with a gamma error distribution and an inverse link function was used to model shallow (<200 m) temperature profiles in the Pacific Ocean off northwestern Mexico. The dataset included 656 profiles that were linearly interpolated at depth, which resulted in 127,595 observations. The database covered an area from 18.5º to 25.8º N and from -114.5º to -105.9º W in a time span from June 2007 to November 2016. The model included temperature as response variable; depth, surface dynamic topography, wind stress curl, latitude, longitude, and the Oceanic Niño Index as covariates; and month as random effect. The final model explained 86% of the total deviance of the dataset used to fit the GAMM. Although important deviations between the observations and the predictions of the model were observed, the results of the validation process and of predictions made on an independent dataset (correlation of observed vs. predicted temperature, ~0.93; root-mean-square error, ~1.5 ºC) were comparable to the results obtained with more complex modeling techniques, suggesting that this statistical approach is a valuable tool for modeling oceanographic data.

Key words: mixed-effects models; oceanographic campaigns; eastern Pacific Ocean; temperature profiles

Introducción

En el noroeste de México, la península de Baja California (PBC) separa el océano Pacífico del golfo de California (GC), un mar semicerrado delimitado por las costas de 4 estados del noroeste de México: Baja California, Baja California Sur, Sonora y Sinaloa (Fig. 1). En la costa oeste de la PBC, el principal agente forzante de la dinámica oceánica a gran escala es la corriente de California, una corriente que fluye de norte a sur paralela a la PBC y se caracteriza por bajas salinidades y bajas temperaturas (Lynn y Simpson 1987, Torres-Orozco 1993). En esta área se dan eventos de surgencia generados por el viento de abril a junio como resultado del transporte de Ekman causado por los vientos alisios que soplan paralelos a la PBC (Zaytsev et al. 2003).

Figura 1 Batimetría de la entrada del golfo de California (en metros). Los puntos negros son las ubicaciones de los lances de CTD utilizados para ajustar el modelo mixto aditivo generalizado final. La línea continua muestra la isóbata de los 200 m. La línea discontinua muestra la división entre el lado del Pacífico (izquierda) y el lado del golfo (derecha). Las letras corresponden a las ubicaciones de los lances de CTD extraídos aleatoriamente. El perfil de temperatura correspondiente a cada letra se muestra en los paneles correspondientes en la Figura 9

En el lado del golfo (oriental) de la PBC, predominan las masas de agua con alta salinidad y alta temperatura, ya que el GC presenta altas tasas de evaporación y es considerado una cuenca de evaporación (Castro et al. 1994). En su extremo sur, el GC se conecta con el océano Pacífico en una región conocida como la entrada del GC; en esta zona, la corriente de California, que es fría y rica en nutrientes, se encuentra con la corriente Costera Mexicana, que es cálida y pobre en nutrientes (Kessler 2006), y se presenta una cadena de remolinos como resultado de la interacción entre el forzamiento del océano Pacífico y la topografía del continente (Zamudio et al. 2008). Debido a estos procesos, se presentan fuertes frentes térmicos en esta zona (Álvarez-Borrego 1983, Marín-Enríquez et al. 2018), por lo que la entrada del GC es una zona interesante tanto desde el punto de vista físico como el de las pesquerías (Torres-Orozco et al. 2005).

Los cruceros oceanográficos son campañas diseñadas, principalmente, para recolectar datos de las propiedades del agua de mar. Entre estas propiedades, la temperatura del agua ha resultado ser de gran interés, ya que representa una medida del contenido energético del océano y la mayoría de procesos físicos y ecológicos están ligados estrechamente a los cambios estacionales y anuales en la temperatura del agua. Adicionalmente, estudios recientes han mostrado que los océanos profundos juegan un papel clave en la regulación de la variabilidad climática de la Tierra (Akbari et al. 2017), así que evaluar el contenido de calor del océano a nivel subsuperficial es una tarea importante.

Los datos oceanográficos de satélites han sido ampliamente utilizados en diferentes disciplinas de las ciencias marinas, ya que proveen información que cubre la mayoría de los océanos del mundo a escalas espaciotemporales muy pequeñas (Yang et al. 2013). En la actualidad, el alcance de los sensores remotos está restringido a la superficie del océano, y no pueden proveer datos oceanográficos a nivel subsuperficial (Fiedler 1988). La comunidad científica, por tanto, depende ya sea de datos de observaciones directas o del modelamiento numérico para obtener datos oceanográficos subsuperficiales (Akbari et al. 2017). Varias aproximaciones de modelamiento han sido utilizadas para modelar la temperatura del océano subsuperficial, entre éstas mínimos cuadrados; regresiones simples, múltiples y no lineales; matrices de regresión; correlaciones simples; e interpolaciones. El lector puede referirse a Akbari et al. (2017) para una revisión completa de las obras publicadas que tratan del modelamiento de las temperaturas oceánicas subsuperficiales.

Los modelos de regresión no lineal son utilizados comúnmente en una variedad de disciplinas científicas, tales como la ecología pesquera (Su et al. 2008, Zainuddin et al. 2008), la salud (Yang et al. 2012) y la meteorología (Jones et al. 2013). Sin embargo, su utilización en las disciplinas de oceanografía/hidrografía ha sido poco explorada, y la mayoría de los trabajos publicados dependen de regresiones lineales (Akbari et al. 2017). Los trabajos de Richards et al. (2010) y Gómez-Ocampo et al. (2017) son de los pocos trabajos publicados que utilizan modelos de regresión no lineal y datos oceanográficos. Mediante el uso de modelos aditivos generalizados (GAM, por sus siglas en inglés) para monitorear y estandarizar los parámetros de calidad del agua y datos oceanográficos de un área costera frente al sureste de Queensland, Australia, Richards et al. (2010) identificaron relaciones no lineales interesantes entre la corriente costera y la turbidez del agua, lo cual tuvo implicaciones importantes para la operación de una planta desalinizadora. Los autores concluyeron que la aplicabilidad de los GAM en diferentes áreas de investigación es “claramente evidente” (Richards et al. 2010). Gómez-Ocampo et al. (2017) utilizaron un GAM para modelar la concentración de clorofila superficial y la productividad primaria como función de diferentes variables ambientales (topografía dinámica absoluta y bombeo de Ekman) y sugirieron que el GAM produjo un mejor ajuste en comparación con otras técnicas de modelamiento para predecir la clorofila y la productividad primaria.

El principal objetivo del presente artículo fue explorar los modelos de regresión no lineal como herramientas alternativas a los modelos determinísticos más complejos que son tradicionalmente utilizados para generar perfiles de temperatura, y evaluar cómo los perfiles de temperatura predichos con modelos de regresión no lineal se desvían de las observaciones in situ y de los perfiles generados con modelos hidrodinámicos. Aquí se muestra que por lo menos el 90% de la variación en los perfiles de temperatura en los primeros 200 m puede ser explicado por un modelo de regresión no lineal que incluye variables como indicadoras de la variación de mesoescala, estacional e interanual (topografía dinámica de la superficie del mar); el transporte vertical de agua (el rotacional del esfuerzo del viento); un componente interanual (Índice Oceánico de El Niño); un término aleatorio (el mes); y componentes espaciales (latitud y longitud). Aunque los resultados del modelo de regresión no lineal final que se presentan aquí se desvían de las observaciones in situ y de los perfiles generados utilizando modelos hidrodinámicos, este artículo podría servir como línea de base para trabajos científicos que busquen utilizar modelos de regresión no lineal para modelar diferentes propiedades del agua de mar, un campo de investigación virtualmente inexplorado.

Materiales y métodos

Datos

Los datos de perfiles de temperatura fueron obtenidos del Programa de Perfil Global de Temperatura y Salinidad (GTSPP, por sus siglas en inglés), disponible en el servidor del Programa de Acceso de Datos de la División de Investigación Ambiental (ERDDAP, por sus siglas en inglés) de la Oficina Nacional de Administración Oceánica y Atmosférica (NOAA) de los Estados Unidos (Simmons 2017; dataset ID: erdGtsppBest). Los datos incluyeron el día, el mes, el año, la longitud, la latitud, la temperatura y la salinidad a profundidades desde 1 hasta 2,013 m, en un área que cubrió de -114.5 a -105.9º W y de 15.5 a 25.8º N (Fig. 1), entre junio de 2007 y noviembre de 2016. Solo los datos de los primeros 200 m de la columna de agua fueron utilizados porque a estas profundidades ocurre (1) la mayoría de la variación de temperatura vs. profundidad (termoclina, capa de mezcla) (Fiedler y Talley 2006) y (2) la mayoría de las pesquerías de importancia comercial (atunes, sardinas y picudos), en la zona epipelágica (Holland et al. 1990, Emmett et al. 2005, Torres-Orozco et al. 2005).

Se llevó a cabo un análisis exploratorio riguroso de los datos. Un problema común con este tipo de conjunto de datos es que la temperatura no es medida a intervalos de profundidad uniformes (probablemente debido a diferentes diseños de los estudios o a diferencias técnicas en el equipo). En el caso particular de este conjunto de datos, los intervalos de profundidad abarcaron de 1 a 42 m; de estos, el ~90% de los perfiles de temperatura fueron registrados a intervalos de <10 m, y el 36% a intervalos de 1 m. Se llevaron a cabo interpolaciones lineales para asegurarse de que todos los perfiles tenían observaciones Zmax - Zmin (i.e., un perfil en el que la sonda de conductividad, temperatura y profundidad [CTD] empezó a medir la temperatura a los 5 m y terminó a los 195 m tendría 195 - 5 = 190 observaciones luego de la interpolación). La interpolación de la base de datos resultó en 127,595 observaciones de temperatura.

Según Godínez et al. (2010) la dinámica estacional, interanual y de mesoescala tiene casi igual importancia a la hora de determinar la circulación de la superficie del mar en el área de estudio (35%, 35% y 30%, respectivamente). Para considerar las variaciones estacionales, se incluyó el mes como variable de efecto aleatorio, y para considerar la variabilidad anual en los perfiles de temperatura, se utilizó el índice oceánico de El Niño (ONI), ya que la variabilidad interanual de la circulación en la entrada del GC está dominada por El Niño/Oscilación del Sur (ENOS) (Godínez et al. 2010). El ONI se calcula como la anomalía mensual de los datos de temperatura superficial del mar a partir de un área rectangular cercana al ecuador (5º S a 5º N y 120º a 170º W) conocida como región El Niño 3.4. Los datos del ONI para el mismo periodo que la base de datos del CTD (2007-2017) fueron obtenidos del Centro de Predicciones Climáticas de la NOAA (http://origin.cpc.ncep.noaa.gov/products/analysis_monitoring/ensostuff/ONI_v5.php).

Por otra parte, la topografía dinámica de la superficie del mar (TDSM) fue utilizada como proxy de la variabilidad de mesoescala, interanual y estacional en la variación de la temperatura vs. de la profundidad. Los datos de TDSM fueron obtenidos del Servicio de Monitoreo Atmosférico Copernicus (http://marine.copernicus.eu/) para el periodo 2006-2017, con una resolución temporal mensual y una resolución espacial de 0.08º × 0.08º. Para tomar en cuenta la variación de la temperatura vs. la profundidad asociada con el transporte vertical del agua, también se extrajeron datos de viento de Copernicus; la base de datos del viento tuvo una resolución temporal mensual y una resolución espacial de 0.25º. Incluir el viento en los modelos basados en regresiones no es una tarea trivial porque, a diferencia de la temperatura y la TDSM, el viento es una cantidad vectorial. Ya que los datos del viento fueron utilizados como indicadores del transporte vertical, el rotacional del esfuerzo del viento (WSC, por sus siglas en inglés) fue incluido como una variable predictiva en el proceso de modelamiento estadístico. El WSC fue calculado a partir de datos del viento utilizando la siguiente ecuación:

donde ∂τ y y ∂τ x son los cambios meridional y zonal, respectivamente, del esfuerzo del viento τ; y ∂ x y ∂ y son el tamaño de los pixeles (0.25º) de la base de datos del viento.

El esfuerzo del viento τ fue calculado utilizando las ecuaciones empíricas propuestas por Large y Pond (1981):

donde C D es un coeficiente de resistencia adimensional (1.2 × 10-3), ρ aire es la densidad del aire (1.22 kg·m-3) y U es la velocidad del viento a 10 m por encima de la superficie del mar. WSC fue calculado utilizando la función curl del paquete oce en el programa R v.1.2-0 (Kelley y Richards 2017).

Ya que ni los nódulos de la TDSM, ni las cuadrículas del viento correspondían exactamente a las coordenadas de los lances de CTD de la base de datos GTSPP, el punto más cercano de la TDSM y de la cuadrícula del viento a cada ubicación de lance de CTD (para el mes/año correspondiente en que se llevó a cabo el lance de CTD) fue utilizado como proxy de la TDSM y del viento para cada una de las 656 ubicaciones de los lances de CTD. Esto se logró escribiendo una función en el entorno R para calcular la distancia entre la ubicación de cada lance de CTD y cada uno de los nódulos de la cuadrícula de la TDSM, y extraer las coordenadas de la cuadrícula más cercanas a la ubicación de cada lance de CTD.

Profundidad de la termoclina

La profundidad de la termoclina es una de las variables más importantes en la hidrografía, porque los cambios en esta variable son responsables de numerosos procesos biológicos, físicos, químicos y ecológicos. Para evaluar la capacidad del modelo de reproducir los perfiles de temperatura, la profundidad de la termoclina tanto de las observaciones como de las predicciones hechas con el modelo fue calculada según Fiedler y Talley (2006), quienes sugirieron que la termoclina es la profundidad donde se presenta el valor máximo de dT/dZ.

Modelamiento estadístico

Un modelo mixto aditivo generalizado (GAMM, por sus siglas en inglés) fue utilizado para modelar la relación entre la temperatura y la profundidad, la TDSM, el WSC, la latitud, la longitud y el ONI. Los GAMM son extensiones del modelo de regresión lineal clásico, pero los 2 enfoques difieren en 3 características principales. Primero, a diferencia del modelo de regresión lineal, los GAMM pueden incorporar diferentes distribuciones de error (diferentes a la Gaussiana). Segundo, los GAMM pueden lidiar con relaciones no lineales entre las variables de respuesta y las variables independientes en una forma semiparamétrica (Maunder y Punt 2004). Qué tan “no lineal” es la relación entre la variable de respuesta y cualquier covariable es cuantificado por los grados de libertad efectivos (GLE): cuando GLE = 1, la relación es lineal; cuando GLE > 1, hay un cierto grado de no linealidad (Wood 2006). Tercero, los GAMM pueden incorporar un componente de efecto aleatorio, lo cual es útil cuando se violan los supuestos de heterogeneidad de las varianzas. La decisión de utilizar una distribución gamma para el error se basó en lo siguiente: (1) el histograma de la variable de respuesta (temperatura) estuvo sesgado hacia la izquierda (apariencia no normal), (2) la distribución gamma puede ser utilizada para variables continuas y positivas (como la temperatura) y (3) la distribución gamma puede lidiar con una dispersión razonable a expensas de tener que estimar un parámetro extra (Zuur et al. 2009).

Ya que las características oceanográficas que distribuyen las masas de agua en el área de estudio son diferentes en el lado del Pacífico y en el lado del golfo de la PBC, una variable “Región” fue anidada en el modelo. “Región” fue una variable categórica con 2 niveles: golfo y Pacífico. La división entre las áreas golfo y Pacífico se hizo según Lavín y Marinone (2003), quienes sugirieron que el golfo está separado del océano Pacífico por una línea imaginaria que va de cabo San Lucas, en la PBC, a cabo Corrientes, en el estado mexicano de Jalisco (Ver Fig. 1). El anidamiento de la variable “Región” se logró al configurar el argumento “by” de la función gamm de mgcv (Wood 2006) a “Región” (by = Región) en R (R Core Team 2016), logrando así que se ajustara una curva a los perfiles de cada lado del área de estudio (Wood 2006). La variable anidada “Región” fue incluida en todas las variables predictoras, con la excepción del ONI, ya que los datos del ONI sólo pueden ser utilizados como indicadores de la variabilidad temporal (no espacial) de un año a otro.

Para evaluar la importancia relativa de cada covariable, se utilizó un modelamiento paso a paso. En este enfoque, se añade una variable a la vez, y se evalúa su importancia por medio del porcentaje de desviación explicado. La decisión de cuándo mantener o abandonar una covariable del GAMM se basó en el criterio de información de Akaike (CIA), y cualquier variable que dio como resultado una disminución en por lo menos 2 unidades del CIA fue mantenida en el modelo (Burnham y Anderson 2002). Cuando el efecto de 2 variables juntas difiere de la suma de sus efectos separados, el utilizar los términos de interacción es una aproximación útil (Wood 2006). El término de interacción entre longitud y latitud fue incluido para dar cuenta del entorno espacial, un procedimiento comúnmente utilizado en modelamiento estadístico espacialmente explícito (véase, por ejemplo, Su et al. 2008 y Marín-Enríquez et al. 2018). Un problema común en los modelos estadísticos basados en regresión surge cuando 2 o más covariables están correlacionadas entre sí. Para minimizar el sesgo potencial inducido por la multicolinealidad, un análisis de concurvidad de los modelos se llevó a cabo a cada punto del proceso paso a paso. La concurvidad puede ser vista como una extensión no lineal de la multicolinealidad (Wood 2006) y toma valores entre 0 y 1; un valor de 1 refleja una colinealidad perfecta entre cualquier par de covariables.

El proceso de validación del modelo se dividió en 4 partes. Primero, se evaluaron la normalidad y heterogeneidad utilizando los análisis habituales de los residuales del modelo ajustado (histograma de los residuales, diagrama de dispersión de los residuales vs. las variables independientes). Segundo, el sobreajuste potencial y la capacidad predictiva del modelo fueron puestos a prueba al aplicar el modelo ajustado a un conjunto de datos independiente (un conjunto de datos que no fue utilizado en el proceso de ajuste del modelo). Los valores predichos vs. los observados para esta última parte fueron explorados al calcular la raíz del error cuadrático medio (RECM) y el coeficiente de correlación de Pearson de los datos observados vs. predichos de la temperatura y de la profundidad de la termoclina para todos los perfiles de la base de datos independiente. Para esta parte, los datos de 2017 fueron extraídos del mismo sitio web de donde fueron extraídos los datos utilizados en el proceso de ajuste. El separar los conjuntos de datos y las predicciones hechas sobre conjuntos de datos independientes ha resultado ser una herramienta útil para evaluar el sobreajuste de los modelos y la exactitud predictiva de los modelos estadísticos (Martínez-Rincón et al. 2012, Farrell et al. 2014). Tercero, para evaluar posibles sesgos en el modelo final debidos al hecho de que los procesos que regulan los perfiles de temperatura a cada lado de la PBC son diferentes, los perfiles de las bases de datos de 2007-2016 (4 perfiles para cada lado) y de 2017 (3 perfiles para el lado del golfo y 2 perfiles para el lado del Pacífico) fueron extraídos aleatoriamente de la base de datos. Una vez escogidos aleatoriamente los perfiles, el GAMM final fue utilizado para predecir las correspondientes combinaciones de longitud, latitud, TDSM, WSC y ONI para cada uno de los perfiles extraídos. Los resultados fueron explorados visualmente, y el coeficiente de correlación de Pearson fue calculado para cada uno de los perfiles escogidos aleatoriamente. Adicionalmente, las diferencias en profundidad de la termoclina entre las predicciones del modelo y las observaciones fueron evaluadas utilizando histogramas de frecuencia y calculando la correlación lineal y la RECM para todos los perfiles de la base de datos de 2017. Cuarto, los resultados del modelo fueron comparados con los perfiles de temperatura obtenidos de los modelos hidrodinámicos. Para esta última parte, los datos de perfiles de temperatura fueron extraídos del sitio web Copernicus (http://marine.copernicus.eu/); el coeficiente de correlación de Pearson y la RECM fueron calculados para evaluar las diferencias entre las predicciones del modelo y los perfiles extraídos de Copernicus. Para evaluar el desempeño final del GAMM con respecto a los datos obtenidos de los modelos hidrodinámicos, las diferencias en profundidad de la termoclina entre la predicción del modelo y los perfiles Copernicus fueron también evaluadas utilizando histogramas de frecuencia (profundidad de la termoclina observada menos la modelada tanto para el GAMM como para los datos Copernicus). El proceso de modelamiento fue llevado a cabo utilizando la librería mgcv v.1.8-22 (Wood 2006) en el entorno R (R Core Team 2016).

Resultados

Variabilidad espacial observada

De los 656 perfiles de temperatura, 545 (~83%) fueron llevados a cabo del lado del Pacífico y 111 (~17%) del lado del golfo. La mayoría de los perfiles del lado del Pacífico se llevaron a cabo durante la primera mitad del año y la mayoría de los perfiles del lado del golfo se llevaron a cabo durante junio-noviembre, aunque la distribución mensual de los lances de CTD estuvo relativamente bien distribuida durante el año (Fig. 2).

Figura 2 Distribución mensual de los lances de CTD utilizados para ajustar el modelo mixto aditivo generalizado final, para el lado del Pacífico (barras azules) y el del golfo (barras rojas). 

La Figura 3 presenta ejemplos de perfiles de temperatura llevados a cabo durante diferentes años, meses y condiciones El Niño en el lado del Pacífico y el lado del golfo. Las temperaturas altas (>25 ºC) fueron más comunes del lado del golfo que del lado del Pacífico. Se observaron capas de mezcla bien definidas de alrededor de 50 m de espesor del lado del Pacífico cuando las condiciones ONI estuvieron bajas (aproximadamente -0.8, febrero de 2009) y altas (~2.3, diciembre de 2015). Se observaron temperaturas de ~20 ºC a profundidades de ~75 m del lado del Pacífico, excepto en febrero de 2009 y julio de 2014, cuando los valores del ONI estuvieron entre aproximadamente -0.1 y -0.6 y las temperaturas fueron notablemente bajas (Fig. 3b, d). Del lado del golfo, se observaron temperaturas >25 ºC en la capa superior en agosto/octubre de 2015 y junio de 2016, cuando ocurrieron fases positivas del ENOS (ONI: ~0.1-2). Se observaron temperaturas superficiales de ~30 ºC del lado del golfo en agosto y octubre de 2015 (ONI: ~1.4 y 2, respectivamente). Se observaron capas de mezcla bien definidas de ~50 m de espesor durante condiciones ONI positivas (ONI: >2) en 2015 y 2016 (Fig. 3a, c). La capa de mezcla más profunda del lado del golfo (>100 m) fue observada en enero de 2016, cuando los valores ONI (~2.2) fueron los más altos de todo el estudio (Fig. 3a).

Figura 3 Ejemplos de los perfiles de temperatura observados para el lado del golfo (a, c) y el lado del Pacífico (b, d) del área de estudio. El año, el mes y las condiciones del Índice Oceánico de El Niño correspondientes a cada perfil se muestran en la esquina inferior a la derecha de cada panel. 

Modelamiento estadístico

El GAMM final explicó el 86.2% de la desviación total. El proceso de validación del GAMM ajustado fue satisfactorio: el histograma de los residuales de Pearson pareció ser normal y estar centrado aproximadamente en cero; no hubo señal aparente de heterogeneidad residual para cualquiera de las covariables del modelo (Fig. 4), con la excepción de la distribución espacial de los residuales. Aunque se observó algún agrupamiento de los residuales, no se observó un patrón espacial aparente (Fig. 4f). La concurvidad fue baja (<0.3) para todas las covariables solas, lo cual sugiere baja multicolinealidad entre los predictores. Todas las variables resultaron en una disminución de por lo menos 2 unidades del CIA, y la profundidad fue la variable que tuvo mayor desviación explicada (69.1%). De las variables ambientales, la TDSM capturó la mayor porción de desviación explicada (14.3%) y la mayor disminución en el CIA (75,067.07; Tabla 1).

Figura 4 Gráficos de diagnóstico de los residuales de Pearson del modelo mixto aditivo generalizado final: histograma del modelo mixto aditivo generalizado ajustado (a) y residuales vs. profundidad (b), topografía dinámica de la superficie del mar (SSDT) (c), rotacional del esfuerzo del viento (d), Índice Oceánico de El Niño (e) y longitud/latitud (f). La línea gris continua es el promedio teórico (cero) y las líneas grises discontinuas muestran el intervalo de cuantiles -02, 0.2. La línea negra discontinua en f señala la división entre el lado del Pacífico y el lado del golfo. 

Tabla 1 Resumen del modelo mixto aditivo generalizado ajustado a los perfiles de temperatura obtenidos de lances de CTD de junio de 2007 a noviembre de 2016 en el océano Pacífico frente a México. La desviación explicada final se muestra en negrilla.  

Variable Region EDF Explained deviance (%) Cumulative deviance (%) AIC |DAIC|
Temp ~ α + s(Depth) Depth(by=G) 8.54 69.10 69.10 -189,361.8 -
Depth(by=P) 8.58
Temp ~ α + s(Depth) + s(SSDT) SSDT(by=G) 8.08 14.92 83.40 -264,428.9 75,067.07
SSDT(by=P) 8.93
Temp ~ α + s(Depth) + s(SSDT) + s(WSC) WSC(by=G) 8.89 0.40 83.80 -266,547.6 2,118.71
WSC(by=P) 8.90
Temp ~ α+ s(Depth) + s(SSDT) + s(WSC) + s(ONI) - 8.91 0.30 84.91 -267,756.5 1,208.92
Temp ~ α + s(Depth) + s(SSDT) + s(WSC) + s(ONI) + s(Lon,Lat) - 28.85 2.00 86.10 -285,869.1 18,112.50
Temp ~ α + s(depth) + s(SSDT) + s(WSC) + s(ONI) + s(Lon,Lat) + Region - - 0.10 86.20 -286,285.5 416.30

EDF, effective degrees of freedom; AIC, Akaike information criterion; Temp, temperature; SSDT, sea surface dynamic topography; WSC, wind stress curl; ONI, Oceanic Niño Index; Lon, longitude; Lat, latitude; G, gulf; P, Pacific.

Los gráficos de efectos parciales del GAMM sugirieron que las temperaturas promedio en la superficie fueron más altas del lado del golfo (~29 ºC) que del lado del Pacífico (~25 ºC). El gradiente dT/dZ del perfil promedio del lado del golfo pareció ser más abrupto, ya que se observaron diferencias de cerca de 4 ºC en la superficie entre los perfiles del golfo y los del Pacífico, y se observaron diferencias <1 ºC alrededor de los 50 m de profundidad; adicionalmente, la temperatura pareció ser más alta del lado del golfo en toda la columna de agua (Fig. 5a). En general, se observaron temperaturas más altas a valores de TDSM más altos en las 2 regiones; se observaron mayores temperaturas promedio (~22 ºC) del lado del golfo cuando los valores de TDSM fueron >0.5 m. Por otra parte, un pico de alta temperatura promedio (~23 ºC) del lado del Pacífico coincidió con valores de TDSM de ~0.48 m (Fig. 5b). El efecto del WSC sobre la temperatura promedio fue leve para valores de WSC entre -1.5 × 10-7 y 1 × 10-7 Pa, cuando solo se observaron variaciones leves alrededor del valor de temperatura de 18 ºC. Las temperaturas promedio bajas del lado del golfo (~16 ºC) estuvieron asociadas con valores del WSC relativamente altos (2 × 10-7 Pa), y las temperaturas altas (~29 ºC) estuvieron asociadas con valores de WSC > 2 × 10-7 Pa. Del lado del Pacífico, las temperaturas bajas (~15 ºC) también estuvieron asociadas con valores de WSC relativamente altos (2 × 10-7 Pa). No se observaron valores de WSC > 2.5 × 10-7 Pa del lado del golfo, lo cual llevó a que los gráficos de efectos parciales produjeran valores no creíbles (Fig. 5c). Como se esperaba, los valores altos del ONI (~1.9 ºC) estuvieron relacionados con temperaturas promedio altas (~18.8 ºC) (Fig. 5d). Espacialmente, se observaron temperaturas promedio más altas del lado occidental y el lado noroccidental del área de estudio (dentro del golfo) y se observaron temperaturas más bajas en la zona nororiental de la región del Pacífico (Fig. 5e). El efecto paramétrico de la variable anidada “Región” mostró que las temperaturas promedio fueron estadísticamente más altas del lado del golfo comparadas con las temperaturas medidas del lado del Pacífico (Fig. 5f).

Figura 5 Gráficos de efectos parciales de las variables predictivas utilizadas en el modelo mixto aditivo generalizado final: profundidad (a), topografía dinámica de la superficie del mar (SSDT) (b), rotacional del esfuerzo del viento (c), Índice Oceánico de El Niño (ONI) (d), inte racción latitud/longitud (e) y temperatura paramétrica promedio para el lado del Pacífico y el lado del golfo del área de estudio. La línea azul claro en a-c muestra el intervalo de credibilidad bayesiano del 95% y las líneas perpendiculares al eje x (“rug plot”) muestran la densidad de las observaciones para cada variable. 

El modelo ajustado a la base de datos de 2007-2016 fue estadísticamente satisfactorio (la correlación entre la temperatura observada y la predicha fue ~0.93, P < 0.05, y la RECM fue ~1.55 ºC). Sin embargo, se observaron importantes diferencias entre la profundidad de la termoclina in situ y la predicha. Para el lado del golfo del área de estudio, la diferencia promedio en la profundidad de la termoclina fue de ~25.55 m (IC 95%: ±7.01 m; DE = 37.37 m) y para el lado del Pacífico la diferencia promedio fue de 37.92 m (IC 95%: ±3.25 m; DE = 38.62 m), lo cual sugiere que el GAMM final subestimó la profundidad de la termoclina (Fig. 6). La correlación entre la profundidad de la termoclina observada y la modelada fue baja (0.21) y significativa (P < 0.05). Para el lado del golfo del área de estudio, se observaron desviaciones más altas (~50 m) en junio de 2014 y julio de 2015, y se observaron desviaciones de ~0 m en abril-julio de 2008. Para el lado del Pacífico, se observaron desviaciones más altas (>100 m) de junio a septiembre de 2011 y en octubre y diciembre de 2015, y se observaron desviaciones más bajas (<20 m) principalmente en la segunda mitad de 2007 y entre abril y diciembre de 2012 (Fig. 7).

Figura 6 Desviaciones en la profundidad de la termoclina observada menos la modelada para los datos de 2007-2016, que fueron utilizados para ajustar el modelo mixto aditivo generalizado. Curvas de densidad Kernel (arriba) y desviaciones promedio con intervalos de confianza del 95% (abajo) para el lado del Pacífico y el lado del golfo del área de estudio. 

Figura 7 Gráfico Hovmöller de las desviaciones mensuales promedio en la profundidad de la termoclina observada menos la modelada para el lado del golfo (arriba) y el lado del Pacífico (abajo) del área de estudio. La escala a color está en metros. 

Aunque el desempeño predictivo del modelo basado en un conjunto de datos independiente (base de datos de perfiles de 2017) también fue estadísticamente satisfactorio (las temperaturas predichas y observadas estuvieron altamente correlacionadas [ρ ~0.93, P < 0.05] y la RECM fue ~1.48 ºC), también se observaron algunas desviaciones importantes en la profundidad de la termoclina observada vs. la modelada. Para el lado del golfo, la moda de la diferencia en la profundidad de la termoclina observada vs. la modelada fue de aproximadamente -10 m y para el lado del Pacífico fue de aproximadamente 22 m. Las desviaciones promedio de la profundidad de la termoclina fueron 3.28 m (IC 95%: ±9.800 m; DE = 22.68) para el lado del golfo y 18.40 m (IC 95%: ±6.185 m; DE = 19.86 m) para el lado del Pacífico (Fig. 8). El coeficiente de correlación de la profundidad de la termoclina in situ vs. la modelada para los datos de validación de 2017 fue ~0.44, y fue estadísticamente significativo (P < 0.05).

Figura 8 Desviaciones en la profundidad de la termoclina observada menos la modelada para los datos de 2017, que fueron utilizados para validar el modelo mixto aditivo generalizado. Curvas de densidad Kernel (arriba) y desviaciones promedio con intervalos de confianza del 95% (abajo) para el lado del Pacífico y el lado del golfo del área de estudio. 

En general, las desviaciones entre la profundidad de la termoclina observada vs. la modelada parecieron ser más altas para el lado del Pacífico del área de estudio que para el lado del golfo. Las desviaciones más grandes estuvieron asociadas con TDSM más altas (>0.25 m) y con valores de ONI positivos, tanto para los datos de entrenamiento (2006-2016) como para los de validación (2017). También fue aparente un efecto espacial, ya que se observaron desviaciones más altas alrededor de 22º N y al oeste de 112.5º W para el conjunto de datos de entrenamiento y alrededor de 22 ºN para el conjunto de datos de validación. No se observó un patrón aparente para el WSC (Figs. S1, S2).

Los perfiles de temperatura observados y predichos extraídos aleatoriamente de los conjuntos de datos para el Pacífico y el golfo son presentados en las Figuras 9 y 10. Se observaron desviaciones entre temperaturas observadas y modeladas de hasta 2 ºC en algunos de los perfiles llevados a cabo para 2007-2016. Aparentemente, el modelo no logró reproducir los perfiles observados cuando la capa de mezcla era más evidente, aunque reprodujo razonablemente bien los perfiles para el lado del golfo; por ejemplo, se observó una desviación en la profundidad de la termoclina observada vs. modelada de aproximadamente -13 m en un perfil de mayo 2016 (Fig. 9c, Tabla 2). Este perfil se llevó a cabo durante condiciones TDSM leves (~0.22 m), un transporte de agua hacia abajo relativamente alto (-1.08 × 10-8 Pa) y condiciones ONI positivas (0.6). También se observaron desviaciones más grandes para los perfiles del lado del golfo (~42.21 m), aunque el modelo pareció reproducir bien las observaciones (Fig. 9d); las condiciones ambientales promedio cuando se llevó a cabo este lance de CTD fueron de hundimiento leve (-1.96 × 10-8 Pa), TDSM leve (0.27 m) y ONI neutro (~0.0).

Figura 9 Perfiles de temperatura observados (círculos) y predichos por el modelo (línea continua) escogidos aleatoriamente para el lado del golfo (a-d) y el lado del Pacífico (e-h) del área de estudio. La ubicación geográfica de cada lance de CTD se muestra con letras correspondientes en la Figura 1

Figura 10 Perfiles de temperatura observados (puntos negros) y predichos por el modelo (línea continua) extraídos aleatoriamente de los datos de validación de 2017 para el lado del Pacífico (línea azul continua) y el lado del golfo (línea roja continua) del área de estudio. Las ubicaciones y las estadísticas descriptivas de los perfiles se muestran en la Tabla 3

Table 2 Descriptive statistics for the profiles that were randomly chosen from the 2007-2016 database. The letters in the first column to the right match the panels displayed in Figure 9

Panel Month Year Zmin (m) Zmax (m) Longitude Latitude SSDT (m) WSC (×10-8 Pa) ONI (ºC) Zt observed (m) Zt predicted (m) Zt difference (m) r
a Sep 2016 12 199 -107.08 22.92 0.38 -1.53 -0.8 57.68 34.65 23.03 0.97
b Jun 2016 5 199 -107.80 23.26 0.26 0.04 0.1 14.23 33.97 -19.74 0.96
c May 2016 1 199 -109.14 24.40 0.22 -1.08 0.6 20.43 34.23 -13.79 0.96
d Jun 2014 3 199 -108.80 22.62 0.27 -1.96 0.0 76.22 34.00 42.21 0.94
e Mar 2008 5 198 -109.00 20.26 0.19 -17.30 1.1 53.79 42.01 11.78 0.96
f Apr 2009 18 194 -111.99 19.19 0.15 0.73 -0.1 73.35 41.87 31.48 0.95
g May 2015 4 199 -108.99 21.64 0.23 -11.60 0.8 79.14 41.75 36.39 0.97
h Apr 2009 15 194 -114.25 21.79 0.19 0.54 -0.2 62.68 42.84 19.84 0.96

Z, depth; SSDT, sea surface dynaic topography; wind stress curl; ONI, Oceanic Niño Index.

El modelo fue, aparentemente, menos exacto al predecir perfiles del lado del Pacífico, ya que las desviaciones entre las profundidades de la termoclina observadas y modeladas fueron >20 m para 3 de los 4 ejemplos de perfiles tomados del lado del Pacífico. Las desviaciones más grandes (~36.39 m) fueron observadas en mayo de 2015, cuando ocurrió un hundimiento de agua intenso (-11.60 × 10-8 Pa), TDSM leve (0.23 m) y condiciones ONI positivas (-0.8) (Fig. 9g, Tabla 2). El modelo reprodujo razonablemente bien un perfil llevado a cabo en mayo de 2008, aunque las desviaciones entre la temperatura observada y la modelada fueron >11 m (Fig. 9e, Tabla 2); las condiciones ambientales presentes cuando se hizo esta observación incluyeron TDSM leve (0.19 m), hundimiento de agua intenso (-17.30 × 10-8 Pa) y ONI positivo (1.1) (Tabla 2). Aún con las desviaciones mencionadas, el coeficiente de correlación entre los datos observados y los modelados fue alto (>0.94) para todos los perfiles que fueron extraídos aleatoriamente de la base de datos de entrenamiento. Los perfiles predichos por el modelo para el conjunto de datos independiente (2017) se presentan en la Figura 10, y las condiciones ambientales asociadas con los perfiles se presentan en la Tabla 3. El modelo reprodujo razonablemente bien un perfil del lado del golfo para abril de 2017, que coincidió con valores leves del TDSM y un WSC negativo, lo que resultó en una desviación entre profundidad de la termoclina observada vs. predicha de ~0 m (Fig. 10c, Tabla 3). Otro perfil en el que el modelo y las observaciones estuvieron en acuerdo se observó para febrero de 2017, también del lado del golfo, el cual coincidió con una surgencia relativamente fuerte (1.94 × 10-8 Pa) y un ONI negativo (-0.1). Para este perfil, una desviación entre la profundidad de la termoclina observada vs. la predicha fue de aproximadamente 3.5 m (Fig. 10d, Tabla 3). Por otra parte, se observaron desviaciones más altas de la profundidad de la termoclina (~18 m) para un perfil llevado a cabo del lado del Pacífico del área de estudio, con desviaciones de ~5 ºC observadas en aguas superficiales (Fig. 10b, Tabla 3); este perfil fue observado durante condiciones de hundimiento de agua (-0.711 × 10-8 Pa) y TDSM alta (0.32). El otro perfil que fue extraído aleatoriamente del lado del Pacífico presentó una desviación en la profundidad de la termoclina alrededor de los 4 m, aunque se observaron desviaciones de ~4 ºC en los primeros 50 m de la columna de agua (Fig. 10f). Las condiciones ambientales asociadas con este perfil fueron hundimiento leve (-2.11 × 10-8 Pa), TDSM alta (0.28 m) y ONI positivo (0.4) (Fig. 10f, Tabla 3).

Tabla 3 Estadísticas descriptivas de los perfiles escogidos aleatoriamente de la base de datos de validación de 2017. Las letras en la primera columna a la izquierda corresponden a los paneles de la Figura 10

Panel Month Zmin (m) Zmax (m) Longitude (ºW) Latitude (ºN) SSDT (m) WSC (×10-8 Pa) ONI (ºC) Zt observed (m) Zt predicted (m) Zt difference (m) r
a Apr 1 199 -107.90 22.08 0.19 -2.26 0.4 33.0 35 -2.0 0.99
b May 3 199 -110.40 19.20 0.32 -0.71 0.4 59.0 41 18.0 0.99
c Apr 4 199 -107.60 18.62 0.23 -4.36 0.3 35.0 35 0.0 0.98
d Feb 4 199 -108.40 24.43 0.17 1.94 -0.1 38.5 35 3.5 0.98
e May 3 199 -107.90 18.50 0.26 -3.58 0.4 27.0 37 -10.0 0.99
f Mar 1 199 -111.06 21.48 0.28 -2.11 0.4 45.0 41 4.0 0.98

Se observaron también un coeficiente de correlación alto (promedio = 0.98; IC 95%: 0.978-0.981) y un valor de RECM alto (promedio = 1.61 ºC; IC 95%: 1.54-1.68 ºC) cuando se compararon las predicciones del GAMM final y los perfiles extraídos de Copernicus (Fig. S3). También fueron importantes las diferencias en la profundidad de la termoclina de los perfiles in situ vs. los perfiles Copernicus (diferencia promedio = 20.68 m; IC 95%: 17.78-23.58 m) y los perfiles in situ vs. los perfiles predichos por el GAMM final (diferencia promedio = 35.83 m; IC 95%: 32.87-38.80 m). Los resultados de este análisis sugieren que tanto los datos extraídos de los modelos hidrodinámicos (Copernicus) como aquellos extraídos del GAMM subestiman la profundidad de la termoclina con desviaciones >100 m en algunos de los perfiles (Fig. S4).

Discusión

A conocimiento del autor, este manuscrito representa el primer intento para modelar perfiles de temperatura utilizando un GAMM. La Figura 5 muestra que la relación entre la temperatura y todas las covariables fue no lineal (GLE > 1), así que elegir el modelo aditivo más complejo sobre su contraparte lineal pareció ser un buen enfoque. El GAMM final sugirió que la capa de mezcla de ~35 a 40 m fue evidente tanto del lado del golfo como del lado del Pacífico del área de estudio a lo largo del periodo de estudio; también indicó que los cambios de temperatura vs. profundidad fueron más abruptos del lado del golfo, ya que se observaron diferencias de alrededor de 4 ºC en la superficie y las curvas estaban cerca a converger alrededor de los 40 m (diferencia <1 ºC), lo cual sugiere que la columna de agua del lado del golfo presentó una estratificación vertical más fuerte. Una capa de mezcla somera (<60 m) bien definida es una característica típica del océano Pacífico oriental tropical, donde una termoclina permanente domina la estructura térmica (Fiedler y Talley 2006). Se observaron temperaturas promedio más altas del lado del golfo. El GC es un mar semicerrado y es considerado una cuenca de evaporación; aquí, las altas tasas de evaporación resultan en la formación de masas de agua con temperaturas cálidas y altas salinidades (Castro et al. 2006). Por otra parte, el lado del Pacífico del área de estudio está principalmente influenciado por las aguas frías y ricas en nutrientes de la corriente de California. Adicionalmente, ocurren fuertes eventos de surgencia durante mayo-junio en esta zona (Zaytsev et al. 2003), y estos eventos son capaces de romper la estratificación de la columna de agua. Esto explicaría el hecho de que una estratificación más fuerte de la columna de agua con temperaturas altas fue observada en el gráfico de efectos del GAMM final. En el área de estudio, la profundidad de la termoclina es afectada por el flujo neto de calor y el transporte vertical de agua debido a la mezcla por el viento. El modelo también sugirió que las temperaturas más altas ocurrieron durante eventos El Niño (valores ONI positivos) y cuando se observaron valores altos de TDSM y valores negativos de WSC. Los efectos típicos de las condiciones fuertes de El Niño incluyen temperaturas altas de la capa superior del océano y un aumento en la profundidad de la termoclina (Collins et al. 2010). Valores más altos de la TDSM están relacionados con ciertas características oceanográficas que causan hundimiento de aguas superficiales y una profundización de la termoclina, como por ejemplo los remolinos anticiclónicos (Domokos et al. 2007), así que los valores altos de TDSM están asociados con temperaturas del agua más altas. Los valores de WSC positivos están relacionados con la surgencia, y los negativos con un transporte de agua hacia abajo (Kessler 2006). Este comportamiento parece estar en acuerdo con el gráfico de efectos parciales para el WSC, ya que se observó una pendiente negativa en la curva de temperatura promedio vs. WSC. Además, se observaron valores negativos extremos de WSC (hundimiento de agua) mayoritariamente del lado del golfo, con el comportamiento opuesto (valores de surgencia extremos) observado únicamente del lado del Pacífico. Como se afirmó anteriormente, el GC es considerado una cuenca de evaporación y se espera que la estratificación sea más evidente aquí que del lado del Pacífico, una región donde ocurren eventos de surgencia intensos impulsados por el viento que pueden llegar a romper la estratificación de la columna de agua (Zaytsev et al. 2003).

Tanto el porcentaje de desviación explicada (~93%) como el coeficiente de correlación de los datos modelados vs. observados para una base de datos independiente (2017) fueron muy satisfactorios desde el punto de vista estadístico, y el GAMM final reprodujo bastante bien los perfiles de temperatura de los 200 m superiores en el área de estudio. Se calculó una RECM (~1.5 ºC) muy similar para el conjunto de datos de entrenamiento (2007-2016) y de validación (2017). Este valor de RECM es similar al presentado por Deng et al. (2011) (1.2-1.8 ºC), quienes utilizaron modelos más complicados de asimilación de datos para predecir los perfiles de temperatura en el océano Pacífico. La RECM calculada en el presente estudio es más bajo que la RECM reportada por Dorantes-Gilardi (2018) (1.9 ºC), quien utilizó un modelo físico/biogeoquímico acoplado para predecir los perfiles de temperatura en la costa oeste de la PBC. Además, las desviaciones de las curvas observadas vs. las predichas del GAMM final fueron similares a las desviaciones presentadas por Dorantes-Gilardi y Rivas (2019), lo cual sugiere de nuevo que los modelos de regresión no lineal son herramientas con un interesante potencial para modelar perfiles de temperatura.

Aunque el GAMM final fue estadísticamente satisfactorio, se observaron importantes desviaciones entre la profundidad de la termoclina observada y la modelada. Por ejemplo, las desviaciones en la profundidad de la termoclina modelada con respecto a la profundidad de la termoclina observada fueron mayores cuando la estratificación de la columna de agua fue mayor (espesor de la capa de mezcla ≥50 m) tanto en el lado del Pacífico como en el del golfo (Figs. 9, 10).

Las desviaciones en la profundidad de la termoclina también se relacionaron con una TDSM alta y valores altos del ONI (ver material suplementario). Como se mencionó antes, se espera que ocurran temperaturas más altas y una estratificación más fuerte de la columna de agua cuando se presentan valores altos de la TDSM y del ONI. Una TDSM positiva a menudo resulta en hundimiento de aguas superficiales, y eventos positivos del ENOS causan un calentamiento de la estructura de la columna de agua superior. Dorantes-Gilardi y Rivas (2019) encontraron desviaciones importantes entre perfiles de temperatura observados y modelados en la costa occidental de la PBC; su estudio se llevó a cabo en el periodo 2013-2016, cuando se presentaron aguas anormalmente calientes debido a un evento ENOS fuerte (2015) y al evento del “Blob” (2014), una masa muy grande de agua caliente que se originó en el golfo de Alaska en 2013 (Bond et al. 2015) y afectó a gran parte del océano Pacífico oriental, incluso las aguas frente a Baja California (Gilardi y Rivas 2019). Se detectaron importantes desviaciones en la profundidad de la termoclina observada vs. la modelada del lado del Pacífico durante 2015 y 2016, años con temperaturas más altas de lo normal debido al evento El Niño de 2015. Las desviaciones entre las observaciones y el modelo podrían ser, entonces, el resultado de una estratificación anormalmente fuerte del lado del Pacífico de la PBC, un fenómeno que no puede ser explicado por el GAMM final, porque la estratificación de la columna de agua del lado del Pacífico de la PBC generalmente no es tan fuerte como la del lado del golfo. Tanto la TDSM como el ONI tuvieron un efecto de “sesgo” sobre las desviaciones de la profundidad de la termoclina observada vs. la modelada, y se dieron valores más altos de la TDSM y del ONI durante El Niño de 2015, lo cual podría explicar las desviaciones más amplias observadas en 2015-2016. Las desviaciones del lado del golfo no fueron tan importantes como las observadas del lado del Pacífico (ver Fig. 6). Esto tal vez sea explicado por el hecho de que la estratificación de la columna de agua es más fuerte del lado del golfo (una cuenca de evaporación), como lo muestra el gráfico de efectos parciales. Las predicciones hechas con el GAMM final para las observaciones del golfo estuvieron menos sesgadas porque el modelo fue “entrenado” utilizando datos de una columna de agua más estratificada (perfiles llevados a cabo en el GC), lo cual tal vez suavizó el efecto de El Niño de 2015 sobre las predicciones hechas para el lado del golfo.

El coeficiente de correlación y la RECM entre las predicciones del GAMM final y los perfiles de temperatura obtenidos con modelos hidrodinámicos (datos Copernicus) fueron también estadísticamente satisfactorios (véase Fig. S3). Es de notar que, en general, tanto los datos Copernicus como las predicciones del GAMM subestimaron la profundidad de la termoclina, y se observaron desviaciones >100 m en ambos casos; sin embargo, las desviaciones en la profundidad de la termoclina observada vs. la modelada obtenidas con el GAMM fueron aproximadamente 15 m más grandes que las desviaciones de los datos Copernicus, que fueron alrededor del 18% de la profundidad de la termoclina promedio (~80 m) en el área de estudio. Una posible explicación de las diferencias mencionadas es que, de nuevo, el GAMM no puede considerar la estratificación asociada con los eventos extremos anuales que actúan a diferentes escalas espaciales y temporales (como el “Blob”), ya que en el GAMM final no se incluyó una variable que pudiera ser utilizada como indicador de tales eventos.

Otras fuentes de sesgo también podrían estar jugando un papel importante en las desviaciones de los perfiles predichos con el GAMM final con respecto a las observaciones in situ y a los datos Copernicus, tal como la incertidumbre inherente a los datos satelitales. Por ejemplo, Fangohr y Kent (2012) sugirieron desviaciones del orden de decenas de metros por segundo cuando 2 procesos diferentes fueron aplicados a las mismas observaciones del viento derivadas de satélites. Dorantes-Gilardi y Rivas (2019) sugirieron que la TDSM derivada de satélites podría tener un sesgo en las observaciones cercanas a la línea costera, un sesgo que se induce a la base de datos TDSM durante la fase de preprocesamiento. Aunque el sesgo inherente a la información satelital no es fácil de cuantificar, se esperaría que el efecto de tal sesgo sobre el GAMM final fuera bajo, porque sólo datos satelitales L4 (datos con el nivel de procesamiento más alto) fueron utilizados en el proceso de modelamiento.

Otra fuente de sesgo podría atribuirse al hecho de que se utilizaron imágenes satelitales promedio mensuales como predictores en el proceso de modelamiento. Por ejemplo, si un lance de CTD fue llevado a cabo al principio o a finales de un mes, las condiciones ambientales presentes en aguas cercanas al lance de CTD serían un poco diferentes a las condiciones promedio para ese mes en particular en esa zona en particular. El incluir imágenes satelitales diarias tal vez disminuiría el sesgo inducido si se utilizan datos satelitales promedio del mes. Utilizar datos satelitales diarios en el modelo de regresión no lineal implica 2 retos importantes: (1) no hay imágenes satelitales diarias disponibles para la mayoría de variables ambientales incluidas en el GAMM final y (2) el tamaño de las bases de datos procesadas aumentaría sustancialmente. Un ejemplo que ilustra este último reto podría sacarse del presente estudio; 132 imágenes de la TDSM mensuales (2007-2017) fueron procesadas, lo cual resultó en casi 2 millones (1,856,580) de observaciones. Para la misma área de estudio, utilizar imágenes de la TDSM diarias (suponiendo que estén disponibles) resultaría en una base de datos de más de 55 millones de observaciones (suponiendo 30 días por mes). Construir un modelo de regresión no lineal con bases de datos tan grandes sería tal vez imposible para las computadoras personales tradicionales, lo cual resalta la importancia de la exploración de algoritmos de procesamiento de datos y aproximaciones de modelamiento que sean más eficientes desde el punto de vista computacional.

Aún con las limitantes ya mencionadas, los perfiles de temperatura del área de estudio fueron reproducidos bastante bien por un modelo estadístico no paramétrico de fácil acceso. Adicionalmente, la RECM del GAMM final fue comparable a la RECM obtenida con modelos más complicados (y tal vez menos disponibles), lo cual es alentador para continuar con la exploración de diferentes enfoques de los modelos de regresión no lineal para predecir perfiles de temperatura del agua. El presente manuscrito podría servir como una línea de base para el campo de investigación del modelamiento de las propiedades del agua de mar utilizando un modelo de regresión no lineal, una línea de investigación que actualmente está virtualmente inexplorada.

En conclusión, el modelo de regresión no lineal resultó ser una herramienta interesante y virtualmente inexplorada para modelar las propiedades del agua de mar. El GAMM final presentado en este artículo podría ser utilizado para predecir perfiles de temperatura con una confianza del ~93% y un error de ~1.5 ºC, lo que brinda un enfoque alternativo a los modelos determinísticos más complejos. Se observaron desviaciones importantes en la profundidad de la termoclina observada vs. la modelada, y los factores responsables de este comportamiento no son del todo claros. Al ir aumentando la cantidad de datos oceanográficos almacenados en repositorios públicos, así como la capacidad computacional, se podrán hacer mejoras al GAMM final, que seguramente disminuirán la incertidumbre de los perfiles de temperatura predichos.

Agradecimientos

Este trabajo contó con el apoyo del Consejo Nacional de Ciencia y Tecnología (CONACYT) de México a través del programa “Cátedras” (proyecto No. 2137). La valiosa ayuda de Tadashi Kono-Martínez (Universidad Autónoma de Baja California) en el cálculo del rotacional del esfuerzo del viento es muy apreciada. El autor agradece al personal del programa ERDDAP de la NOAA por su atención y valiosos esfuerzos por proveer un repositorio de datos público, muy completo y de fácil uso. El autor también agradece los valiosos comentarios de 3 revisores anónimos que ayudaron a mejorar la calidad de este artículo. El autor declara que no hay conflictos de interés.

REFERENCIAS

Akbari E, Alavipanah SK, Jeihouni M, Hajeb M, Haase D, Alavipanah S. 2017. A review of Ocean/Sea subsurface water temperature studies from remote sensing and non-remote sensing methods. Water. 9(12):936. https://doi.org/10.3390/w9120936 [ Links ]

Álvarez-Borrego S. 1983. Gulf of California. In: Ketchum BH (ed.), Estuaries and enclosed seas. Amsterdam (Netherlands): Elsevier. p. 427-449. [ Links ]

Bond NA, Cronin MF, Freeland H, Mantua N. 2015. Causes and impacts of the 2014 warm anomaly in the NE Pacific. Geophys Res Lett. 42(9):3414-3420. https://doi.org/10.1002/2015GL063306 [ Links ]

Burnham KP, Anderson DR. 2002. Model selection and multimodel inference: a practical and information-theoretic approach. 2nd ed. Berlin (Germany): Springer-Verlag. 488 p. https://doi.org/10.1007/b97636 [ Links ]

Castro R, Durazo R, Mascarenhas A, Collins CA, Trasviña A. 2006. Thermohaline variability and geostrophic circulation in the southern portion of the Gulf of California. Deep-Sea Res PT I. 53(1):188-200. https://doi.org/10.1016/j.dsr.2005.09.010 [ Links ]

Castro R, Lavín MF, Ripa P. 1994. Seasonal heat balance in the Gulf of California. J Geophys Res. 99(C2):3249-3261. https://doi.org/10.1029/93JC02861 [ Links ]

Collins M, An S, Cai W, Ganachaud A, Guilyardi E, Jin F, Jochum M, Lengiagne M, Power S, Timmermann A, et al. 2010. The impact of global warming on the tropical Pacific Ocean and El Niño. Nat Geosci. 3:391-397. https://doi.org/10.1038/ngeo868 [ Links ]

Deng Z, Tang Y, Freeland HJ. 2011. Evaluation of several error schemes in the EnKF assimilation: Applied to Argo profiles in the Pacific Ocean. J Geophys Res . 116(C9):C09027. https://doi.org/10.1029/2011JC006942 [ Links ]

Domokos R, Seki MP, Polovina JJ, Hawn DR. 2007. Oceanographic investigation of the American Samoa albacore (Thunnus alalunga) habitat and longline fishing grounds. Fish Oceanogr. 16(6):555-572. https://doi.org/10.1111/j.1365-2419.2007.00451.x [ Links ]

Dorantes-Gilardi M. 2018. Modelación numérica de variables biogeoquímicas en la región sur de la Corriente de California durante el período anómalo cálido 2013-2015 [MSc thesis]. [Ensenada (Mexico)]: Centro de Investigación Científica y Educación Superior de Ensenada. 64 p. [ Links ]

Dorantes-Gilardi M, Rivas D. 2019. Effects of the 2013-2016 Northeast Pacific warm anomaly on physical and biogeochemical variables off northwestern Baja California, derived from a numerical NPZD model. Deep-Sea Res PT II. 169-170:104668. https://doi.org/10.1016/j.dsr2.2019.104668 [ Links ]

Emmett RL, Brodeur RD, Miller TW, Pool SS, Krutzikowsky GK, Bentley PJ, McCrae J. 2005. Pacific sardine (Sardinops sagax) abundance, distribution, and ecological relationships in the Pacific Northwest. CalCOFI Rep. 46:122-143. [ Links ]

Fangohr S, Kent EC. 2012. An estimate of structural uncertainty in QuikSCAT wind vector retrievals. J Appl Meteorol Clim. 51(5):954-961. https://doi.org/10.1175/JAMC-D-11-0183.1 [ Links ]

Farrell ER, Boustany AM, Halpin PN, Hammond DL. 2014. Dolphinfish (Coryphaena hippurus) distribution in relation to biophysical ocean conditions in the northwest Atlantic. Fish Res. 151:177-190. https://doi.org/10.1016/j.fishres.2013.11.014 [ Links ]

Fiedler PC. 1988. Surface manifestations of subsurface thermal structure in the California Current. J Geophys Res . 93(C5):4975-4983. https://doi.org/10.1029/JC093iC05p04975 [ Links ]

Fiedler PC, Talley LD. 2006. Hydrography of the eastern tropical Pacific: A Review. Prog Oceanogr. 69(2-4):143-180. https://doi.org/10.1016/j.pocean.2006.03.008 [ Links ]

Godínez VM, Beier E, Lavín MF, Kurczyn JA. 2010. Circulation at the entrance of the Gulf of California from satellite altimeter and hydrographic observations. J Geophys Res . 115(C4):C04007. https://doi.org/10.1029/2009JC005705 [ Links ]

Gómez-Ocampo E, Gaxiola-Castro G, Durazo R. 2017. Approach for estimating the dynamic physical thresholds of phytoplankton production and biomass in the tropical-subtropical Pacific Ocean. J Geophys Res-Biogeo. 122(6):1385-1403. https://doi.org/10.1002/2016JG003636 [ Links ]

Holland KN, Brill RW, Chang RKC. 1990. Horizontal and vertical movements of blue marlin captured and released using sportfishing gear. Fish Bull. 88(2):397-402. [ Links ]

Jones MR, Blenkinsop S, Fowler HJ, Stephenson DB, Kilsby CG. 2013. Generalized additive modelling of daily precipitation extremes and their climatic drivers. Boulder (CO): National Center for Atmospheric Research. 35 p. NCAR Technical Notes No. NCAR/TN-501+STR. https://doi.org/10.5065/D68P5XH3 [ Links ]

Kelley D, Richards C. 2017. OCE: Analysis of oceanographic data. [place unknown]: CRAN R project; [accessed 2020 October 20]. https://CRAN.R-project.org/package=oceLinks ]

Kessler WS. 2006. The circulation of the eastern tropical Pacific: A review. Progr Oceanogr. 69(2-4):181-217. https://doi.org/10.1016/j.pocean.2006.03.009 [ Links ]

Large WG, Pond S. 1981. Open ocean momentum flux measurements in moderate to strong winds. J Phys Oceanogr. 11(3):324-336. https://doi.org/10.1175/1520-0485(1981)011<0324:OOMFMI>2.0.CO;2 [ Links ]

Lavín MF, Marinone SG. 2003. An overview of the physical oceanography of the Gulf of California. In: Velasco-Fuentes OU, Sheinbaum J, Ochoa J (eds.), Nonlinear processes in geophysical fluid dynamics. Dordrecht (Netherlands): Springer. p. 173-204. https://doi.org/10.1007/978-94-010-0074-1_11 [ Links ]

Lynn RJ, Simpson JJ. 1987. The California Current system: The seasonal variability of its physical characteristics. J Geophys Res . 92(C12):12947-12966. https://doi.org/10.1029/jc092ic12p12947 [ Links ]

Marín-Enríquez E, Seoane J, Muhlia-Melo A. 2018. Environmental modeling of the occurrence of dolphinfish (Coryphaena spp.) in the Pacific Ocean off Mexico reveals seasonality in abundance, hot spots and migration patterns. Fish Oceanogr . 27(1):28-40.https://doi.org/10.1111/fog.12231 [ Links ]

Martínez-Rincón RO, Ortega-García S, Vaca-Rodríguez JG. 2012. Comparative performance of generalized additive models and boosted regression trees for statistical modeling of incidental catch of wahoo (Acanthocybium solandri) in the Mexican tuna purse-seine fishery. Ecol Model. 233:20-25. https://doi.org/10.1016/j.ecolmodel.2012.03.006 [ Links ]

Maunder MN, Punt AE. 2004. Standardizing catch and effort data: a review of recent approaches. Fish Res . 70(2-3):141-159. https://doi.org/10.1016/j.fishres.2004.08.002 [ Links ]

R Core Team. 2016. R: A language and environment for statistical computing. Vienna (Austria): R Foundation for Statistical Computing; [accessed 2019 March 30]. htpps://www.R-project.org. [ Links ]

Richards RG, Tomlinson R, Chaloupka M. 2010. Using generalized additive models to assess, explore and unify environmental monitoring datasets. In: Swayne DA, Yang W, Voinov AA, Rizzoli A, Filatova T (eds.), iEMSs 2010: Modelling for Environment’s Sake. Proceedings of the Fifth Biennial Conference of the International Environmental Modelling and Software Society; 5-8 Jul 2010 Ottawa, Ontario, Canada. Canada: International Environmental Modelling and Software Society. 8 p. [ Links ]

Simmons RA. 2017. ERDDAP. Monterey (CA): National Oceanic and Atmospheric Administration, National Marine Fisheries Service, Southwest Fisheries Science Center Environmental Research Division; [accessed 2019 July 4]. https://coastwatch.pfeg.noaa.gov/erddapLinks ]

Su NJ, Sun CL, Punt AE, Yeh SZ. 2008. Environmental and spatial effects on the distribution of blue marlin (Makaira nigricans) as inferred from data for longline fisheries in the Pacific Ocean. Fish Oceanogr . 17(6):432-445. https://doi.org/10.1111/j.1365-2419.2008.00491.x [ Links ]

Torres-Orozco E. 1993. Análisis volumétrico de las masas de agua del Golfo de California [MSc thesis]. [Ensenada (Mexico)]: Centro de Investigación Científica y de Educación Superior de Ensenada. 80 p. [ Links ]

Torres-Orozco E, Trasviña A, Muhlia-Melo A, Ortega-García S. 2005. Dinámica de mesoescala y capturas de atún aleta amarilla en el Pacífico mexicano = Mesoscale dynamics and yellowfin tuna catches in the Mexican Pacific. Cienc Mar. 31(4):671-683. https://doi.org/10.7773/cm.v31i4.33 [ Links ]

Wood SN. 2006. Generalized additive models: An introduction with R. Boca Raton (FL): Chapman and Hall/CRC. 410 p. [ Links ]

Yang J, Gong P, Fu R, Zhang M, Chen J, Liang S, Xu B, Shi J, Dickinson R. 2013. The role of satellite remote sensing in climate change studies. Nat Clim Chang. 3:875-883. https://doi.org/10.1038/nclimate1908 [ Links ]

Yang L, Qin G, Zhao N, Wang C, Song G. 2012. Using a Generalized Additive Model with autoregressive terms to study the effects of daily temperature on mortality. BMC Med Res Methodol. 12:165. https://doi.org/10.1186/1471-2288-12-165 [ Links ]

Zainuddin M, Saitoh K, Saitoh S. 2008. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data. Fish Oceanogr . 17(2):61-73. https://doi.org/10.1111/j.1365-2419.2008.00461.x [ Links ]

Zamudio L, Hogan P, Metzger EJ. 2008. Summer generation of the Southern Gulf of California eddy train. J Geophys Res . 113(C6):C06020. https://doi.org/10.1029/2007JC004467 [ Links ]

Zaytsev O, Cervantes-Duarte R, Montante O, Gallegos-García A. 2003. Coastal upwelling activity on the Pacific shelf of the Baja California Peninsula. J Oceanogr. 59(4):498-502. https://doi.org/10.1023/A:1025544700632 [ Links ]

Zuur AF, Ieno EN, Walker NJ, Saveliev AA, Smith GM. 2009. Mixed effects models and Extensions in Ecology with R. New York: Springer-Verlag. 574 p. [ Links ]

Supplementary material

Figura S1 Relación entre las diferencias en la profundidad de la termoclina (TDD; profundidad de la termoclina observada menos la modelada) y las covariables ambientales y espaciales de los datos utilizados para ajustar el modelo mixto aditivo generalizado (junio de 2007 a noviembre de 2016). 

Figura S2 Relación entre las diferencias en la profundidad de la termoclina (TDD; profundidad de la termoclina observada menos la modelada) y las covariables ambientales y espaciales de los datos utilizados para validar el modelo mixto aditivo generalizado (2017). 

Figura S3 Raíz del error cuadrático medio (RMSE) (a), coeficiente de correlación (b), perfiles extraídos aleatoriamente para los datos obtenidos de Copernicus (círculos abiertos) (c-k) y perfiles predichos con el modelo mixto aditivo generalizado final (línea sólida) (c-k) para el lado del Pacífico (azul) y el lado del golfo (roja) del área de estudio. La línea sólida verde y las líneas discontinuas verdes en los paneles a y b muestran el promedio y los intervalos de confianza del 95%, respectivamente. La ubicación de cada perfil en los paneles c-k se muestra en el panel l con letras correspondientes. 

Figura S4 Diferencias en la profundidad de la termoclina (observada menos modelada) para el modelo mixto aditivo generalizado final y para los datos Copernicus. Arriba: curvas de densidad Kernel; abajo: diferencia promedio (en metros) con intervalos de confianza del 95% asociados.  

Recibido: 26 de Junio de 2019; Aprobado: 05 de Diciembre de 2020

Creative Commons License This is an open-access article distributed under the terms of the Creative Commons Attribution License