Este es un proyecto liderado por la Licenciada Josefina Cuesta Nuñez
(CIMAS-CONICET) y dirigido por los Dres. Alejandra Romero, Guillermo
Svendsen y Matías Ocampo Reinaldo (CIMAS-CONICET).
Guillermo me contacto para ayudar con el analisis de estos datos
Los analisis se encuentran en este repositorio.
El repositorio no contiene los datos ni el borrador del
manuscrito.
Para poder replicar los analisis hay que copiar el archivo
datos_completos.rds
(que me envio Josefina) en la carpeta
data
.
A mediados de mayo 2025, mantuvimos una reunion Josefina, Alejandra,
Guillermo, Matias y yo.
Luego de la reunion con el grupo de trabajo se decidio hacer estas
actualizaciones:
2 . cambiar la estructura del efecto de año. En este momento la estamos usando como una variable aleatorio (random intercept). La cambiaremos a una variable fija (continua, smooth effect).
Los resultados de la parte principal del documento incorporan los datos del 2024. Sobre la parte final del documento abordo los ultimos dos puntos.
La diversidad de especies en el Golfo San Matias se describe
utilizando el indice Species Richness.
Los datos fueron tomados a lo largo de 6 campañas entre 2006 y 2022. La
campaña del 2022 fue diferente de las anteriores en algunos aspectos;
fue realizada en un buque de investigacion y los tiempos de arrastre
fueron estandarizados a 15 minutos, mientras que en campañas anteriores
los lances fueron de ~30 minutos (con algo de variabilidad.
Pregunta de investigación: En 2022 se reduce el tiempo de arrastre de 30 a 15 minutos, además se observan menos especies que en campañas anteriores. ¿Cambió la riqueza del GSM realmente o se debe a la reducción en esfuerzo de muestreo?
Esperamos una relación positiva entre el tiempo de arrastre y la riqueza (a mayor tiempo de arrastre, mayor riqueza de especies).
Además, considerando lo que ya se sabe del golfo, esperamos una relación positiva entre riqueza y longitud geográfica (del lance) y negativa entre riqueza y profundidad, así que incluí esas variables en los modelos.”
Este es una primera aproximacion al problema. Naturalmente, este es un proceso interactivo: todos los analisis pueden ser modificados.
Mapa del area de estudio
Bathymetry data from https://www.ncei.noaa.gov/maps/bathymetry/
DEM Global Mosaic 3 arc-seconds (90m)
Numero de lances por año
Year | N |
---|---|
2006 | 35 |
2007 | 35 |
2009 | 35 |
2016 | 35 |
2018 | 35 |
2022 | 35 |
2024 | 35 |
Numero de lances por año con datos de profundidad
Year | N |
---|---|
2006 | 35 |
2007 | 35 |
2009 | 35 |
2016 | 35 |
2018 | 35 |
2022 | 35 |
2024 | 35 |
Numero de lances por año con datos de area barrida
Year | N |
---|---|
2006 | 35 |
2007 | 35 |
2009 | 35 |
2016 | 35 |
2018 | 35 |
2022 | 35 |
2024 | 35 |
Numero de lances por año con datos de tiempo de arrastre
Year | N |
---|---|
2006 | 35 |
2007 | 35 |
2009 | 35 |
2016 | 35 |
2018 | 35 |
2022 | 35 |
2024 | 35 |
Registros continuos de profundidad.
Los registros de longitud indican que los lances fueron hechos en lugares discretos.
El tiempo de arrastre tiene una distribucion bimodal, con todos los
lances de 2022 durando 15 minutos, y el resto de los lances durando
alrededor de 30 minutos, con un poco de variabilidad.
El area barrida tambien tiene una distribucion bimodal, que corresponde
a los dos picos de tiempo de arrastre.
Entiendo que la mayor dispersion de los datos se debe a que el area
barrida es una resultado de: i) tiempo de arastre, ii) velocidad del
buque, iii) dimensiones de las redes utilizadas.
Notese que hay un lance en 2007 con vaor de area barrida muy baja
(<0.02), y un lance de 2018 con area barrida baja (<0.04). Hay
algun error en el calulo de area barrida?
La riqueza de especies incrementa durante los 3 primeros años, al parecer se mantiene hasta el cuarto survey (aunque hay varios años sin datos en el medio), y luego decae. Esta no-monoticidad descarta la posibilidad de modelar riqueza~f(año) como un modelo lineal generalizado con año como variable continua.
Tal como describio Josefina, hay una relacion negativa entre riqueza y profundidad. La relacion parece disminuir hasta alcanzar una asintota alrededor de riqueza = 12, pero con mucha variabilidad alrededor de la asintota.
Relacion positiva entre riqueza y longitud (correlacion negativa con profundidad).
No veo relacion clara entre riqueza y area barrida o tiempo de arrastre. Lo unico que veo es que en 2022 no se registraron riquezas mayores a 18. Sin embargo, solo hay 30 registros con riqueza mayor a 18 entre 2006 y 2018 (17% de los registros previos a 2022). Notese que el dato con riqueza=23 y area barrida < 0.04 corresponde a 2018
En charlas con Guille, él me expresó que están intersados en como la riqueza de especies puede ser descripta por:
Hay correlacion entre:
pearson r =
0.74).
Utilicé tiempo de arrastre como variable explicativa.pearson r =
-0.51). A pesar de
la correlación que existe, incluí las 2 variabls en los modelos. Guille
me explicó que la información que contienen estas 2 variables son
diferentes; longitud contiene información biogeográfica mientras que
profundidad contiene información a una escala más localizada. Esta
correlación debe ser tenida en cuenta al momento de interpretar los
resultados.pearson r =
-0.53): esto esta dado
porque en 2022 se muestreo de manera diferente. .pearson r =
-0.54):
Idem area barrida.Esta tabla muestra la multicolinearidad (Zuur, Ieno, and Elphick (2010)) entre las variables retenidas (excluyendo área barrida). Todas son < 2, por lo que podemos incluirlas sin inconvenientes en los modelos.
##
##
## Variance inflation factors
##
## GVIF
## Year 1.406066
## tiempo_arrastre2 1.413767
## Depth 1.345221
## long 1.354530
GVIF | |
---|---|
Year | 1.406066 |
tiempo_arrastre2 | 1.413767 |
Depth | 1.345222 |
long | 1.354530 |
Dada que las relaciones entre variables explicativas y riqueza no son monotónicas, utilicé Generalized Additive Models (GAM, Wood (2017)).
Ajusté 4 modelos, detallados más abajo, y los comparé utilizando
AIC.
En todos los modelos incluí el efecto de año de muestreo como intercepto
aleatorio, para capturar potenciales diferencias inter-anuales y para
contrastar el efcto del 2022 con el efecto de tiempo de arrastre
Modelos:
Solo efectos principales:
gam( riqueza ~ s(Depth, bs = "tp") + s(long, bs = "tp") + s(tiempo_arrastre2, bs = "tp") + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re"), method = "ML", data = mod.dat )
Interacción triple:
gam( riqueza ~ s(Depth) + s(long) + s(tiempo_arrastre2) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(Depth, long, tiempo_arrastre2) , method = "ML", data = mod.dat )
Interacción doble entre tiempo de arrastre y
longitud:
gam( riqueza ~ s(Depth) + s(tiempo_arrastre2) + s(long) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti( tiempo_arrastre2, long) , method = "ML", data = mod.dat )
Interacción doble entre tiempo de arrastre y
profundidad:
gam( riqueza ~ s(Depth) + s(long) + s(tiempo_arrastre2) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(tiempo_arrastre2, Depth) , method = "ML", data = mod.dat )
I calculated the individual contributions of each predictor of the
most parsimonious model towards explained deviance using the function
gam.hp
from the package gam.hp
(Lai et al. (2024)).
Esta tabla tiene:
EL modelo más parsimonioso es el modelo que incluye una interacción
entre longitud y tiempo de arrastre. Los otros 3 modelos tienen un
ajuste muy similar entre ellos.
A partir de aquí, interpretaré los resultados del modelo mas
parsimonioso.
model | df | LL | dev | rsq | deltaAIC | er |
---|---|---|---|---|---|---|
Main effects + double interaction (longitud, tiempo) | 16.10 | -606.99 | 2035.36 | 0.38 | 0.00 | 1.00 |
Main effects | 12.25 | -613.09 | 2139.23 | 0.36 | 4.50 | 9.48 |
Main effects + triple interaction | 13.42 | -612.27 | 2125.02 | 0.36 | 5.20 | 13.44 |
Main effects + double interaction (depth, tiempo) | 15.68 | -610.18 | 2088.96 | 0.37 | 5.52 | 15.83 |
Estos son los residuales del modelo mas parsimonioso
Estos son los efectos parciales del modelo más parsimonioso.
Es importante notar que cada gráfico tiene diferentes eje Y, es decir que hay variables que tienen efecto mucho mayor (x ej, profundidad).
Efecto de profundidad (pvalue: 0): exponencialmente negativa hasta alrededor de 120 m, y mas alla de esa profundidad el efefecto aumenta y luego baja.
Efecto de tiempo de arrastre (pvalue: 0.0005): mucho menor que el efecto de profundidad (ver la escala del eje Y). Es una relacion lineal positiva.
Efecto de longitud (pvalue: 0): efecto lineal, aumenta la riqueza a medida que uno se mueve de oeste a este.
Efecto de año (pvalue: 0.1481). Nótese que los valores de los parámetros tomaron valores más negativos en 2022, 2024, y 2006. :
year | Coefficient |
---|---|
2007 | 0.1608195 |
2016 | 0.1393747 |
2009 | -0.0230809 |
2018 | -0.0257508 |
2022 | -0.0560849 |
2024 | -0.0781976 |
2006 | -0.1451045 |
Efecto de interaccion entre longitud y tiempo de arrastre (pvalue: 0.0139): esta interacción es un poco complicada interpretarla a partir de este gráfico. Este efecto será mas claro en la próxima seccion.
Más allá de que el efecto de año no es estadísticamante significativo, lo mantuve porque desde el punto de vista teórico tiene sentido considerar que esta variable representa potenciales diferencias interanuales en el estado del ecosistema.
##
## Family: gaussian
## Link function: identity
##
## Formula:
## riqueza ~ s(Depth) + s(tiempo_arrastre2) + s(long) + s(Year_fac,
## k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(tiempo_arrastre2,
## long)
##
## Parametric coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 14.10 0.21 67.13 <0.0000000000000002 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Approximate significance of smooth terms:
## edf Ref.df F p-value
## s(Depth) 3.2270 4.027 7.686 0.000007647 ***
## s(tiempo_arrastre2) 1.0000 1.000 12.516 0.000487 ***
## s(long) 1.0000 1.000 27.879 0.000000398 ***
## s(Year_fac) 0.9043 6.000 0.245 0.148092
## ti(tiempo_arrastre2,long) 4.8083 6.429 2.720 0.013925 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## R-sq.(adj) = 0.383 Deviance explained = 41.1%
## -ML = 619.67 Scale est. = 8.7332 n = 245
Esta es una participación porcentual de la deviance explicada por el modelo
Dado que el modelo mas parsimonioso tiene 3 efectos principales (sin
considerar año): profundidad, longitud y tiempo de arrastre, eso define
que el modelo debe ser visualizado en 4 dimensiones.
Para hacer una aproximación, hice 2 graficos en 3D.
En ambos casos:
En el primer caso:
Aquí se ve claramente el efecto de profundidad, la riqueza decae a
medida que la profundidad aumenta.
El efecto de la interacción entre tiempo de arrastre y longitud se ve al
girar un poco el gráfico - se ve que los planos se cruzan alrededor de
-64.6. Con tiempos de arrastre más cortos, el efecto de longitud es
menos pronunciado que con tiempos de arrastre más largos. Al añadir los
datos de 2024, los planos de ajuste ahora están retorcidos - esto va a
ser más claro en el tercer gráfico en 3D.
En el segundo caso:
Aquí es notable por qué en los lances hechos mas al oeste (longitud
-64.8) el efecto del tiempo de arrastre es menor (hay varios datos con
baja riqueza que actuan como ancla).
También es claro que el efecto de tiempo de arrastre es positivo: con
tiempos de arrastre de 15 minutos la riqueza es baja, y aumenta con
tiempo de arraste de 30 minutos.