Este es un proyecto liderado por la Licenciada Josefina Cuesta Nuñez (CIMAS-CONICET) y dirigido por los Dres. Alejandra Romero, Guillermo Svendsen y Matías Ocampo Reinaldo (CIMAS-CONICET).
Guillermo me contacto para ayudar con el analisis de estos datos

Los analisis se encuentran en este repositorio.

El repositorio no contiene los datos ni el borrador del manuscrito.
Para poder replicar los analisis hay que copiar el archivo datos_completos.rds (que me envio Josefina) en la carpeta data.

1 Updates May 2025

A mediados de mayo 2025, mantuvimos una reunion Josefina, Alejandra, Guillermo, Matias y yo.
Luego de la reunion con el grupo de trabajo se decidio hacer estas actualizaciones:

  1. Incluir datos de 2024. Estos tienen tiempos de arrastre entre 15 y 25 minutos. Estos datos pueden ayudar a separar el efecto de año del efecto de tiempo de arrastre

2 . cambiar la estructura del efecto de año. En este momento la estamos usando como una variable aleatorio (random intercept). La cambiaremos a una variable fija (continua, smooth effect).

  1. Incluir el efecto de la variable “lance”: este es un identificador del lance. Es un identificador del lugar donde se realizo el lance. Lo incluiremos para tener en cuenta la correlacion espcaial (efecto aleatorio).

Los resultados de la parte principal del documento incorporan los datos del 2024. Sobre la parte final del documento abordo los ultimos dos puntos.

2 Preguntas

La diversidad de especies en el Golfo San Matias se describe utilizando el indice Species Richness.
Los datos fueron tomados a lo largo de 6 campañas entre 2006 y 2022. La campaña del 2022 fue diferente de las anteriores en algunos aspectos; fue realizada en un buque de investigacion y los tiempos de arrastre fueron estandarizados a 15 minutos, mientras que en campañas anteriores los lances fueron de ~30 minutos (con algo de variabilidad.

Pregunta de investigación: En 2022 se reduce el tiempo de arrastre de 30 a 15 minutos, además se observan menos especies que en campañas anteriores. ¿Cambió la riqueza del GSM realmente o se debe a la reducción en esfuerzo de muestreo?

Esperamos una relación positiva entre el tiempo de arrastre y la riqueza (a mayor tiempo de arrastre, mayor riqueza de especies).

Además, considerando lo que ya se sabe del golfo, esperamos una relación positiva entre riqueza y longitud geográfica (del lance) y negativa entre riqueza y profundidad, así que incluí esas variables en los modelos.”

Este es una primera aproximacion al problema. Naturalmente, este es un proceso interactivo: todos los analisis pueden ser modificados.

3 Area de estudio

Mapa del area de estudio

Bathymetry data from https://www.ncei.noaa.gov/maps/bathymetry/
DEM Global Mosaic 3 arc-seconds (90m)

4 Datos

Numero de lances por año

Year N
2006 35
2007 35
2009 35
2016 35
2018 35
2022 35
2024 35

Numero de lances por año con datos de profundidad

Year N
2006 35
2007 35
2009 35
2016 35
2018 35
2022 35
2024 35

Numero de lances por año con datos de area barrida

Year N
2006 35
2007 35
2009 35
2016 35
2018 35
2022 35
2024 35

Numero de lances por año con datos de tiempo de arrastre

Year N
2006 35
2007 35
2009 35
2016 35
2018 35
2022 35
2024 35

4.1 Distribucion de frecuencia de los datos

Registros continuos de profundidad.

Los registros de longitud indican que los lances fueron hechos en lugares discretos.

El tiempo de arrastre tiene una distribucion bimodal, con todos los lances de 2022 durando 15 minutos, y el resto de los lances durando alrededor de 30 minutos, con un poco de variabilidad.
El area barrida tambien tiene una distribucion bimodal, que corresponde a los dos picos de tiempo de arrastre.
Entiendo que la mayor dispersion de los datos se debe a que el area barrida es una resultado de: i) tiempo de arastre, ii) velocidad del buque, iii) dimensiones de las redes utilizadas.
Notese que hay un lance en 2007 con vaor de area barrida muy baja (<0.02), y un lance de 2018 con area barrida baja (<0.04). Hay algun error en el calulo de area barrida?

4.2 Riqueza como funcion de variables explicativas

La riqueza de especies incrementa durante los 3 primeros años, al parecer se mantiene hasta el cuarto survey (aunque hay varios años sin datos en el medio), y luego decae. Esta no-monoticidad descarta la posibilidad de modelar riqueza~f(año) como un modelo lineal generalizado con año como variable continua.

Tal como describio Josefina, hay una relacion negativa entre riqueza y profundidad. La relacion parece disminuir hasta alcanzar una asintota alrededor de riqueza = 12, pero con mucha variabilidad alrededor de la asintota.

Relacion positiva entre riqueza y longitud (correlacion negativa con profundidad).

No veo relacion clara entre riqueza y area barrida o tiempo de arrastre. Lo unico que veo es que en 2022 no se registraron riquezas mayores a 18. Sin embargo, solo hay 30 registros con riqueza mayor a 18 entre 2006 y 2018 (17% de los registros previos a 2022). Notese que el dato con riqueza=23 y area barrida < 0.04 corresponde a 2018

4.3 Variables explicativas de interés

En charlas con Guille, él me expresó que están intersados en como la riqueza de especies puede ser descripta por:

  • Profundidad: se conoce que existe una relación clara entre profundidad y riqueza (Svendsen et al. (2020))
  • Longitud: “bay effect” (Svendsen et al. (2020))
  • Tiempo de arrastre: queremos dilucidar si la aparente reduccion de riqueza de especies registrada en 2022 se puede explicar por el menor tiempo de arrastre
  • Interacciones entre las variables anteriores, sobre todo con tiempo de arrastre
  • Año: queremos ver si podemos diferenciar el efecto de tiempo de arrastre

4.4 Correlaciones entre variables explicativas

Hay correlacion entre:

  • Area barrida y tiempo de arrastre (pearson r = 0.74). Utilicé tiempo de arrastre como variable explicativa.
  • Profundidad y longitud (pearson r = -0.51). A pesar de la correlación que existe, incluí las 2 variabls en los modelos. Guille me explicó que la información que contienen estas 2 variables son diferentes; longitud contiene información biogeográfica mientras que profundidad contiene información a una escala más localizada. Esta correlación debe ser tenida en cuenta al momento de interpretar los resultados.
  • Año y area barrida (pearson r = -0.53): esto esta dado porque en 2022 se muestreo de manera diferente. .
  • Año y tiempo de arrastre (pearson r = -0.54): Idem area barrida.

Esta tabla muestra la multicolinearidad (Zuur, Ieno, and Elphick (2010)) entre las variables retenidas (excluyendo área barrida). Todas son < 2, por lo que podemos incluirlas sin inconvenientes en los modelos.

## 
## 
## Variance inflation factors
## 
##                      GVIF
## Year             1.406066
## tiempo_arrastre2 1.413767
## Depth            1.345221
## long             1.354530
GVIF
Year 1.406066
tiempo_arrastre2 1.413767
Depth 1.345222
long 1.354530

5 Metodos

Dada que las relaciones entre variables explicativas y riqueza no son monotónicas, utilicé Generalized Additive Models (GAM, Wood (2017)).

Ajusté 4 modelos, detallados más abajo, y los comparé utilizando AIC.
En todos los modelos incluí el efecto de año de muestreo como intercepto aleatorio, para capturar potenciales diferencias inter-anuales y para contrastar el efcto del 2022 con el efecto de tiempo de arrastre

Modelos:

  • Solo efectos principales:
    gam( riqueza ~ s(Depth, bs = "tp") + s(long, bs = "tp") + s(tiempo_arrastre2, bs = "tp") + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re"), method = "ML", data = mod.dat )

  • Interacción triple:
    gam( riqueza ~ s(Depth) + s(long) + s(tiempo_arrastre2) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(Depth, long, tiempo_arrastre2) , method = "ML", data = mod.dat )

  • Interacción doble entre tiempo de arrastre y longitud:
    gam( riqueza ~ s(Depth) + s(tiempo_arrastre2) + s(long) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti( tiempo_arrastre2, long) , method = "ML", data = mod.dat )

  • Interacción doble entre tiempo de arrastre y profundidad:
    gam( riqueza ~ s(Depth) + s(long) + s(tiempo_arrastre2) + s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(tiempo_arrastre2, Depth) , method = "ML", data = mod.dat )

I calculated the individual contributions of each predictor of the most parsimonious model towards explained deviance using the function gam.hp from the package gam.hp (Lai et al. (2024)).

6 Resultados

6.1 Model selection

Esta tabla tiene:

  • Modelo: estos son los modelos descriptos mas arriba
  • df: effective degrees of freedom. Estos son los numeros de parametros incluidos en el calculo de AIC
  • LL: logLikelihood, medida de ajuste. Modelos con mayor LL ajustan mejor
  • dev: deviance, medida de ajuste. Modelos con menor deviance ajustan mejor
  • rsq: r-squared
  • deltaAIC: \(\Delta{AIC}\)
  • er: Evidence ratio. “Evidence ratios also have a raffle ticket interpretation in qualifying the strength of evidence. For example, assume two models, A and B with the evidence ratio = L(gA|data)/L(gB|data) = 39. I might judge this evidence to be at least moderate, if not strong, support of model A. This is analogous to model A having 39 tickets while model B has only a single ticket” (Anderson (2008)).

EL modelo más parsimonioso es el modelo que incluye una interacción entre longitud y tiempo de arrastre. Los otros 3 modelos tienen un ajuste muy similar entre ellos.
A partir de aquí, interpretaré los resultados del modelo mas parsimonioso.

model df LL dev rsq deltaAIC er
Main effects + double interaction (longitud, tiempo) 16.10 -606.99 2035.36 0.38 0.00 1.00
Main effects 12.25 -613.09 2139.23 0.36 4.50 9.48
Main effects + triple interaction 13.42 -612.27 2125.02 0.36 5.20 13.44
Main effects + double interaction (depth, tiempo) 15.68 -610.18 2088.96 0.37 5.52 15.83

6.2 Best Model

6.2.1 Model residuals

Estos son los residuales del modelo mas parsimonioso

6.2.2 Efectos parciales de variables explicativas

Estos son los efectos parciales del modelo más parsimonioso.

Es importante notar que cada gráfico tiene diferentes eje Y, es decir que hay variables que tienen efecto mucho mayor (x ej, profundidad).

Efecto de profundidad (pvalue: 0): exponencialmente negativa hasta alrededor de 120 m, y mas alla de esa profundidad el efefecto aumenta y luego baja.

Efecto de tiempo de arrastre (pvalue: 0.0005): mucho menor que el efecto de profundidad (ver la escala del eje Y). Es una relacion lineal positiva.

Efecto de longitud (pvalue: 0): efecto lineal, aumenta la riqueza a medida que uno se mueve de oeste a este.

Efecto de año (pvalue: 0.1481). Nótese que los valores de los parámetros tomaron valores más negativos en 2022, 2024, y 2006. :

year Coefficient
2007 0.1608195
2016 0.1393747
2009 -0.0230809
2018 -0.0257508
2022 -0.0560849
2024 -0.0781976
2006 -0.1451045

Efecto de interaccion entre longitud y tiempo de arrastre (pvalue: 0.0139): esta interacción es un poco complicada interpretarla a partir de este gráfico. Este efecto será mas claro en la próxima seccion.

Más allá de que el efecto de año no es estadísticamante significativo, lo mantuve porque desde el punto de vista teórico tiene sentido considerar que esta variable representa potenciales diferencias interanuales en el estado del ecosistema.

## 
## Family: gaussian 
## Link function: identity 
## 
## Formula:
## riqueza ~ s(Depth) + s(tiempo_arrastre2) + s(long) + s(Year_fac, 
##     k = length(levels(mod.dat$Year_fac)), bs = "re") + ti(tiempo_arrastre2, 
##     long)
## 
## Parametric coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept)    14.10       0.21   67.13 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Approximate significance of smooth terms:
##                              edf Ref.df      F     p-value    
## s(Depth)                  3.2270  4.027  7.686 0.000007647 ***
## s(tiempo_arrastre2)       1.0000  1.000 12.516    0.000487 ***
## s(long)                   1.0000  1.000 27.879 0.000000398 ***
## s(Year_fac)               0.9043  6.000  0.245    0.148092    
## ti(tiempo_arrastre2,long) 4.8083  6.429  2.720    0.013925 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## R-sq.(adj) =  0.383   Deviance explained = 41.1%
## -ML = 619.67  Scale est. = 8.7332    n = 245

6.2.3 Particion de deviance explicada por el mejor modelo

Esta es una participación porcentual de la deviance explicada por el modelo

  • Profundidad: 41.27% 
  • Longitud: 35.84% 
  • Año: 8.79%
  • Tiempo de arrastre: 6.92%
  • Interacción: 7.18%

6.2.4 Model fit

Dado que el modelo mas parsimonioso tiene 3 efectos principales (sin considerar año): profundidad, longitud y tiempo de arrastre, eso define que el modelo debe ser visualizado en 4 dimensiones.
Para hacer una aproximación, hice 2 graficos en 3D.
En ambos casos:

  • Eje Z: Riqueza de especies
  • Eje Y: Profundidad

En el primer caso:

  • Eje X: longitud
  • 3 superficies: valores de tiempo de arrastre de 15, 20, 30, y 40 minutos
  • los datos están codificados con respecto a tiempo de arrastre (ver escala)

Aquí se ve claramente el efecto de profundidad, la riqueza decae a medida que la profundidad aumenta.
El efecto de la interacción entre tiempo de arrastre y longitud se ve al girar un poco el gráfico - se ve que los planos se cruzan alrededor de -64.6. Con tiempos de arrastre más cortos, el efecto de longitud es menos pronunciado que con tiempos de arrastre más largos. Al añadir los datos de 2024, los planos de ajuste ahora están retorcidos - esto va a ser más claro en el tercer gráfico en 3D.

En el segundo caso:

  • Eje X: tiempo de arrastre
  • 3 superficies: valores de longitud -64, -64.4, y -64.8
  • los datos están codificados con respecto a longitud (ver escala)

Aquí es notable por qué en los lances hechos mas al oeste (longitud -64.8) el efecto del tiempo de arrastre es menor (hay varios datos con baja riqueza que actuan como ancla).
También es claro que el efecto de tiempo de arrastre es positivo: con tiempos de arrastre de 15 minutos la riqueza es baja, y aumenta con tiempo de arraste de 30 minutos.

En el tercer caso:

  • Eje X: tiempo de arrastre
  • Eje Y: longitud
  • 3 superficies: valores de profundidad 60m, 80m, y 170m
  • los datos están codificados con respecto a profundidad (ver escala)

Aquí los planos son paralelos ya que la variable que esta representada por las multiples superficies (profundidad) no esta incluida en la interacción del modelo. La interacción entre longitud y tiempo de arratre se ve como los planos están retorcidos.

7 Conclusiones

  • Parece haber algo sospechoso con algunos de los registros de area barrida. Quizas seria bueno repasar que los calculos esten bien hechos.  

  • La variable que explica la mayor cantidad de variabilidad es Profundidad. 

  • El haber cambiado de metodologia tuvo un efecto negativo sobre la riqueza de especies observada (la riqueza observada en 2022 fue menor). Este efecto se ve en los efectos parciales de tiempo de arraste. Dado que 2022 fue el único año en que se usó esta nueva metodología, no es posible distinguir si este efecto es porque la riqueza fue de hecho menor (en el ecosistema) en 2022, o las diferencias estan dadas por las diferencias en el muestreo. Asumo que el tiempo de arrastre no fue la única diferencia en el muestreo. Probablemente otras diferencias sean en el arte de pesca utilizada, dimensiones, velocidad de arrastre, etc.

  • Este ejercicio no puede determinar si la menor riqueza registrada en 2022 es debido a:

  • menor riqueza en el ecosistema, ó

  • haber cambiado la metodología de muestreo

esta diferenciación quizas se pueda hacer en el futuro si se continua muestreando con la misma metodologia que en 2022. Mientras tanto, se debera recurrir a lineas alternativas de evidencia, por ejemplo la curva de acumulacion de especies que produjo Josefina.

7.1 Conclusiones de haber incorporado 2024

  • Parece haber algo sospechoso con algunos de los registros de area barrida. Quizas seria bueno repasar que los calculos esten bien hechos. – Update: algunos de estos valores que parecen erróneos fueron corregidos, pero persisten algunos valores extraños.  

  • La forma del efecto parcial del tiempo de arrastre cambió y ahora se estimó que el efecto es lineal positivo, mientras en la interacción anterior el efecto llegaba a una asíntota.

  • El efecto de la interacción entre longitud y tiempo de arrastre queda mejor definido, dado que hay mayor variabilidad en los tiempos de arrastre. El efecto es ligeramente mas intenso que lo que se habia estimado previamente.

  • La riqueza promedio registrada en 2024 fue mayor que en 2022, pero aún así fue la segunda menor riqueza registrada.
    Ha decaído la riqueza en el Golfo San Matías en los últimos años? Es posible, pero me parece que este análisis no provee una respuesta definitiva. Creo que valdría la pena rehacer la curva de acumulacion de especies incluyendo los datos de 2024. Existen otras evidencias?

Year riqueza_promedio
2006 13.6
2007 15.2
2009 14.3
2016 15.2
2018 14.4
2022 12.3
2024 13.2

8 Updates May 2025

El mayor inconveniente con los dos puntos siguientes (1. usar año como variable continua, 2. incluir Lance ID como variable aleatoria), es quela vlidez de comparar modelos con diferente estructura de variables aleatorias no ha sido establecida, e.g. https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#can-i-use-aic-for-mixed-models-how-do-i-count-the-number-of-degrees-of-freedom-for-a-random-effect

Siempre, y en este caso en particular, corresponde establecer la estructura de variabls alaetorias basado en criterios ecológicos.

En lo que sigue, repetí el ejercicio de ajustar todos los modelos, y hacer selección de modelos para analizar si los resulados son consistentes, independientemente de la estructura de los efectos aleatorios. Luego, comparo los ajustes de los modelos con las distintas estructuras – esta parte debe ser tomada con precaución.

8.1 Año como variable continua

Criterio ecológico: dado que año es un proxy de procesos que ocurren en el ecosistema, pero que no son considerados en la estructura del modelo

  • Año como variable continua: esto asume que estos procesos ecosistemicos toman una forma continua y “smooth” a lo largo del tiempo.
  • Año como variable aleatoria: esto asume que estos procesos ecosistemicos son aleatorias y que pueden variar entre años sin necesariamente seguir un patrón, i.e. puede ser positivo en año t y negativo en año t+1.

A mi me resulta mas razonable asumir que el año como variable aleatoria.

8.1.1 Model selection

El mejor modelo es consistentemente el que incluye la interaccion entre longitud y tiempo de arrastre.

model df LL dev rsq deltaAIC er
Main effects + double interaction (longitud, tiempo) 17.69 -605.88 2017.02 0.38 0.00 1.00
Main effects 11.89 -612.93 2136.41 0.36 2.48 3.46
Main effects + triple interaction 12.98 -612.92 2136.34 0.36 4.64 10.19
Main effects + double interaction (depth, tiempo) 15.86 -610.24 2089.95 0.37 5.04 12.44

8.1.2 Efectos parciales de variables explicativas

Aquí es notable que el efecto de año toma una forma “dome-shaped”, pero la magnitud del efecto parcial es bajo - tal es así que los intervalos de confianza solapan cero en todos los años.
También es notable que cambia la forma de los efectos parciales de tiempo de arrastre (de una función lineal a una asintótica)

8.1.3 Comparacion de funciones smooth

Aquí se comparan los efectos parciales (funciones smooth, se excluyen las variables aleatorias) de:

  • m.3: modelo con año como variable aleatoria (el descripto en la parte principal del documento)
  • m.3.y: año como variable continua

8.1.4 Comparacion de ajustes

Aquí comparo los ajustes de los modelos con diferente estructura de efectos aleatorios – analizar con precaución. Tres modelos

Los 3 modelos tienen ajuste similar (LL y dev), pero dados la cantidad de parámetros que se necesitan para alcanzar el ajuste (df), el modelo mas parsimonioso es el modelo que excluye año, seguido muy de cerca del modelo con año como variable aleatoria (deltaAIC y er).
Dados estos resultados y el razonamiento ecológico presentado más arriba, creo que el modelo con año como variable aleatoria es el modelo más adecuado.

model df LL dev rsq deltaAIC er
Excluir ano del modelo 14.44 -608.42 2059.20 0.38 0.00 1.00
Ano como variable aleatoria 16.10 -606.99 2035.36 0.38 0.48 1.27
Ano como variable continua 17.69 -605.88 2017.02 0.38 1.44 2.06

8.2 Incluir Lance ID

8.2.1 Model selection

El mejor modelo es consistentemente el que incluye la interaccion entre longitud y tiempo de arrastre.

model df LL dev rsq deltaAIC er
Main effects + double interaction (longitud, tiempo) 27.91 -598.90 1905.24 0.41 0.00 1.00
Main effects 20.92 -607.53 2044.38 0.38 3.29 5.18
Main effects + double interaction (depth, tiempo) 24.94 -604.20 1989.55 0.38 4.67 10.34
Main effects + triple interaction 24.12 -605.19 2005.55 0.38 4.99 12.13

8.2.2 Efectos parciales de variables explicativas

8.2.3 Comparacion de funciones smooth

Las funciones smooth son idénticas

8.2.4 Comparacion de ajustes

El ajuste del modelo incluyendo Lance ID es mejor (LL y dev), pero la cantidad de parámetros necesarios para incluir este efecto es tan grande que el modelo más parsimonioso resulta ser el modelo con el que veníamos trabajando.

Esto quizás formula la pregunta de si será mejor incuir el efcto de latitud como una variable smooth.

model df LL dev rsq deltaAIC er
Ano como variable aleatoria 16.10 -606.99 2035.36 0.38 0.00 1.00
Incluir Lance ID 27.91 -598.90 1905.24 0.41 7.43 40.97

8.2.5 Incluir latitud

8.2.5.1 Resumen del modelo

El efecto de latitud no es significativo (pvalue = 0.84)

## 
## Family: gaussian 
## Link function: identity 
## 
## Formula:
## riqueza ~ s(Depth) + s(tiempo_arrastre2) + s(long) + s(lat) + 
##     s(Year_fac, k = length(levels(mod.dat$Year_fac)), bs = "re") + 
##     ti(tiempo_arrastre2, long)
## 
## Parametric coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## (Intercept)  14.1004     0.2103   67.05 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Approximate significance of smooth terms:
##                              edf Ref.df      F    p-value    
## s(Depth)                  3.2347  4.040  6.902 0.00002815 ***
## s(tiempo_arrastre2)       1.0000  1.000 12.450   0.000504 ***
## s(long)                   1.0000  1.000 25.464 0.00000108 ***
## s(lat)                    1.0000  1.000  0.041   0.839033    
## s(Year_fac)               0.8981  6.000  0.242   0.150384    
## ti(tiempo_arrastre2,long) 4.8024  6.422  2.716   0.014069 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## R-sq.(adj) =  0.381   Deviance explained = 41.1%
## -ML = 619.65  Scale est. = 8.7641    n = 245

8.2.5.2 Efectos parciales de variables explicativas

El efecto de latitud es lineal, ligeramente negativa, pero es casi nulo; los intervalos de confianza solapan cero en todas las latitudes.

Concluyo que si bien incluir Lance ID como variable aleatoria sería justificable desde el razonamiento ecológico, es mas parsimonioso no incluirlo.
Incluir latitud en lugar de Lance ID no mejora el ajuste del modelo.

Referencias

Anderson, David R. 2008. Model Based Inference in the Life Sciences: A Primer on Evidence. New York: Springer. https://doi.org/10.1007/978-0-387-74075-1.
Lai, Jiangshan, Jing Tang, Tingyuan Li, Aiying Zhang, and Lingfeng Mao. 2024. “Evaluating the Relative Importance of Predictors in Generalized Additive Models Using the Gam.hp r Package.” Plant Diversity 46 (4): 542–46. https://doi.org/https://doi.org/10.1016/j.pld.2024.06.002.
Svendsen, Guillermo M., Matías Ocampo Reinaldo, María Alejandra Romero, Gabriela Williams, Anne Magurran, Sandra Luque, and Raúl A. González. 2020. “Drivers of Diversity Gradients of a Highly Mobile Marine Assemblage in a Mesoscale Seascape.” Marine Ecology Progress Series 638: 149–64. https://doi.org/10.3354/meps13264.
Wood, S. N. 2017. Generalized Additive Models: An Introduction with r. 2nd ed. Chapman; Hall/CRC.
Zuur, Alain F., Elena N. Ieno, and Chris S. Elphick. 2010. “A Protocol for Data Exploration to Avoid Common Statistical Problems.” Methods in Ecology and Evolution 1 (1): 3–14. https://doi.org/https://doi.org/10.1111/j.2041-210X.2009.00001.x.