Queridos amigos que estudian ecología, me gustaría hacer una pregunta: ¿Qué modelo de distribución de especies se utiliza generalmente cuando se estudia la distribución de especies a pequeña escala?
La base teórica del modelo de distribución de especies es el concepto de nicho ecológico. El nicho ecológico se define como la posición que ocupa una población en un ecosistema en el tiempo y el espacio y su relación y papel con otras poblaciones.
El desarrollo de modelos de distribución de especies comenzó con el desarrollo y aplicación del modelo BIOCLIM. En las siguientes dos décadas, HÁBITAT, DOMINIO, Análisis Factorial de Nicho Ecológico (ENFA) y Distancia de Ma Mahalanobis (MD), Función de borde (BF), Entropía máxima (Maxent), Modelo lineal generalizado (GLM), Modelo aditivo generalizado (GAM), modelo de árbol de clasificación y regresión (Árbol de clasificación y regresión, CART), modelo de árbol de regresión impulsado (Árbol de regresión impulsado, BRT ), splines de regresión adaptativa multivariada (Multivariate Adaptive Regression Splines, MARS), etc. basados en estadísticas y conjuntos de reglas basados en inteligencia artificial como el Algoritmo Genético para la Predicción de Conjuntos de Reglas (GARP) y la Red Neural Artificial (ANN).
El modelo BIOCLIM define el nicho ecológico como un hipervolumen que contiene muestras de todas las especies estudiadas en el espacio variable ambiental. Según esta definición, el hipervolumen es un hiperrectángulo acotado por los valores extremos (valores máximos y mínimos) de cada variable ambiental. El rango de variables acotado por el hiperrectángulo se considera adecuado para la distribución de especies. El error de esta definición es que también se considera que las condiciones ambientales extremas pueden mantener la estabilidad de la población, lo cual no es razonable porque en condiciones ambientales extremas, aunque la especie puede sobrevivir, no puede mantener la continuación de la población. Por lo tanto, para reducir el impacto de los valores extremos en el rendimiento del modelo y mejorar la capacidad de predicción del modelo, generalmente antes de definir los límites del hiperrectángulo multidimensional, se ordenan los valores de las variables en todas las muestras. y un cierto número de muestras de valores extremos (como el 5 más alto) y promediar los valores extremos de estas variables ambientales para obtener los límites del hiperrectángulo, estimando así el área de distribución potencial de la especie.
El modelo HABITAT define el nicho ecológico como la cáscara convexa de las especies en el espacio de variables ambientales. A diferencia del modelo BIOCLIM, el modelo HABITAT ya no considera los valores extremos de las variables ambientales como el límite de. el nicho ecológico en el espacio de variables ambientales, es decir, el límite ya no es rígido, sino que se utiliza una vecindad de las variables ambientales correspondientes a la muestra misma como condición ambiental para una distribución adecuada de las especies, excluyendo así algunas condiciones ambientales extremas. Desafortunadamente, la caracterización de fronteras mediante el modelo HABITAT todavía depende de muestras periféricas.
El modelo DOMAIN basado en el algoritmo de distancia de Gower utiliza una matriz de similitud punto-punto para calcular la idoneidad de las variables ambientales en el punto objetivo. La idoneidad representa el espacio de variables ambientales (en lugar del espacio de distribución real). El grado de similitud entre el punto objetivo y el punto de muestra de distribución más cercano. Al determinar el hábitat o el rango de distribución de una especie, primero es necesario determinar un umbral para excluir áreas de distribución inadecuadas. En comparación con el método BIOCLIM anterior, el hiperrectángulo ambiental determinado por el modelo DOMINIO en el espacio de variables ambientales no es necesariamente continuo.
El modelo de análisis factorial de nicho ecológico (ENFA) mide la idoneidad del punto objetivo calculando la marginalidad y la desviación ambiental. En el caso unidimensional, la marginalidad se expresa como la diferencia entre el valor medio de la variable ambiental correspondiente al punto de muestra de distribución (media muestral) y el valor medio de la variable ambiental correspondiente a todos los puntos del área de estudio (media global ) en el rango de valores de la variable ambiental. La diferencia del sesgo ambiental es en realidad la diferencia entre la varianza de la muestra y la varianza global de la variable ambiental. En el caso multidimensional, la marginalidad y el sesgo ambiental se expresan en forma de vectores multidimensionales.
Después de determinar la marginalidad y la desviación ambiental, se aplica el umbral para filtrar las condiciones ambientales y se puede obtener el rango adecuado de especies en el espacio de variables ambientales mapeándolo al área de estudio real, el área de distribución. Se pueden obtener especies.
El modelo BF utiliza funciones de frontera para definir los límites de las especies en el espacio de variables ambientales. Tomando como ejemplo el espacio de variables ambientales bidimensionales (V1 y V2), el método de determinación de la función de frontera se divide en los siguientes pasos: Primero, recopile muestras de distribución de especies y las variables ambientales relacionadas V1 y V2, y haga un diagrama de dispersión. en segundo lugar, una de las variables (como V1) se divide en segmentos y se toma la mediana (o media) de cada segmento. Se ordena el V2 correspondiente al valor V1 de cada segmento y se toma una determinada proporción (como 5). %) de valores extremos y se cuentan los valores extremos. Según el análisis correspondiente, finalmente se puede obtener el límite de la especie en todo el espacio de variables ambientales, mapeando los límites obtenidos a; de las variables ambientales del área de estudio se puede estimar el área de distribución potencial de la especie. Este método representa con mayor precisión el nicho ecológico en el espacio de variables ambientales, pero su desventaja es que el cálculo y el procesamiento relacionados son más engorrosos.
El modelo CART genera un árbol binario mediante segmentación recursiva binaria. En cada nodo posible, se juzga en función del valor de la variable y divide todos los valores de la variable en dos subcategorías. Cada división se basa en un solo valor de variable. Durante este proceso, algunos valores de variable se pueden usar varias veces, mientras que otros valores de variable no se pueden usar. Después de cada división, se garantiza que los valores de las variables contenidos en las dos subcategorías estén "maximizados diferencialmente". Los valores variables de las dos subcategorías continúan dividiéndose según ciertos criterios hasta que se logra el propósito de la clasificación. En la simulación de la distribución potencial de especies, los valores extremos de cada variable en la muestra de distribución de especies generalmente se utilizan como nodos para la segmentación.
El modelo GARP utiliza datos de distribución de especies y datos ambientales para generar un conjunto de reglas diferentes, determina las necesidades ecológicas de las especies y luego predice el área de distribución potencial de las especies. El modelo GARP es un proceso de iteraciones repetidas para encontrar reglas de distribución óptimas de especies. En el modelo, el algoritmo genético en sí no puede describir la relación entre la distribución biológica y los factores ambientales. Lo que se utiliza para describir esta relación es "Regla como rango". reglas, reglas atómicas, reglas Logit, etc., la función de los algoritmos genéticos es encontrar los parámetros máximos para estas reglas. El modelo GARP tiene las siguientes ventajas: en primer lugar, puede buscar en el espacio de múltiples variables de forma rápida y eficaz; en segundo lugar, el algoritmo genético es un método no paramétrico, que no tiene requisitos estrictos sobre la forma de distribución estadística de la población a la que pertenecen las variables; En tercer lugar, el modelo GARP integra múltiples tipos de reglas y la complementariedad entre varios tipos de reglas mejora las capacidades de simulación de GARP.
2 Rendimiento de cada modelo de distribución de especies
Aplicando el modelo de distribución de especies mencionado en este artículo, Elith et al analizaron 226 especies distribuidas en 6 regiones diferentes alrededor del mundo (la zona húmeda australiana. especies de aves y plantas de la región ecuatorial, aves de Ontario, Canadá, especies de plantas de Nueva Gales del Sur, Australia, especies de mamíferos y reptiles, especies de plantas de Nueva Zelanda, especies de plantas de 5 países de América del Sur y especies de plantas de Suiza) espacio La distribución Se simuló y estudió, y los resultados se evaluaron en función de los datos de muestra medidos. La conclusión relevante fue que el modelo Maxent tiene un mejor rendimiento. Desde su desarrollo en 2006, el modelo ha sido reportado más de 2000 veces para investigaciones sobre planificación de reservas de especies, predicción de distribución potencial de especies invasoras y respuestas de distribución espacial de especies al cambio climático, lo que también ilustra la relevancia desde otro aspecto. reconocimiento de este modelo en el campo de la investigación. El rendimiento del modelo GLM, modelo GAM y modelo GARP está por detrás del modelo Maxent, pero mejor que el modelo DOMAIN y el modelo BIOCLIM. Tsor et al. seleccionaron 42 especies de serpientes, aves y murciélagos distribuidos en Israel para realizar investigaciones de distribución espacial y evaluación del desempeño de modelos relacionados. También concluyeron que el desempeño del modelo BIOCLIM era deficiente. Los resultados de la evaluación del desempeño de otros modelos son diferentes de los resultados de Elith et al .: el desempeño del modelo GARP y el modelo MD son excelentes, seguidos por el desempeño del modelo HABITAT, el modelo DOMAIN y el modelo ENFA.
Los últimos resultados sobre la evaluación del desempeño de los modelos de distribución de especies muestran que el uso de diferentes métodos de evaluación del desempeño para evaluar el desempeño del modelo conducirá a resultados diferentes, además, si se simula la distribución espacial de especies con un área de distribución adecuada pequeña, entonces; las diferencias entre los modelos son mayores. Por el contrario, si la distribución de las especies estudiadas es más amplia, el desempeño de cada modelo mostrará mayor consistencia.