El periodo para la edición del resumen ha concluído
R-1325
ID:
Explorando los factores socioecológicos de la pérdida y degradación forestal en México: Un enfoque de Machine Learning
Iván Alejandro Ortiz-Rodríguez
Introducción: La cuantificación y predicción de la pérdida de cobertura forestal (CF), así como la identificación de los factores que influyen en este proceso, representan poderosas herramientas para la generación de estrategias efectivas de gestión y conservación. Sin embargo, comprender este fenómeno a gran escala no es sencillo. Por un lado, existen múltiples factores biofísicos, socioeconómicos y políticos que pueden interactuar e influir espacialmente en este fenómeno. Además, la modelación de estos datos suele presentar varios problemas para las técnicas tradicionales de modelación, incluyendo distribuciones de frecuencia inusuales, no linealidad, multicolinealidad, interacciones complejas y autocorrelación espacial. Recientemente, el marco del aprendizaje automático (ML) se ha propuesto como una herramienta flexible para analizar sistemas complejos, generando predicciones más precisas, modelando relaciones no lineales, y evitando la necesidad de establecer supuestos sobre las distribuciones de los datos o las interacciones entre los predictores. Métodos: Usando datos provenientes del sistema MAD-Mex sobre la CF del país y ca. 150 predictores biofísicos, sociales y económicos, cuantificamos la tasa de pérdida/degradación de la CF a nivel municipal durante el período 2010-2018 y generamos modelos predictivos. Para generar las predicciones, usamos tanto algoritmos de ML [bosque aleatorio (RF), bosque aleatorio con predictores espaciales (RFsp), y bosque aleatorio geográfico (GWRF)], como algoritmos paramétricos [regresión lineal múltiple (OLS) y regresión geográfica (GW-OLS)]. Resultados: Durante el periodo de análisis se produjo una pérdida/degradación de la CF a nivel de país de 53.691 km2, representando el 8.6% de la cobertura de área forestal presente en 2010. Entre todas las transiciones, la conversión a pastizales, tierras agrícolas y matorrales representaron los cambios más significativos (39%, 37% y 17%, respectivamente). Los modelos de ML, en particular el RFsp, mostraron sistemáticamente mejores ajustes que los modelos paramétricos, alcanzando un R2=0.8. Tanto factores biofísicos y socioeconómicos fueron identificados como los más importantes en la generación de predicciones para las transiciones a tierras agrícolas y pastizales; mientras que las transiciones a matorrales estuvieron dominadas por la influencia de predictores biofísicos. Conclusiones: El análisis del fenómeno de la pérdida de CF a escala municipal representa una escala factible para la integración de diversas fuentes de información. Con este estudio se identificaron las áreas objetivo en las que se debe prestar más atención para mitigar la pérdida de bosques y sus servicios asociados. Nuestros resultados muestran el potencial de ML para el análisis de datos socioecológicos proveyendo predicciones con mayor precisión y sin sesgo geográfico/espacial.
Palabras clave:
deforestación, machine learning, random forest, factores socioecológicos, ciencia de datos