El aprendizaje automático abre nuevos conocimientos sobre las propiedades de las hojas y el clima
Un estudio innovador que utiliza inteligencia artificial (IA) ha revelado un enfoque novedoso para estudiar la relación entre el tamaño de la hoja y el clima en diferentes especies de plantas. El estudio realizado por Wilde y colegas y publicado en Revista americana de botánicautiliza el aprendizaje automático para analizar grandes cantidades de datos de colecciones de herbario digitalizadas. Este método innovador podría proporcionar información sin precedentes sobre cómo las plantas se adaptan a su entorno.
Las colecciones de herbario son bibliotecas de especímenes de plantas conservadas, que a menudo se remontan a siglos atrás. Son un tesoro de información biológica, pero su tamaño y complejidad tradicionalmente han dificultado su análisis. El aprendizaje automático, una rama de la IA, podría automatizar el proceso de medición, aumentando drásticamente los datos disponibles para la investigación.
El equipo de investigación utilizó un tipo de IA llamado redes neuronales convolucionales (CNN) que es particularmente bueno para analizar imágenes. Entrenaron a estas CNN para identificar y medir hojas en imágenes de especímenes de plantas de dos géneros: sicigioun grupo de plantas con flores de la familia de los mirtos, y ficusmejor conocido como higos.

“En este estudio, queríamos encontrar y contar los píxeles en las hojas, como medida de área, ancho y largo. Comenzamos con hojas simples con bordes suaves como prueba de concepto, pero nos gustaría expandir esto a formas de hojas más complejas”, dijeron los autores en un correo electrónico.
El equipo entrenó dos versiones del modelo CNN, una con una selección aleatoria de imágenes y otra con imágenes seleccionadas por el usuario. A continuación, se probó el rendimiento de estos modelos utilizando una serie de imágenes de validación. Luego, los modelos validados se aplicaron a más de 3800 especímenes digitalizados del Herbario Nacional de Nueva Gales del Sur, Australia.
“Estos especímenes fueron fotografiados recientemente como parte de una importante iniciativa de digitalización. Esto significó que las imágenes se tomaron en condiciones uniformes, con equipos similares y la misma configuración, por lo que estaban muy bien estandarizadas. Se están llevando a cabo iniciativas de digitalización similares en Herbaria en todo el mundo, por lo que pronto será posible aplicar métodos similares a una gran cantidad de imágenes (con ajustes de resolución, etc.)”, dicen los autores.
Los resultados fueron prometedores. El enfoque de entrenamiento seleccionado por el usuario fue más efectivo, ya que encontró más hojas y una gama más amplia de tamaños de hojas que el modelo de entrenamiento aleatorio. Esto sugiere que cierto nivel de participación humana experta puede mejorar la eficiencia de la IA en tareas tan complejas.
“El modelo humano en el circuito fue particularmente útil aquí porque queríamos minimizar la cantidad de datos de entrenamiento necesarios para generar un modelo sólido. Si seguimos estando limitados a datos de entrenamiento en el futuro, estos enfoques podrían desempeñar un papel durante mucho tiempo. Por otro lado, si los esfuerzos globales para entrenar modelos dan como resultado grandes bibliotecas de datos de entrenamiento, el volumen puede suplantar los beneficios de la selectividad humana”, dijeron los autores.
Con respecto al vínculo entre el tamaño de la hoja y el clima, los modelos de CNN confirmaron que las hojas más grandes se asocian con climas más cálidos y húmedos en diferentes especies, de acuerdo con estudios previos. Sin embargo, la asociación dentro de las especies no fue tan clara, lo que sugiere que otros factores, como la variación genética y el historial de la población, podrían afectar el tamaño de la hoja.
“Vemos que si nos movemos de un punto en el sureste de Australia a un punto en el noreste de Australia más cálido, en promedio el tamaño de uno”. sicigio la hoja se hace más grande. Esto parece deberse principalmente a que hay especies con hojas más grandes en el norte. En promedio, cuando observamos las hojas de una sola especie extendida en los mismos dos lugares, encontramos que las hojas tienen aproximadamente el mismo tamaño”, escribieron los autores en su correo electrónico.
“La explicación probablemente esté relacionada con la historia evolutiva o los procesos evolutivos dentro de las especies. Por ejemplo, dentro de una especie, las poblaciones que probablemente estén muy separadas siguen estando unidas por el flujo de genes. Esto puede suceder indirectamente, por ejemplo, a través de movimientos de polen relativamente cortos entre poblaciones vecinas durante generaciones. Esto significa que es probable que los alelos genéticos que afectan el tamaño de las hojas se compartan entre las poblaciones, homogeneizando los tamaños de las hojas entre las poblaciones.
“Si la selección favoreciera las hojas más grandes en el norte, el beneficio concomitante de las hojas más grandes tendría que ser bastante grande para superar el efecto del flujo de genes. También es posible que algunas especies extendidas hayan experimentado recientemente una expansión de la población, lo que también daría como resultado que las poblaciones compartan valores de rasgos similares en grandes áreas geográficas. Por lo tanto, tanto los procesos evolutivos (p. ej., el flujo de polen) como las historias (p. ej., la expansión de la población) podrían conducir a diferentes asociaciones observadas entre características y clima dentro de las especies”.
Si sigue las noticias de IA, los resultados pueden ser interesantes, pero el método puede ser oscuro. No sólo es importante saber las cosas, sino también saberlas. Cómo lo sabes Cosas. Este es un problema que Wilde y sus colegas abordan en su artículo.
“Los modelos complejos de aprendizaje automático (redes neuronales, etc.) son menos fáciles de entender que los modelos estadísticos que hasta ahora se han utilizado ampliamente en las ciencias de la vida y las plantas. Sin embargo, hemos llegado a un punto en el que existe una base sólida para usarlos de forma fiable y robusta y para beneficiarnos de su tremendo poder de inferencia”, dijeron los autores en su correo electrónico.
“Esta base para el uso significativo de ML se basa en los procesos de validación y prueba del modelo. Esto incluye tomar datos (imágenes) que no se usan para entrenar un modelo y agregar etiquetas a los datos de las características que debería encontrar un modelo bien entrenado. Entonces podemos preguntar cuantitativamente qué tan bien funciona un modelo cuando se muestran los datos. ¿Encuentra todas las hojas que se pueden encontrar allí? ¿Consigue evitar llamar hojas a las cosas que no eran hojas? Si una hoja se encuentra correctamente, ¿llega a una estimación precisa de su tamaño en píxeles? Si un modelo de aprendizaje automático puede funcionar bien en estas preguntas para un conjunto de datos de entrenamiento suficientemente grande y representativo, ganaremos confianza en el modelo”.
Una vez que tenga un método de medición robusto, también puede ampliar los datos que mide. “También hemos utilizado modelos de aprendizaje automático para encontrar una gama de otras estructuras en muestras de herbario, incluidos capullos, frutas y flores, por lo que definitivamente hay mucho espacio para expandirse a otras estructuras”, dicen los autores en su correo electrónico. También hay esperanzas de expandir la naturaleza de las mediciones, dicen. “Hemos considerado usar el aprendizaje automático para tomar medidas de campo de otras características de las hojas que están mal representadas en los especímenes preservados, ¡pero este es un trabajo en progreso!”
LEER EL ARTÍCULO
Wilde, BC, Bragg, JG & Cornwell, W. (2023) “Análisis de las relaciones clima-características dentro y entre taxones usando aprendizaje automático y muestras de herbario” Revista americana de botánica, P.e16167. Disponible en: https://doi.org/10.1002/ajb2.16167.