Nueva base de datos de hojas podría ayudar a identificar plantas extintas
Una nueva base de datos de hojas promete no solo identificar plantas a nuestro alrededor, sino también identificar plantas conocidas solo a partir de fósiles.
Hay muchos restos de plantas fósiles que podrían ayudar a escribir nuevas historias evolutivas de las familias botánicas. Las hojas son comunes entre los restos, lo que podría proporcionar una excelente manera de identificar las plantas. Pero los recursos de identificación de hojas pueden ser de difícil acceso. Peter Wilf y sus colegas han llenado este vacío de conocimiento al compilar una base de datos de acceso abierto de 30,252 imágenes a nivel familiar de especímenes de hojas examinados. La base de datos no solo proporciona un excelente recurso educativo para estudiantes humanos, sino que también podría proporcionar material para proyectos de aprendizaje automático para mejorar sus sistemas.

“La complejidad de las hojas está fuera de serie, y la terminología que tenemos para describirlas es solo el mínimo de lo que se necesita”, dijo Peter Wilf en un comunicado de prensa. “Los investigadores necesitan referencias visuales mucho más accesibles para estudiar las diferencias entre los muchos grupos de plantas para que podamos poner más en palabras. Hay muchas familias de plantas que parecen superficialmente similares y esta colección ofrece la oportunidad de ver nuevos patrones”.
No es solo la complejidad el problema. En su artículo, Wilf y sus colegas también destacan el registro de la arquitectura de hojas, o más bien la falta de ella. “Para desarrollar su conocimiento de la arquitectura de la hoja, los investigadores aún confían principalmente en la ‘tradición oral’ de un número cada vez menor de colegas expertos y un puñado de artículos de revisión y guías de campo que supuestamente resaltan las características diagnósticas de la hoja… Existe literatura importante sobre la hoja arquitectura y hojas Registros fósiles de varios taxones… Sin embargo, muchos de los grupos de angiospermas más diversos y ecológicamente importantes prácticamente no tienen documentación de los caracteres de diagnóstico de las láminas de las hojas (p. ej., Asteraceae, Rubiaceae) y, por lo tanto, los fósiles de sus hojas permanecen en gran medida desconocidos, aunque probablemente ocultos en a simple vista en las colecciones de los museos…”
Acceder a estas colecciones puede ser un desafío. Físicamente, pueden estar en cualquier parte del mundo, lo que genera altos costos de viaje. Algunos herbarios están digitalizando sus colecciones, pero son los herbarios más grandes y mejor financiados los que pueden permitírselo. En el artículo, Wilf y sus colegas también agregan que simplemente estar disponible en línea a menudo no es suficiente para un proyecto de investigación. “Para la mayoría de los conjuntos de imágenes en línea, las descargas masivas no son fáciles de realizar, las imágenes se reducen a baja resolución y los nombres de los archivos no están estandarizados, lo que requiere un esfuerzo manual significativo para reorganizarlos y ensamblarlos para un proyecto específico. Los datos taxonómicos a menudo se han vuelto parcialmente obsoletos, lo que complica aún más la modularidad de los datos”.
“Lo que hemos hecho aquí es hacer que este recurso educativo masivo sea accesible para todos al revisar y estandarizar todas estas imágenes de varias fuentes heredadas”, dijo Wilf. “Nos llevó 15 años hacer eso y convertir todos los nombres de archivo, pero ahora puede tener todo el paquete en su escritorio con un solo clic en el navegador. Cada nombre de archivo contiene la información clave en el mismo orden para una clasificación alfa rápida: familia, género, especie y número de espécimen. Los nombres de archivo se pueden buscar para el elemento deseado en segundos y las imágenes se pueden ver usando herramientas estándar como la barra de búsqueda de Windows. Todas las imágenes están en resolución original; no se reduce la resolución de nada”.
No solo el ojo humano puede beneficiarse de la base de datos. Los autores también hablan sobre el aprendizaje automático. Describen algunas aplicaciones como “avances espectaculares” en la identificación de plantas. Pero también apuntan a algunos problemas. Primero, los algoritmos son opacos: no está claro qué reconocen las computadoras como características de diagnóstico al identificar plantas.
Otro problema es que no muchos algoritmos identifican más allá del nivel de especie. Al público le gusta conocer la especie de una planta, pero puede ser útil saber qué conecta a una familia de plantas. Con los fósiles de hojas, es posible que no haya una especie o género existente para asociar con una imagen, por lo que sería extremadamente útil poder identificar una familia a través del aprendizaje automático.
“Esta base de datos pone la información de estas colecciones a disposición de personas de todo el mundo en un formato que es más fácil de buscar que el original y más apto para el análisis digital”, dijo Scott Wing, coautor del artículo. “Creemos que la base de datos estimulará nuevas investigaciones y también abrirá las colecciones del museo a la gente”.
LEER EL ARTÍCULO
Wilf P, Wing SL, Meyer HW, Rose JA, Saha R, Serre T, Cúneo NR, Donovan MP, Erwin DM, Gandolfo MA, González-Akre E, Herrera, F., Hu, S., Iglesias, A., Johnson, KR, Karim, TS y Zou, X. (2021) “Un conjunto de datos de imágenes de hojas limpias, radiografiadas y fósiles revisadas para la familia de plantas para el aprendizaje humano y automático”, PhytoKeyshttps://doi.org/10.3897/phytokeys.187.72350
ACCEDE A LA BASE DE DATOS
Wilf P, Wing SL, Meyer HW, Rose JA, Saha R, Serre T, Rubén Cúneo N, Donovan M, Erwin DM, Gandolfo MA, Gonzalez-Akre, EB, Herrera, F, Hu, S, Iglesias, A, Johnson , KR, Karim, TS & Zou, X (2021) “Recopilación de imágenes y datos de apoyo para: un conjunto de datos de imágenes de hojas limpias, radiografiadas y fósiles examinadas para la familia de plantas para el aprendizaje humano y automático”. Figshare+https://doi.org/10.25452/figshare.plus.14980698