DACER21. La Digitalización para Adaptar una Colección de Entomología a los Retos ambientales del siglo 21

DACER21 es un proyecto de investigación de la convocatoria de 2021 de "Proyectos Estratégicos Orientados a la Transición Ecológica y a la Transición Digital" del "Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023".

Título del proyecto: La digitalizacion para adaptar una coleccion de entomologia a los retos ambientales del siglo 21

Código: TED2021-130795B-I00

 

1.- La propuesta.

La aceleración de la tasa de extinción de especies, debida a la actividad humana, es uno de los problemas medioambientales más graves conocidos. Denunciado desde finales del siglo XX (Wilson, 1988), en el siglo XXI se sigue agravando y podría llegar a poner en peligro la supervivencia de la propia especie humana (Rockström, 2009; Steffen et al., 2011; Steffen et al., 2015).

Urge disponer de datos precisos sobre las respuestas de la biodiversidad al cambio climático a largo plazo, en amplias áreas geográficas y con una gran variedad de taxones (IPBES, 2019). En la literatura científica (Wagner, 2020; Wagner, et al., 2021) y popular reciente (McCarthy, 2015; Kolbert, 2020; Goulson, 2021) ha cundido la alarma por la disminución de insectos, los taxones más diversos y abundantes del planeta, que desempeñan papeles esenciales en el funcionamiento de los ecosistemas y en servicios como la polinización, el ciclo de nutrientes y el control de plagas (Wilson, 1987; Losey & Vaughan, 2006; Gallai, 2009; Yang & Gratton, 2014). Sin embargo, las pruebas publicadas sobre las respuestas recientes de los insectos al cambio global están muy sesgadas desde el punto de vista geográfico y taxonómico, y rara vez van más allá de unas pocas décadas (Collen et al., 2012; Sánchez-Bayo & Wyckhuys, 2019; Wilson & Fox, 2021). Además, comunicar el declive de los insectos y su importancia para la función de los ecosistemas y el bienestar humano se ve obstaculizado por connotaciones públicas negativas (Saunders, 2020).

Los museos de historia natural albergan millones de ejemplares de insectos recogidos a lo largo de los dos últimos siglos, y desempeñan un papel clave en la comunicación y la educación del público. Las colecciones entomológicas de los museos son, por tanto, vitales tanto para ampliar la evidencia del alcance geográfico, taxonómico y temporal de las respuestas de los insectos al cambio climático (Meineke et al., 2018; Kharouba et al., 2019; Montgomery et al., 2020), como para transmitir al público la importancia de los insectos y su destino (Alberch, 1993; Didham et al., 2020; Saunders et al., 2020). Sin embargo, en la práctica las colecciones de los museos aún no cumplen esta función, debido a las limitaciones de infraestructura, técnicas analíticas y recursos de tiempo y personal (Suarez & Tsutsui, 2004; Ries et al., 2019). Las nuevas infraestructuras y tecnologías, combinadas con los avances de los modelos estadísticos y el tratamiento del big data, permiten superar estas limitaciones (Short et al., 2018; Jönsson et al., 2021).

Se trata de aprovechar las ventajas que ofrecen la nuevas técnicas de digitalización, almacenamiento digital, procesado y análisis para mostrar cómo se puede mejorar la accesibilidad y explotación de la información científica generada por la Colección de Entomología del Museo Nacional de Ciencias Naturales (MNCN), que con sus 5 millones de ejemplares es la mayor colección de insectos de España.

 

2.- Objetivos del proyecto

Se mostrará cómo una colección de historia natural puede abordar y comunicar eficazmente las respuestas de la biodiversidad al cambio global mediante cuatro objetivos principales:

1. Establecimiento de (a) un flujo de trabajo para la catalogación y digitalización de las colecciones, (b) la infraestructura informática para almacenar, procesar y analizar los datos digitales, y (c) aplicación de medios novedosos para comunicar al público los efectos del cambio climático sobre los organismos, con el apoyo del departamento de Comunicación del MNCN.

2. Dar prioridad y acelerar la digitalización de los ejemplares tipo de la Colección de Entomología del MNCN (más de 33.000 especímenes que representan a más de 7.000 taxones), empleando técnicas 2D de apilamiento de enfoque para obtener imágenes con profundidad de campo extendida de alta resolución, generando un recurso único para compartir con la comunidad científica y medioambiental nacional y mundial. La digitalización, difusión, accesibilidad y trazabilidad de los datos generados por los ejemplares tipo de la Colección los transformará en Ejemplares Digitales Extendidos (Hardisty et al., 2022), como complejos de datos interconectados, convertidos en representaciones FAIR (Wilkinson et al., 2016) de ejemplares de colección.

Ejemplar Digital Extendido
Figura xx. Ejemplar Digital Extendido.

3. Avanzar significativamente en la georreferenciación (Chapman & Wieczorek, 2020) y digitalización de la colección de lepidópteros diurnos ibéricos del MNCN (aprox. 80.000 ejemplares), y estos nuevos datos se analizarán con técnicas de vanguardia para observar los efectos del cambio climático en las mariposas a lo largo del último siglo. Implica un proceso de pre-digitalización que incluirá los pasos esenciales de identificación-validación, catalogación y georeferenciación. Al igual que en el objetivo 2, se utilizá la digitalización 2D para los ejemplares de la familia Papilionidae (aproximadamente 3000). Como ensayo de las aplicaciones de la investigación, se llevarán a cabo novedosos análisis de los cambios en la distribución y estacionalidad de las mariposas teniendo en cuenta los sesgos de recolección a lo largo del espacio y del tiempo.

4. Desarrollar y aplicar nuevos métodos de digitalización 3D para ejemplares de insectos (incluidas imágenes 3D de ejemplares tipo), y en un caso de estudio se probará cómo pueden utilizarse para evaluar las respuestas ecomorfológicas al cambio climático de una mariposa de montaña amenazada por el calentamiento global (la apolo, Parnassius apollo). Se implementarán métodos de fotogrametría 3D para ejemplares entomológicos de tamaño medio (20-100 mm) y se aplicarán para probar hipótesis a priori sobre los efectos del calentamiento global y el aislamiento de las cimas de las montañas en la morfología de esta especie, emblemática para la conservación. Por último, se pretende desarrollar un escáner único en España y el sur de Europa, apto para la digitalización 3D de insectos y otros objetos u organismos de pequeño tamaño (<20 mm) a muy alta resolución, siguiendo únicamente a tres grupos pioneros internacionales (Nguyen et al., 2014; Ströbel et al., 2018; Plum & Labonte, 2021). Para esta parte final del objetivo 4, sólo existen estos tres modelos no comercializados en el mundo, por lo que este objetivo final es de alta recompensa pero de alto riesgo, dependiendo de la ingeniería óptica, la informática y la construcción.

 

3.- Plan de trabajo.

Para conseguir los objetivos propuestos, se ha diseñado un plan de trabajo que contempla cinco tareas relacionadas; el flujo de trabajo del proyecto queda descrito en estas tareas.

Esquema de tareas en DACER21
Figura xx. Esquema de trabajo en DACER21.

 

Tarea 1. Infraestructura TIC (objetivo 1)

La creación del flujo de trabajo y la infraestructura tecnológica necesaria para la catalogación y digitalización de colecciones de historia natural, y su difusión.

No solo es necesario disponer de la infraestructura tecnológica necesaria (hardware y software), sino que hay que diseñar las políticas de actuación y los protocolos necesarios para definir un flujo de trabajo que permita alcanzar el objetivo 1. Esta infraestructura debe permitir:

1.- El almacenamiento del material digitalizado siguiendo las políticas y protocolos establecidos. Implica el correcto nombrado de los objetos digitales y su correcta ubicación en unidades de almacenamiento creadas en la infraestructura TIC para este propósito.

2.- El registro y documentación de los objetos digitales en la base de datos de la Colección Digital del MNCN mediante el uso de la Aplicación de Gestión de Objetos Digitales (AGOD), que se está desarrollando expresamente para la gestión de dicha colección.

3.- La interrelación y trazabilidad de los objetos digitales (las digitalizaciones) con las colecciones y los ejemplares físicos de colección digitalizados. El sistema debe permitir una trazabilidad bidireccional, de forma que desde el registro de un ejemplar en el sistema de gestión de la colección se puedan localizar y previsualizar las digitalizaciones de dicho ejemplar, si las tiene y en sentido contrario, desde el registro del objeto digital, debe ser posible localizar y consultar el ejemplar digitalizado.

Esquema de infraestructuras TIC, flujo de trabajo y protocolos.
Figura xx. Esquema de infraestructuras TIC, flujo de trabajo y protocolos.

 

Tarea 2. Catalogación y georreferenciación:
la pre-digitalización (objetivos 2 y 3)

Catalogación y documentación de los ejemplares tipo. Catalogación y georreferenciación de los lepidópteros diurnos. Paso previo necesario para la digitalización.

El primer paso, esencial para la creación del ejemplar digital, es la correcta catalogación y documentación del ejemplar físico. Existen tres requisitos básicos que hay que cumplir para una correcta catalogación, a saber:

1.- Identificación. Cada ejemplar debe ser identificado de forma única y sin ambigüedad de forma que pueda ser reconocible y distinguible del resto de ejemplares. Para ello se le asignará y asociará un Número de Catálogo: un identificador único a nivel mundial, alrededor del cual se desplegará y girará el Ejemplar Digital Extendido.

2.- Descripción. Es imprescindible una correcta descripción de los ejemplares según un modelo de datos preestablecido, siguiendo un estándar, que permita posteriormente encontrarlos siguiendo distintos criterios de búsqueda, así como compartirlos de forma coordinada con otras infraestructuras.

3.- Ubicación. Se debe guardar un registro detallado de la ubicación precisa de cada ejemplar de forma que pueda ser localizado en todo momento con rapidez.

Entra dentro del objetivo 2 terminar de localizar, y catalogar en su caso, aquellos ejemplares tipo que queden pendientes.

De igual forma, se seguirá avanzando en la catalogación de los lepidópteros diurnos ibéricos de la colección, prestando especial atención al registro de las coordenadas geográficas, cuando las tengan y haciendo un ejercicio de georreferenciación retrospectiva cuando solo se disponga de datos descriptivos de localidad (objetivo 3).

Tarea 3. Digitalización en 2D (objetivos 2 y 3)

Digitalización 2D de los ejemplares tipo de la Colección de Entomología y de los lepidópteros diurnos ibéricos.

Los ejemplares tipo (objetivo 2):

Una vez catalogado debidamente (pre-digitalización), el ejemplar puede digitalizarse, dando prioridad a los tipos portanombre (holotipo, lectotipo, neotipo o sintipos). En los casos de series sintípicas con numerosos ejemplares (es decir, múltiples individuos en los que se basa un nombre), sólo se digitalizarán algunos en función de sus localidades de origen, dimorfismo sexual, variabilidad morfológica, etc.

Para cada ejemplar se tomarán al menos dos imágenes, una con todas sus etiquetas (dos imágenes si alguna etiqueta tiene escritura por ambas caras) y otra con el aspecto general del ejemplar (hábitus dorsal). A priori consideramos que en la mayoría de los ejemplares se debe tomar al menos una segunda vista lateral. En la mayoría de los casos, los ejemplares se digitalizarán utilizando una técnica de apilamiento de enfoque, es decir, tomando varias imágenes con diferentes distancias de enfoque que cubran todos los planos del ejemplar, de forma que éste quede enfocado en su totalidad (profundidad de campo extendida, EDOF por sus siglas en inglés) cuando se unan todas las imágenes utilizando el software adecuado.

Profundidad de Campo Extendida

Lepidópteros diurnos ibéricos (objetivo 3):

Realizaremos imágenes 2D de los ejemplares del MNCN de la familia Papilionidae. Ya hemos catalogado adecuadamente (pre-digitalización) los aprox. 3.000 ejemplares de las cinco especies que se encuentran en la península ibérica, que comprenden especies carismáticas de gran tamaño con distintas asociaciones biogeográficas (especies de montaña poco comunes [Parnassius apollo, P. mnemosyne], endémicas mediterráneas/ibéricas [Iphiclides feisthamelii, Zerynthia rumina] y una especie muy extendida [Papilio machaon]). Estas especies son de interés tanto para cuestiones científicas sobre la influencia del ciclo biológico en las respuestas al cambio global como para las actividades de intercambio de conocimientos entre el público.

Tarea 4. Fotogrametría 3D y desarrollo de un escáner 3D de alta resolución para ejemplares pequeños (objetivo 4)

El propósito es implementar una nueva técnica de digitalización, la fotogrametría 3D, en el Laboratorio de Morfología Virtual del MNCN que sea capaz crear modelos 3D a partir ejemplares de historia natural pequeños y complejos. En DACER21 éstos son los de la Colección de Entomología.

Esta tarea tiene dos niveles: El nivel 1 es sencillo y tiene como objetivo crear un sistema semiautomático de fotogrametría 3D de corto alcance para producir modelos virtuales en 3D de ejemplares tipo de la Col. de Entomología de tamaño medio (20-80 mm) y una muestra de ejemplares de mariposa Parnassius apollo para análisis científicos. El nivel 2 es más complejo y tiene por objeto construir un escáner 3D de código abierto (Plum & Labonte, 2021; Nguyen et al., 2014) basado en fotogrametría de alta resolución totalmente automatizado para ejemplares entomológicos de pequeño tamaño (<20 mm).

La fotogrametría de corto alcance (nivel 1) se basa en imágenes digitales de alta resolución obtenidas por una cámara digital (Luhmann et al., 2019). Las imágenes en color se capturan desde diferentes ángulos y alturas con profundidades focales constantes para producir una serie de imágenes que muestren solapamientos parciales entre pares. Esto puede convertirse en un proceso semiautomático utilizando un trípode para una altura determinada de posición de la cámara, y una plataforma giratoria motorizada con un disparador de cámara controlado a distancia.

Implementaremos fotogrametría estandarizada de corto alcance como método de digitalización 3D de objetos entomológicos de tamaño medio, con rangos entre 80 y 20 mm (preparados en los objetivos 2 y 3) en las instalaciones de digitalización del Laboratorio de Morfología Virtual del MNCN.

Sin embargo, para digitalizar ejemplares de tamaño inferior a 20 mm (nivel 2), construiremos y utilizaremos un sistema de escáner fotogramétrico 3D de alta resolución de código abierto y totalmente automático, que se basa en una tecnología descrita en dos modelos que se utilizan actualmente para la digitalización 3D de insectos (Plum & Labonte, 2021; Ströbel et al., 2018):

El primer sistema de escáner es el Darmstadt Insect SCanner (DISC3D) (Ströbel et al., 2018).

El segundo sistema de escáner es el "scAnt", utilizado para artrópodos (Plum & Labonte, 2021), es el que se implementará en DACER21. Consiste en una plataforma de código abierto para la creación de modelos digitales en 3D de objetos pequeños. Consta de un escáner y una Interfaz Gráfica de Usuario (GUI) que permiten la generación automática de imágenes multivista de Profundidad de Campo Extendida (EDOF), similares a las producidas durante la tarea 3. A continuación, estas imágenes se enmascaran combinando detección de bordes basada en bosques aleatorios, detección de límites adaptativa y etiquetado de componentes conectados para su procesamiento final mediante un paquete de software de fotogrametría como Agisoft Metashape.

Tarea 5. Análisis científico e impacto (objetivos 3 y 4)

La tarea 5 incluye el análisis de los datos derivados de los objetivos 3 (lepidópteros diurnos ibéricos) y 4 (imágenes tridimensionales de Parnassius apollo), la difusión de resultados, la divulgación pública y el intercambio de conocimientos.

Análisis de los efectos históricos del cambio climático en las mariposas (objetivo 3).

Los ejemplares de historia natural se han recogido al azar, con posibles sesgos en los taxones, la fecha y la ubicación geográfica, lo que complica los esfuerzos por analizar las respuestas de la abundancia de especies, la estacionalidad (fenología) o el área de distribución geográfica, al cambio climático. Pero un número suficientemente grande de ejemplares ofrece la oportunidad de controlar estos sesgos mediante modelos bayesianos de ocupación desarrollados para estimar las probabilidades de ocupación a partir de datos recogidos al azar (Isaac, N. et al., 2014). Estos modelos se han aplicado para predecir tendencias en insectos a partir de datos de museos (Jönsson, G. et al., 2021; Outhwaite, C. et al., 2018; Sheard, J. et al., 2021). Utilizando los metadatos obtenidos en la catalogación (pre-digitalización) de las mariposas ibéricas, comprobaremos si hay indicios de cambios en la distribución (por ejemplo, hacia latitudes o elevaciones más altas), o en la fenología (por ejemplo, fechas de primera captura o de captura media más tempranas), a medida que las condiciones se han ido haciendo más cálidas desde la década de 1970. Aplicaremos modelos de ocupación para comprobar si las tendencias son robustas a los controles del sesgo de muestreo.

Efectos ecomorfológicos del cambio global en Parnassius apollo (objetivo 4).

La mariposa Apolo (Fig. 1) se ha replegado a refugios de alta montaña a medida que el clima se ha ido calentando y muchas poblaciones han disminuido o desaparecido en los últimos años (Van Swaay, C. et al., 2010; Wilson, R. et al., 2015; Kebaïli, C. et al., 2022). Se sabe que el declive de las poblaciones, la fragmentación del hábitat y el cambio climático modifican las dimensiones de las alas, la simetría y los tamaños del tórax y el abdomen de las mariposas (Wilson, R. et al., 2022), incluida la Apolo (Pierzynowska, K. et al., 2019). Pondremos a prueba la capacidad de nuestra novedosa técnica de digitalización 3D para detectar evidencias de cambios ecomorfológicos en la Apolo, aprovechando la colección única del MNCN de 1600 ejemplares de la especie de la península ibérica, que ya han sido catalogados y que serán digitalizados en 2D (tarea 3). Compararemos los resultados de los análisis que utilizan datos 2D de la tarea 3 (por ejemplo, la relación de aspecto del ala) con las métricas derivadas del escaneo 3D (tarea 4) para determinar la mayor comprensión que ofrecen los datos 3D.

La morfometría geométrica 3D (3DGM) utiliza puntos de referencia para cuantificar la forma biológica (Bookstein, F., 1991; Zelditch, M. et al., 2012). Estos puntos de referencia son portadores de hipótesis biológicas, son homólogos y se corresponden entre muestras de individuos diferentes. Los métodos recientemente perfeccionados de "semi-puntos de referencia deslizantes" (Mitteroecker, P. & Gunz, P. 2009) amplían el uso de la 3DGM a formas complejas compuestas de superficies y curvas tridimensionales, importantes para DACER21, para cuantificar el tamaño y la forma tridimensionales del tórax, el abdomen y las alas de las mariposas.

Es importante destacar que durante cada paso del análisis 3DGM existe un vínculo cuantitativo directo entre los espacios estadísticos y el espacio de las configuraciones de los puntos de referencia, lo que permite una visualización 3D muy potente e interactiva de los resultados estadísticos. DACER21 aplicará estos métodos para analizar las configuraciones 3D de los puntos de referencia de la muestra de Apolo obtenidas mediante fotogrametría (tarea 4).