La IA ayuda a leer, después de 2000 años, uno de los rollos de la Villa de los Papiros de Herculano
Vivimos en una época donde los avances en ciencia y tecnología redefinen constantemente los límites de lo posible. Así, un equipo internacional de investigadores acaba de descifrar algunos fragmentos de texto de uno de los rollos de papiro carbonizados recuperados de la antigua ciudad romana de Herculano. Este logro, obtenido en el marco del concurso Desafío del Vesubio, representa un hito importante en la aplicación de las últimas innovaciones tecnológicas a la arqueología y los estudios de Humanidades, y abre una nueva era en la investigación de la cultura de la Antigüedad clásica.
Los artífices de esta aportación trascendental han sido tres estudiantes de distintas universidades: Youssef Nader, un estudiante de doctorado egipcio en Alemania; Luke Farritor, un estudiante de ciencias de la computación en Nebraska; y Julian Schilliger, un estudiante de robótica en Suiza. Un trío de desconocidos que decidieron combinar sus talentos y formar equipo para triunfar en el desafío. Aplicando algoritmos de aprendizaje automático a los escaneos del papiro que habían compartido los promotores, lograron descifrar 2000 palabras de un texto filosófico inédito hasta la fecha, que contiene reflexiones epicureístas escritas en griego.
Los rollos de la Villa de los Papiros
El rollo descifrado es uno de los que se guardaban en la biblioteca de la conocida como Villa de los Papiros, en Herculano. Las obras de la biblioteca estaban empaquetados, listas para ser trasladados a un sitio seguro, pero la erupción del Vesubio los terminó sepultando bajo más de 20 metros de ceniza y lodo volcánico. Todos los rollos se carbonizaron pero, al mismo tiempo, el proceso los preservó para la posteridad en la toba volcánica. Ahí radica la importancia de esta biblioteca, porque es la única del mundo clásico que ha sobrevivido hasta nuestros días, y puede contener obras inéditas que se creían perdidas.
Los rollos permanecieron allí enterrados hasta mediados del siglo XVIII, cuando los encontraron en el curso de una de las primeras excavaciones que se llevaron a cabo en la zona. Se rescataron casi 1800 de ellos. Debido a su estado, aquellos libros eran muy difíciles de desenrollar, y todos los intentos que se hicieron en aquel entonces solo provocaron su desintegración. En la actulidad, la mayor parte de los papiros se encuentran ahora almacenados en la Biblioteca Nacional de Nápoles, aunque hay también algunos en la Biblioteca Bodleiana de Oxford, la Biblioteca Británica y el Instituto de Francia.
Durante varios siglos, los estudiosos han probado distintas técnicas para desplegar los papiros, con mayor o menor éxito. Su extrema fragilidad hacía muy lentos los procesos, y al final solo se conseguían pedazos muy fragmentados. Además, aunque se pudieron extraer algunas partes más o menos íntegras, casi todo su contenido siguió siendo un misterio. Los romanos usaban tinta a base de carbono, elaborada con hollín o carbón vegetal, así que no se podía diferenciar el trazado de la escritura en el papiro carbonizado, y los rollos permanecían ilegibles. A veces, cuando se daba con un fragmento donde se distinguía la escritura, muchas veces esta desaparecía al entrar en contacto con el aire.
Brent Seales y su iniciativa de restauración digital de los papiros de Herculano
Hasta las últimas décadas del siglo XX no hubo grandes progresos. Dirk Obbink, catedrático en papirología de la Universidad de Oxford, comenzó a estudiar los papiros en los años 80. Utilizando microscopios y diversas técnicas de iluminación, identificó textos en fragmentos aparentemente indescifrables. Sin embargo, los papiros sufrían daños con cada lectura debido a su fragilidad, y siempre se desprendían pequeñas briznas chamuscadas. Se logró un avance significativo en 1999, cuando científicos de la Universidad Brigham Young, de Estados Unidos, examinaron los papiros con luz infrarroja multiespectral. Con esta nueva técnica se lograba un contraste notable entre el papiro y la tinta, y se revelaban partes escritas que antes permanecían ocultas.
La irrupción del Dr. Seales marcó un cambio significativo en las investigaciones. Brent Seales, profesor de ciencias de la computación en la Universidad de Kentucky, se ha especializado en la recuperación y preservación digital de artefactos históricos y culturales, y es pionero en el uso de tecnologías avanzadas, no invasivas, para leer documentos muy frágiles o dañados. Seales empezó a trabajar con manuscritos deteriorados a mediados de los 90, en el marco de la digitalización de la Colección Cotton, de la Biblioteca Británica. Fue allí donde, utilizando luz ultravioleta para realzar el texto, ayudó a hacer una versión digital de la única copia conservada en inglés antiguo del poema épico Beowulf.
Mientras trabajaba en la creación de los facsímiles digitales, descubrió el problema que presentaban algunos manuscritos dañados que tenían hojas arrugadas, dobladas o pegadas entre sí. Se dio cuenta de lo inadecuado de hacer fotografías o escaneos bidimensionales, ya que las palabras salen distorsionadas, o quedan ocultas en pliegues y dobleces, por lo que los textos se toman incompletos. Pero no era posible manipular los documentos originales sin correr el riesgo de provocar más daños.
Fue entonces cuando el Dr. Seales se propuso encontrar una forma de devolver esos textos a su estado original, aunque fuese de manera digital. Inspirándose en las tomografías médicas, capaces de proporcionar imágenes detalladas del interior del cuerpo humano, Seales empezó a desarrollar tecnología 3D y software especializado para escanear los códices. Unos años después, en el 2000, regresó a la misma biblioteca con un prototipo que permitía escanear documentos frágiles sin contacto directo, incluso si estaban doblados. Al ver los buenos resultados obtenidos, a Seales se le ocurrió que podía usarla para tratar de leer rollos frágiles, como algunos de los manuscritos del mar Muerto o los los papiros carbonizados por el Vesubio, sin la necesidad de abrirlos.
Conseguir permiso para trabajar con alguno de los papiros de Herculano fue toda una odisea. Finalmente, la oportunidad se le presentó al Dr. Sales y su equipo en 2009, gracias a la colaboración del Instituto de Francia. La institución, que custodia varios rollos de Herculano, cedió al profesor y su equipo dos de los que tiene sin desenrollar, el P.Herc.Paris 3 y el P.Herc.Paris 4. Las microtomografías computarizadas permitieron a los investigadores escanear los rollos sin ningún problema y echar un vistazo al interior. Sin embargo, se encontraron un problema inesperado a la hora de leerlos: la ausencia de trazas de metal en la tinta antigua. Al tratarse de tinta de carbón sobre un papiro carbonizado, con densidades y química muy similares, no se podían distinguir mediante rayos X. Seals había demostrado que era posible obtener imágenes internas de los rollos mediante microtomografía para superar los problemas de fragilidad de los documentos. Pero la identificación de las partes escritas durante el análisis posterior iba a ser una tarea aún más difícil.
En los años siguientes, el equipo del Dr. Seales se centró en dos objetivos: por un lado, mejorar el software para aumentar su capacidad de procesamiento de datos; por otro, desarrollar una metodología efectiva que combinara el desenrollado digital con la detección de la tinta de carbono.
La labor de Seth Parker fue crucial en los avances del desenrollado digital. Lideró un grupo de trabajo que ideó un método informático para la segmentación y aplanado de los rollos. Consiste en buscar las capas de papiro enrollado en el espacio 3D que proporcionan las tomografías, segmentar los pliegues de las capas, y desenrollarlas en una superficie plana. Se trata de una tarea compleja para la que idearon el Cartógrafo de Volumen, una herramienta que combina algoritmos automáticos y ajustes manuales para desplegar virtualmente conjuntos de datos volumétricos y convertirlos en imágenes 2D.
El equipo tuvo la ocasión de probar con éxito esta tecnología cuando, hacia 2015, pidieron su colaboración para desplegar virtualmente el rollo de En-Gedi, un pergamino hebreo de 1700 años. El pergamino estaba tan severamente dañado que no se podía abrir físicamente. Esta prueba representó la primera recuperación completa y no invasiva del texto de un manuscrito gravemente dañado. Se pudieron leer 35 líneas de texto en dos columnas en hebreo de los dos primeros capítulos del Levítico.
Para leer los papiros de Herculano había que aplicar el mismo método, pero antes era necesario encontrar alguna solución para detectar la tinta. Como los rayos X de las tomografías convencionales no servían en este caso, el Dr Seales y sus investigadores se enfocaron en buscar contrastes morfológicos entre las fibras del papiro alteradas por la tinta y las que no lo estaban. Se dieron cuenta de que la presencia de la tinta se detectaba como un abombamiento transversal en el grosor del sustrato. Se podía observar mediante microscopía electrónica de barrido (SEM), por lo que se necesitaba resoluciones extremadamente altas. Para conseguirlas, se les ocurrió la posibilidad de utilizar la tecnología de rayos X de alta energía de los aceleradores de partículas para los escaneados.
Paralelamente al equipo de la Universidad de Kentucky, otro grupo de investigadores del Instituto de Nanotecnología de Roma logró tomar imágenes de un rollo de papiro utilizando tomografía de contraste de fase de rayos X en el Laboratorio Europeo de Radiación Sincrotrón, en Grenoble. Esta técnica permitió visualizar hasta 14 líneas de texto, aunque los resultados no fueron del todo concluyentes.
Finalmente, en 2019, el profesor Brent Seales y su equipo de la recién creada Iniciativa de Restauración Digital EduceLab obtuvieron imágenes de pergaminos herculanos carbonizados gracias a la aplicación de tomografías en el acelerador de partículas Diamond Light Source, en el Reino Unido. La instalación produce un haz paralelo de rayos X de alto flujo que permite imágenes rápidas, precisas y de alta resolución. Los investigadores lograron imágenes con resoluciones de hasta 4 µm, al que aplicaron el software de desenrollado para reconstruir digitalmente en 3D todo el interior.
Una vez disponibles las secciones bidimensionales, quedaba el gran reto pendiente de identificar el trazado de la escritura. La idea era entrenar modelos de aprendizaje automático para que identificasen patrones con los datos de contraste morfológico. Para ayudar a los algoritmos, tomaron algunos datos de referencia de otros manuscritos antiguos donde la tinta era visible, y también de pruebas que ellos mismos hicieron con papiros modernos que luego quemaban. La intención era mostrar a la inteligencia artificial dónde se esperaba que apareciese el texto. No obstante, se trataba de una tarea titánica para un equipo tan pequeño. Fue así como, en marzo de 2023, nació el Desafío del Vesubio.
El Desafío del Vesubio
El Desafío del Vesubio fue un reto lanzado a la comunidad científica internacional por Brent Seales y otros dos patrocinadores, Nat Friedman y Daniel Gross, con el objetivo de entrenar modelos de ia capaces de leer los rollos carbonizados de Herculano. Para ello, publicaron los escaneos de alta resolución que habían tomado con distintas energías incidentes, y también los algoritmos con los que habían empezado a trabajar para que los concursantes se basaran en ellos.
La cuantía del premio para los ganadores no era nada despreciable: más de 1.000.000 de dólares, repartidos en un premio principal de 700.000 dólares, más otros de cuantías más pequeñas para aquellos participantes que lograsen alcanzar hitos específicos, tanto en la segmentación de los rollos como en la detección de tinta. Los criterios del desafío consistían en decodificar al menos el 85% de cuatro pasajes del pergamino, cada uno con al menos 140 caracteres recuperables. Los participantes debían compartir sus proyectos y resultados bajo licencia de código abierto.
A principios de este año, poco más de 9 meses después de lanzarse el desafío, ya había un equipo ganador. Youssef Nader, Luke Farritor y Julian Schilliger habían presentado un trabajo que destacaba claramente sobre todos los demás por su claridad y precisión en la recuperación del texto. El equipo superó con creces los objetivos establecidos: lograron identificar con al menos un 85% de precisión más de 2000 letras griegas en un fragmento equivalente a 15 columnas de texto. Esto supone casi un 5% del contenido total del rollo, algo que superaba ampliamente las expectativas iniciales de los organizadores. Además de una detección de tinta sin igual, la presentación ganadora contenía el mejor enfoque de autosegmentación.
La clave del éxito del concurso ha sido la combinación de competencia y cooperación. Se otorgaron premios más pequeños, con cuantías que iban de los 1.000 a los 10.000 dólares para incentivar el progreso, con la condición de que el ganador de cada etapa liberase el código de aprendizaje para beneficio de toda la comunidad. De este modo, los participantes podían seguir construyendo sobre los avances de los demás. También permitía que estos participantes reinvirtiesen esas ganancias en mejores equipos, o reducir su carga de trabajo o estudio para dedicarlo a la competinción. Y permitió a las personas encontrarse y formar equipos, como en el caso de los ganadores del gran premio.
Los tres miembros del equipo ganador habían sido fuertes contribuyentes a la comunidad desde el principio del desafío. Comenzaron trabajando de forma individual, y el primer avance significativo lo hizo Farritor en octubre, cuando logró descifrar la primera palabra legible del pergamino: porphyras, que significa "púrpura" en griego antiguo. Poco después, Youssef, pudo leer algunas columnas de texto. Ambos se llevaron premios secundarios por sus hitos. Estos logros les proporcionó un impulso adicional de confianza y motivación para continuar su trabajo. Schilliger, por su parte, ganó varios premios por su increíble trabajo en cartografía de volúmenes, en especial por el desarrollo del programa Thaumato Anakalyptor, capaz de generar mapeo 3d de amplias áreas del papiro, y que mejoraba el Cartógrafo de Volúmenes de Seth Parker.
Como muchos otros participantes, los tres investigadores aprovecharon la naturaleza colaborativa del desafío y terminaron formando equipo. Utilizaron modelos de inteligencia artificial para analizar las tomografías y el reconocimiento de los restos de tinta. Trabajaron incansablemente, en jornadas cada vez más largas conforme se acercaba la fecha límite. Todo el proceso de decodificación ha sido una experiencia intensa y gratificante para los estudiantes, que estuvieron siempre motivados por la naturaleza del trabajo en equipo, y la determinación por descifrar el misterio del pergamino.
Un tratado de filosofía
Aunque solo se ha descifrado aproximadamente el 5% del contenido del papiro de Herculano, este pequeño avance ha proporcionado una visión invaluable de lo que puede guardar en su interior. Ahora se sabe que este rollo no es una copia de una obra conocida, sino que contiene texto nunca antes visto de la antigüedad. Los pasajes descifrados hasta ahora parecen ser una discusión filosófica sobre los placeres de la vida, incluida la música y la comida, que, bien entendidos, conforman el bien supremo en la filosofía epicúrea. El autor se preocupa por cómo la disponibilidad de bienes, como la comida, puede afectar el placer que proporcionan. El equipo de papirología se está preparando para entregar un estudio completo tan pronto como puedan. Aunque aún seestán analizando los resultados, se espera que estos textos proporcionen una comprensión más profunda de la cultura y la sociedad en la antigua Roma.
El éxito del Desafío del Vesubio ha generado un gran entusiasmo en la comunidad académica y científica. Si en 2023 se ha logrado descifrar el 5% de un rollo, los organizadores esperan llegar en 2024 hasta el 90% de los cuatro rollos que se han escaneado hasta ahora. Y, sobre todo, sentar las bases para leer los 800 rollos restantes que todavía no se han tocado. Los científicos tienen que automatizar por completo el proceso de trazado de la superficie del papiro dentro de cada pergamino y mejorar la detección de tinta en las partes más dañadas.
Los resultados de este desafío son una muestra del potencial de la aplicación de la inteligencia artificial para el estudio de textos antiguos, y abren nuevas perspectivas para futuras investigaciones en este campo. Para empezar, sienta las bases para la lectura sistemática de cientos de rollos de Herculano que esperan ser leídos, lo que podría tener un impacto significativo en nuestra comprensión de la historia y la cultura del mundo clásico. Añade un gran peso, además, a los argumentos a favor de nuevas excavaciones en la Villa de los Papiros, ya que dos niveles de la villa permanecen sin excavar es posible que haya muchos más enterrados en la villa. Pero esta tecnología se podrá aplicar a muchísimos otros manuscritos antiguos o, incluso, para leer las fórmulas mágicas que envuelven algunas momias egipcias demasiado frágiles como para manipular, por poner algún otro ejemplo.
Fuentes
scrollprize.org
PARKER C.S.: "From invisibility to readability: Recovering the ink of Herculaneum" en PLOS ONE 14(5), Public Library of Sciences, 2019
smithsonianmag.com
lapiedradesisifo.com
mymodernmet.com
Deja una respuesta
Seguro que también te interesa: