La revolución digital de los manuscritos judíos medievales

  • Un proyecto internacional impulsa la transcripción automática de cientos de miles de manuscritos judíos medievales, con la Genizá de El Cairo como eje central.
  • La Biblioteca Nacional de Israel y la plataforma Ktiv lideran la digitalización y publicación abierta de los textos, apoyados por financiación del Consejo Europeo de Investigación.
  • La iniciativa MiDRASH combina inteligencia artificial y humanidades para reconstruir la cultura literaria judía medieval y facilitar nuevos estudios académicos.
  • Jornadas colaborativas de transcripción y revisión permiten mejorar los modelos de IA y abrir el archivo a investigadores y público de todo el mundo.

manuscritos judios medievales

La inmensa colección de manuscritos judíos medievales conocida como la Genizá de El Cairo vive un momento decisivo gracias a la inteligencia artificial. Tras décadas en las que solo una parte mínima del material podía consultarse con comodidad, la combinación de digitalización masiva y sistemas de reconocimiento de texto está empezando a abrir, de verdad, este archivo único a investigadores y público general.

Lo que hasta hace poco parecía un sueño para filólogos e historiadores —poder buscar, leer y comparar cientos de miles de fragmentos hebreos medievales desde cualquier ordenador— se ha convertido en un proyecto concreto. A través de la plataforma Ktiv de la Biblioteca Nacional de Israel y del programa MiDRASH, se han generado transcripciones preliminares de prácticamente todos los fragmentos de la Genizá, y se prepara ahora su revisión, mejora y publicación abierta.

Un archivo medieval gigantesco, por fin legible

coleccion manuscritos judios medievales

La llamada Genizá de El Cairo se considera la colección más amplia y variada de documentos judíos medievales conservada en el mundo. Durante cerca de mil años, la comunidad judía de la capital egipcia fue depositando allí textos religiosos, legales, comerciales o literarios que, por la tradición de no destruir escritos con el nombre de Dios, no podían tirarse sin más. El resultado fue un fondo que hoy ronda los 400.000 fragmentos, conservados en gran parte gracias al clima seco de Egipto.

A pesar de su importancia, el conjunto ha sido aprovechado solo de manera parcial: hasta hace poco, menos de un tercio del material estaba catalogado y apenas un 10-15 % contaba con transcripción legible. El resto, aunque digitalizado y accesible en forma de imagen, seguía siendo difícil de trabajar de manera sistemática, ya que leer manuscritos hebreos cursivos o semicursivos del medievo exige mucha experiencia y tiempo.

La nueva fase del proyecto cambia este panorama. Basándose en la infraestructura de Ktiv —la base de datos digital de todos los manuscritos hebreos conocidos que gestiona la Biblioteca Nacional de Israel—, un equipo internacional ha desarrollado sistemas de transcripción automática capaces de convertir esos fragmentos en texto digital buscable, al menos en una primera versión que luego se irá afinando.

Según datos difundidos por la institución, ya se han generado transcripciones preliminares para prácticamente todos los elementos de la Genizá de El Cairo, además de miles de manuscritos hebreos adicionales procedentes de otras colecciones medievales. Para un campo que llevaba más de un siglo trabajando pieza a pieza, el salto de escala es difícil de exagerar.

MiDRASH: IA y humanidades al servicio de los manuscritos hebreos

En el centro de esta transformación se sitúa MiDRASH (Migrations of Textual and Scribal Traditions via Large-Scale Computational Analysis of Medieval Manuscripts in Hebrew Script), un proyecto interdisciplinar que reúne a especialistas de Israel y Europa. La iniciativa arrancó en 2023 gracias a una beca ERC Synergy de 10 millones de euros concedida por el Consejo Europeo de Investigación para un periodo de seis años, la primera de este tipo específicamente dedicada a estudios judíos.

El objetivo de MiDRASH no se limita a pasar a limpio viejos textos. Como explica uno de sus responsables, el profesor Daniel Stökl Ben Ezra, la ambición es reconstruir la cultura literaria judía medieval del libro, rastreando qué autores citan a otros, cómo circulan los comentarios rabínicos (midrashim) entre comunidades musulmanas y cristianas o de qué manera se transforman las tradiciones escritas a lo largo de los siglos.

Para hacerlo posible, el equipo ha optado por trabajar dentro de la plataforma de código abierto eScriptorium, diseñada para la transcripción automática de manuscritos e inscripciones. Sobre esa base, desarrollan modelos específicos para la escritura hebrea medieval, entrenados con miles de transcripciones elaboradas manualmente por especialistas durante años. El resultado es un sistema que puede segmentar líneas y palabras en imágenes antiguas y convertirlas en texto editable.

Los responsables subrayan que, aunque las transcripciones iniciales contienen errores —algo inevitable con caligrafías irregulares, fragmentos rotos o tintas desvaídas—, su utilidad práctica es enorme: permiten localizar rápidamente pasajes bíblicos, secciones del Talmud, cartas, contratos o textos litúrgicos, algo que antes requería una lectura paciente página a página.

De los microfilms a las plataformas abiertas: un largo camino

digitalizacion manuscritos judios medievales

La actual revolución digital de los manuscritos judíos medievales no surge de la nada. La propia Biblioteca Nacional de Israel recuerda que ya en 1950, bajo el impulso del primer ministro David Ben-Gurión, se creó el Instituto de Manuscritos Hebreos Microfilmados. Dado que no era realista trasladar físicamente todos los fondos a Jerusalén, la solución fue fotografiar en microfilm cuantas colecciones fuera posible, sentando las bases de un gran archivo visual.

Con el paso de las décadas se incorporaron unas 1.500 colecciones de diversas procedencias, y a partir de 2006 el material de la Genizá de El Cairo se integró en el llamado Proyecto Friedberg Geniza, que aceleró la digitalización sistemática. En 2014, la Biblioteca Nacional inició la conversión de su archivo fotográfico en una colección digital accesible en la web, lo que permitió por primera vez que cualquier usuario buscara y viera en línea miles de manuscritos hebreos.

MiDRASH se apoya directamente en ese trabajo previo. Sobre la infraestructura de Ktiv —que ya concentraba en una sola base de datos la mayor parte de los manuscritos hebreos conocidos—, el equipo utiliza algoritmos de aprendizaje automático para identificar letras, palabras y estructuras textuales. Esta combinación de archivo centralizado y herramientas computacionales avanzadas evita uno de los grandes problemas que existen en otros campos, como el estudio de manuscritos árabes, donde el material se halla mucho más disperso.

La doctora Tsafra Siew, responsable de proyectos de investigación en la Biblioteca Nacional, define MiDRASH como un auténtico punto de inflexión para cualquiera que trabaje con manuscritos hebreos medievales. A su juicio, el salto no consiste solo en hacer más cómodo el acceso, sino en permitir tipos de análisis que, por pura escala, eran imposibles cuando cada documento había de leerse a mano y casi en solitario.

Colaboración internacional y jornadas de transcripción

El proyecto MiDRASH funciona como un consorcio internacional que combina saberes técnicos y humanísticos. Entre los investigadores principales figuran el profesor Nachum Dershowitz (Universidad de Tel Aviv), el doctor Avi Shmidman (Universidad Bar-Ilan) y la profesora Judith Olszowy-Schlanger (Universidad de Oxford), además de los equipos de la Universidad de Haifa, la propia Biblioteca Nacional de Israel y el Princeton Geniza Project, dirigido por la profesora Marina Rustow.

Lejos de limitarse a un trabajo de laboratorio, la iniciativa está abriendo también vías de participación pública. Del 24 al 27 de noviembre se ha organizado en Jerusalén, con retransmisión en línea, un gran “Transcribe-a-thon” centrado en manuscritos hebreos medievales y modernos en escritura cursiva y semicursiva. Durante esas jornadas, voluntarios capacitados se dedican a revisar y corregir las transcripciones generadas por la IA.

Este enfoque colaborativo persigue un doble objetivo. Por un lado, mejorar la calidad y precisión de los textos; por otro, utilizar las correcciones humanas para seguir entrenando los modelos de reconocimiento, de modo que en el futuro se reduzca el número de fallos y se reconozcan mejor incluso las manos más problemáticas. La idea es que el sistema aprenda, poco a poco, de la experiencia acumulada de filólogos, paleógrafos y especialistas en hebreo.

La Biblioteca Nacional de Israel ha señalado que las transcripciones definitivas de la Genizá de El Cairo se incorporarán a Ktiv y se pondrán a disposición del público junto con las imágenes originales de cada manuscrito. De esta manera, cualquier investigador podrá cotejar lo que ve la máquina y lo que se aprecia en el facsímil, manteniendo la transparencia y permitiendo nuevas lecturas o correcciones futuras.

Nuevas preguntas para una vieja historia

Una vez superada la fase de transcripción masiva, los responsables del proyecto aspiran a ir mucho más allá del mero acceso. El plan es poder realizar análisis lingüísticos y textuales a gran escala: detectar cadenas de citas, identificar paráfrasis, reconstruir itinerarios de ideas o seguir la evolución de determinados motivos teológicos y legales a través de los siglos.

En la práctica, esto significa que los manuscritos judíos medievales dejan de ser solo piezas aisladas en estanterías o archivos digitales y pasan a funcionar como una red interconectada de textos. La IA ayuda a localizar patrones, semejanzas y recurrencias que se perderían en una lectura puramente individual, mientras que los especialistas aportan el contexto histórico y filológico para interpretar lo que esas conexiones significan.

Algunos de los intereses concretos del equipo pasan por seguir la trayectoria de los midrashim, los relatos y comentarios rabínicos que circulaban entre comunidades judías en territorios musulmanes y cristianos. Poder mapear cómo varían las versiones de un mismo texto según la región o la época abre la puerta a entender mejor los contactos culturales, los conflictos internos y las reinterpretaciones doctrinales que se dieron en la Edad Media.

Los investigadores insisten en que la transcripción automática, aun con sus imperfecciones, es solo el comienzo. Sobre esa capa básica se podrán realizar estudios comparativos de vocabulario, sintaxis o estilos de escritura, pero también análisis sociales y económicos a partir de cartas, contratos comerciales o documentos legales que, hasta ahora, apenas se habían explorado de manera sistemática.

Impacto global y oportunidades para Europa

Aunque el proyecto nace y se coordina desde Israel, sus efectos alcanzan de lleno a la comunidad académica europea. La beca ERC Synergy que financia MiDRASH se enmarca en la política de la Unión Europea de apoyar infraestructuras digitales para las humanidades, y varios de los investigadores principales trabajan en universidades de Francia, Reino Unido y otros países.

Para especialistas europeos en historia del Mediterráneo, del judaísmo medieval o del islam clásico, disponer de una base de datos tan amplia y consultable supone un cambio notable. Hasta ahora, reconstruir la vida de las comunidades judías que vivían en territorios musulmanes —donde llegó a residir el 90 % de la población judía medieval— exigía desplazamientos y acceso restringido a archivos. Con la apertura progresiva de Ktiv, buena parte de ese material se vuelve accesible desde cualquier campus o centro de investigación.

Además, la metodología desarrollada en MiDRASH ofrece un modelo que puede extenderse a otros fondos documentales europeos: desde colecciones de manuscritos latinos hasta archivos notariales o eclesiásticos. La idea de combinar digitalización, transcripción automática y colaboración pública se perfila como una vía replicable para preservar y estudiar otros patrimonios en riesgo de deterioro.

Los responsables del proyecto confían en que la publicación de resultados en revistas científicas revisadas por pares consolidará este enfoque dentro de los estándares académicos. Mientras tanto, el acceso abierto a las imágenes y transcripciones promete facilitar trabajos conjuntos entre universidades de Israel, Europa y América, generando redes de investigación más amplias en torno a los manuscritos judíos medievales.

El avance de la inteligencia artificial aplicada a la Genizá de El Cairo y a otros manuscritos hebreos convierte un archivo casi inabarcable en una fuente viva y en expansión. Lo que antes exigía años de lectura minuciosa ahora puede rastrearse en segundos, sin que eso reste peso al trabajo experto, sino más bien al contrario: libera tiempo para plantear preguntas más complejas y para interpretar en profundidad un patrimonio que, poco a poco, deja de ser un tesoro oculto para convertirse en un recurso compartido a escala mundial.

manuscritos-0
Artículo relacionado:
Nuevos hallazgos y tecnologías en el estudio de manuscritos históricos