Informations sur le projet ANR ORIFLAMMS
Ontology Research, Image Features,
Letterform Analysis on Multilingual
Medieval Scripts
Participants au projet
Bres Stéphane - LIRIS
Eglin Véronique - LIRIS
Lebourgeois Frank - LIRIS
Leydier Yann - CoReNum
Description détaillée du projet
Le projet ORIFLAMMS (Ontology Research, Image Features, Letterform Analysis on Multilingual Medieval Scripts) rassemble trois laboratoires SHS, trois laboratoires STIC et une société industrielle pour étudier les écritures du Moyen Âge et le multilinguisme médiéval dans une approche interdisciplinaire et novatrice. À la rencontre d’enjeux épistémologiques, scientifiques, technologiques, industriels et sociétaux, ORIFLAMMS analyse l’évolution des systèmes et formes graphiques des écritures du Moyen Âge selon leur contexte de production (écritures usuelles, diplomatiques ou livresques) et leur langue (latin ou vernaculaire). Il établit une ontologie des formes et une analyse des structures graphiques des écritures pour passer d’une approche linéaire (textuelle) à une approche visuelle pour répondre aux interrogations des linguistes, historiens des écritures et chercheurs en reconnaissance des formes. Un exemple du type d'images que nous traitons dans ce projet est présenté sur la figure 1 ci-dessous.
Figure 1. Exemple d'images du projet ORIFLAMMS. La première image est un zoom sur une partie de la seconde.
Réalisations
Un outil d'alignement
Le projet ANR Oriflamms a permis le développement d’un outil interactif d’alignement du texte numérisé et de sa transcription encodée en XML (figure 2).
Figure 2. Copie d'écran du logiciel d'alignement. Il permet la correspondance entre la version image du texte et sa version transcrite en XML.
Cette interface produit un alignement automatique qu’il est possible de modifier manuellement en déplaçant les extrémités des limites entre mots, (figure 3).
Figure 3. Copie d'écran du logiciel d'alignement. Il permet l'édition visuelle de parties du contenu du fichier XML.
Un outil de visualisation des occurrences
Un second outil de visualisation des occurrences de mots identiques a été conçu comme interface de validation de l’alignement. Il permet de réaliser des corrections de façon interactive par l’expert SHS (figure 4)
Figure 4. Copie d'écran du logiciel de visualisation des occurrences des mots. Il permet la validation/correction de l’alignement par visualisation de mots identiques. fichier XML.