Images archéologiques

IBISA

En plus de mes activités en informatique, je suis actif dans le domaine de l'archéologie en Aquitaine. Je suis membre de la Société archéologique de Bordeaux (fondée en 1873, reconnue d'utilité publique en 1915) depuis 1999, vice-président de sa section numismatique depuis 2005, et son président depuis janvier 2011. J'y étudie les monnaies antiques (grecques et romaines), et ai reçu la médaille de la Ville de Bordeaux en 2005 pour ces activités. En 2004, j'ai publié dans la Revue archéologique de Bordeaux intitulé : "Un outil informatique pour l'étude automatique de la correspondance des coins" (volume XCV, page 253). En 2006, après une conférence au Musée d'Aquitaine sur ce sujet, j'ai été contacté par Pierre Régaldo - Saint Blancard, du Service régional d'archéologie de la DRAC (Direction Régionale des Affaires Culturelles) Aquitaine. Il m'a mis en relation avec deux UMR CNRS du département des Sciences Humaines et Sociales de l'Université Bordeaux 3 : l'IRAMAT-CRP2A et Ausonius, qui avaient des problématiques archéologiques a priori différentes, mais mettant en jeu quasiment les mêmes méthodes informatiques. Cela a donné lieu à une collaboration dans le cadre des projets exploratoires pluridisciplinaires (PEPS) du CNRS, et plus précisément le projet IBISA (Image-Based Identification / Search for Archaeology) que j'ai porté de 2007 à 2009. Avec les moyens modestes alloués à ce projet, nous avons quand même pu montrer l'utilité d'une méthode d'analyse d'images pour leurs problématiques archéologiques. Ce projet s'est terminé avec une publication internationale dans le symposium EuroGraphics VAST (Virtual Reality, Archaeology and Cultural Heritage) 2009 - le projet IBISA ayant eu l'honneur de la couverture des actes de la conférence - montrant la faisabilité d'un projet bien plus ambitieux. En effet, la conclusion du projet exploratoire était que si la méthode informatique à la base du projet était prometteuse, il fallait en continuer l'étude (pour améliorer sa robustesse) en se donnant plus de moyens, et notamment en passant à une modélisation 3D, qui est maintenant possible (par des techniques de photogrammétrie par exemple).

Motivation archéologique

Au CRP2A sont notamment étudiés des carreaux estampés glaçurés, qui décoraient les sols des monuments médiévaux prestigieux. Pour réaliser ces carreaux, on appliquait dans de l'argile support rouge une matrice portant un motif en relief. Celui-ci était donc imprimé en creux dans l'argile support. Il était ensuite rempli d'argile blanche, recouvert d'un mélange glaçurant, puis cuit. Beaucoup de carreaux subsistent, mais très peu de matrices.

Au sein d'Ausonius sont notamment étudiées les monnaies antiques grecques et romaines. Toutes ces monnaies furent jadis frappées à partir de coins, matrices portant des motifs en creux et laissant des empreintes avers et revers sur un flan métallique. De très nombreusesmonnaies ont été retrouvées, mais rares sont les coins monétaires (matrices) qui sont parvenus jusqu'à nous.

Dans les deux cas, les archéologues constituent des bases de données d'images numériques des objets archéologiques, à des fins d'archivage ou de publication. Parallèlement, ils veulent pouvoir déterminer si deux objets - qui ont subi les outrages du temps (usure, casse, etc.) - proviennent de la même matrice, ou bien sont de même motif / style. À l'heure actuelle, la méthode utilisée est la comparaison visuelle des objets, reposant souvent sur l'interprétation subjective des motifs observés. Dans le cas de l'étude de plusieurs milliers d'objets, cela représente une tâche fastidieuse, engendrant erreurs (subjectivité et fatigue humaines aidant) et perte de temps... Savoir si deux objets proviennent de la même matrice - qui subissait également une usure - donne une information chronologique importante. L'utilisation de motifs de styles semblables est aussi une indication importante. Dans le cas des monnaies, le lien entre les matrices avers / revers donne aussi des informations précieuses. Dans le cas d'une étude d'un ensemble de nombreux objets trouvés dans le même contexte (pavement dans le cas des carreaux, trésor dans le cas des monnaies), on peut en apprendre beaucoup sur la manière dont ces objets ont été fabriqués (nombre total de matrices, ateliers de production) et échangés (contexte socio-économique), chronologiquement et géographiquement. Les liens entre objets et ensembles d'objets permettent de vérifier ou d'infirmer des hypothèses scientifiques, et ouvrent ainsi la voie à d'autres types de recherches (e.g. l'analyse des matériaux des objets).

Ma connaissance des représentations spectrales des signaux m'a permis de déceler le potentiel d'une méthode de vision par ordinateur, utilisée pour le recalage d'images, aux images archéologiques.

Représentations spectrales des images

La transformée de Fourier-Mellin permet de recaler des images obtenues l'une de l'autre par transformation rigide, et repose sur une représentation spectrale des images, avec les propriétés fondamentales suivantes :

Algorithme de recalage d'images

La clé de l'algorithme de recalage est l'estimation de la translation par la technique dite de "corrélation de phase", qui peut se résumer aux étapes suivantes :

  1. passer ces images en représentation spectrale (par transformée de Fourier) ;
  2. en calculer l'inter-corrélation (par corrélation croisée normalisée) ;
  3. puis repasser le résultat en représentation spatiale (par transformée de Fourier inverse).

Si les deux images sont obtenues l'une de l'autre par translation, en théorie on obtient une impulsion de Dirac dont les coordonnées sont celles du vecteur de la translation. En pratique, cela se traduit sous la forme d'un pic (maximum local), dont il convient donc d'estimer la position de la manière la plus précise possible. C'est possible avec une précision bien inférieure au pixel, grâce à des techniques de réallocation semblables à celles utilisées pour l'analyse à court terme des sons, et en n'oubliant pas que l'image discrète observée n'est jamais que le résultat de l'échantillonnage d'une image continue (les coordonnées cherchées étant bien des réels, et non des entiers).

L'algorithme de recalage d'images complet, dans le cas plus général d'images obtenues par transformation rigide (translation, rotation et homothétie), est alors le suivant :

  1. rechercher la rotation + homothétie
  2. inverser la rotation + homothétie ;
  3. rechercher la translation en absence de rotation et d'homothétie ;
  4. inverser la translation.
À la fin de ces étapes, les deux images sont recalées au mieux. Finalement, une mesure de similarité est calculée par inter-corrélation entre l'image obtenue et la référence ("similarité cosinus" fréquemment utilisée en fouille de textes).

Robustesse accrue et extension en 3D

Un autre avantage essentiel de passer par une représentation spectrale est la résistance au filtrage passe-bas (observé sur les images correspondant à des objets usés par le temps), au bruit (inévitable en conditions réelles), et dans une certaine mesure aux conditions d'éclairage (ombres dues à la position de la source lumineuse lors de la photographie de l'objet). Tout ceci fait de la méthode de recalage par Fourier-Mellin une candidate idéale pour des applications de reconnaissance d'objets archéologiques à partir de leurs images.

Pour s'affranchir le plus possible de conditions de prise de vues, les images sont en niveaux de gris (résistance à la colorimétrie, à la patine des objets archéologiques). Une piste de recherche extrêmement intéressante serait d'étendre la méthode en 3D. En effet, afin d'éviter le problème des conditions d'éclairage dans l'étape de recalage, on pourrait considérer non plus le niveau de gris de la photographie de l'objet, mais l'élévation de la surface du modèle 3D de l'objet, obtenu par photogrammétrie à partir de plusieurs images 2D.

Cela peut se faire en théorie en fixant l'objectif de prise de vues (par exemple perpendiculairement à l'objet), et en faisant varier la position de la source lumineuse à chaque image. Pour chaque pixel de chaque image, la direction de vue et de la lumière sont connues, et il est possible d'estimer la normale à la surface de l'objet par des lois d'optique classiques. Par intégration du champ des normales, on peut alors en retrouver l'élévation en chaque point de la surface.

Cela mène également à des images où l'interaction est possible. Par exemple, la séquence suivante a été obtenue à partir d'une unique image (de monnaie romaine) où les pixels sont modélisés avec des fonctions harmoniques hémi-sphériques (HSH) d'ordre 2 (l'ordre 0 correspondant au cas classique, non interactif).

HSH Rendering
Et si vous avez une connexion rapide, vous pouvez trouver un exemple de séquence obtenue à partir d'une image re-focalisable, avec des pixels modélisés avec des polynômes (PTM) de degré 6 (le degré 0 correspondant au cas classique, non interactif).
cliquez ici pour cet exemple