L’IA, “Indiana Jones” du futur - Laurent Lucien

Tous les mois, Laurent LUCIEN, expert AI For Tomorrow, docteur et consultant en Intelligence Artificielle, chercheur et blogueur, écrit sur l’actualité de l’intelligence artificielle pour AI For Tomorrow.


Le 21 avril dernier, des chercheurs de l’université de Groningen (Pays-Bas) ont publié les résultats de leurs recherches sur les Manuscrits de la Mer Morte [1]. Après analyses, il semblerait qu’ils aient été écrits par deux scribes distincts. Comment s’y sont-ils pris ? En faisant appel à des algorithmes d’intelligence artificielle ! Plus généralement, les archéologues utilisent de plus en plus ces nouvelles techniques pour les aider dans leurs travaux. Essayons de passer en revue les différents apports.



Paléographie

Petit rappel historique : Découverts entre 1947 et 1956 dans les grottes de Qumran, sur les rives nord-ouest de la mer Morte, les manuscrits datent du IVème siècle avant J.-C. au IIIème siècle après J.-C. et sont considérés comme la plus ancienne version connue de l’Ancien Testament. Le Livre d’Isaïe, écrit en hébreu et le seul presque complet, s’étale sur 17 feuilles de parchemin [2].

Détail du Grand Rouleau d'Isaïe. ©Ardon Bar Hama/Musée d'Israël, Jérusalem


Pour lancer l’analyse, il a déjà fallu numériser le document. Ce fut fait par le Musée d’Israël et Google dans le cadre du Dead Sea Scrolls Digital Project [3]. À partir de cette numérisation, l’équipe d’universitaires de Groningen a utilisé des techniques d’analyse développées dans le cadre du projet The Hands that Wrote the Bible, financé par le Conseil européen de la recherche [4]. Une intelligence artificielle a analysé l’écriture manuscrite et mis en évidence de minuscules variations des traits d’encre. L’étude du style d’écriture, habituellement réalisée par des experts, est toujours un peu subjective et moins précise. Par exemple, le parchemin ici étudié contient la lettre hébraïque aleph au moins 5 000 fois et il est impossible de toutes les comparer à l’œil nu.

Étude des lettres aleph (première lettre de l’alphabet hébreu) du Grand Rouleau d’Isaïe ©Maruf A. Dhali, Université de Groningen


Les scientifiques ont utilisé cette nouvelle technologie pour examiner chaque aleph et ont complété les résultats avec des analyses statistiques. Conclusion, deux mains différentes semblent avoir écrit le texte hébraïque. Un scribe a rédigé la première moitié du manuscrit puis un second l’a continué en commençant une nouvelle feuille d’un nouveau chapitre du Livre [5].


Impact de l’IA sur la recherche en archéologie

Comme dans la plupart des domaines scientifiques, l’intelligence artificielle se fait une place de choix en archéologie. Le nombre de publications mentionnant son utilisation a explosé depuis le début des années 2000. On remarquera l’augmentation plus marquée à partir de 2015. Cela correspond à l'avènement des techniques de Machine Learning en particulier et la possibilité d’utiliser des moyens informatiques toujours plus performants et abordables.

Nombre de publications sur L’IA archéologique depuis 2000 (source : Web of Science)


On retrouve l’IA dans l’analyse de documents écrits comme nous l’avons vu précédemment avec la paléographie mais aussi pour trier, classer, comparer voire ré-assembler des ossements, des artefacts divers ou bien localiser des sites archéologiques à partir d’images satellites ou aériennes [6]. Listons maintenant quelques exemples.


Étude de restes humains

Une partie du travail des archéologues est l’analyse des divers ossements retrouvés sur les sites de fouilles. Il est souvent difficile de pouvoir identifier et ré-agencer les pièces du puzzle. Des algorithmes d’intelligence artificielle peuvent aujourd’hui aider les anthropologues à reconstituer les crânes et autres squelettes. La technique la plus employée est l’apprentissage profond avec des réseaux de neurones à convolution (CNN). Pour entraîner les modèles, les scientifiques exploitent des bases de données 2D et 3D regroupant des informations sur l’anatomie d’hommes et de femmes, âgés de 18 à 60 ans, issus de différentes ethnies. Ces modèles sont ensuite utilisés pour déterminer le sexe à partir des éléments du squelette ou pour prédire la stature des individus à partir de la dimension des os [6].


Reconstruction d’artefacts

Dans le cadre du projet ArchAIDE pour Archaeological Automatic Interpretation and Documentation of cEramics, achevé en 2019, les chercheurs ont conçu une application qui, à partir d’une simple photographie de tesson, propose à l’archéologue cinq hypothèses d’identification, assorties d’un degré de certitude. L’apprentissage a été réalisée à partir de 25000 photos de tessons [7]. Sur le même thème, Marie-Morgane Paumard (jeune docteure en archéologie) a conçu une nouvelle méthode de reconstruction automatique d’objets basée sur du Deep Learning. Elle a développé deux approches : un modèle composé de deux réseaux convolutifs siamois entraînés à prédire la position relative de deux fragments et une méthode itérative d’apprentissage profond par renforcement [8].


Reconstruction de textes

Une équipe de chercheurs israéliens s’est servie d’algorithmes de traitement automatique du langage NLP (Natural Language Processing) pour restaurer des écrits cunéiformes babyloniens du VIème au IVème siècle avant J.-C. sur tablettes d’argile en identifiant les mots manquants sur les parties endommagées. Leur modèle utilisant un réseau de neurones récurrent (RNN) serait efficace à près de 90% dans le cas de courts textes administratifs (contrats, reçus, procédures légales, etc.) dont la syntaxe est très structurée et caractéristique. La phase d'entraînement a nécessité un ensemble de 1400 textes (version cunéiforme et latine). Il sera certainement possible à terme de restaurer des textes plus complexes en augmentant le contenu de la base d’apprentissage [9].


Identification de sites archéologiques

Pour localiser des milliers de tombes d’anciens rois nomades, datant de 3 000 ans, disséminées sur des millions de kilomètres carrés en Russie, en Chine et en Mongolie, une équipe suisse a utilisé un modèle de réseau de neurones à convolution entraîné avec des milliers de photos satellites [10]. Qui ne connaît pas la plaine de Nazca au Pérou et ses géoglyphes ? Des chercheurs d’IBM Research et de l’Université de Yamagata au Japon collaborent afin d’améliorer nos connaissances et notre compréhension de ces mystérieux dessins. Utilisant des algorithmes de Machine Learning et des données géospatiales, le projet a déjà abouti à la découverte d’un nouveau géoglyphe [11]. Les océans ne sont pas délaissés. En effet, l’Intelligence Artificielle permet aussi des visites virtuelles et l’exploration de sites sous-marins comme avec le projet européen VENUS pour Virtual ExploratioN of Underwater Sites [12].


Plateforme MASA

MASA pour Mémoires des Archéologues et des Sites Archéologiques se veut au service de la communauté archéologique. Cette initiative est née du besoin impérieux de sauvegarder les archives des archéologues et des sites archéologiques. [13] MASA s’est organisé en 3 phases. Entre 2013 et 2016, les différents partenaires ont été mobilisés pour le traitement des archives et des données archéologiques. Entre 2017 et 2020, le projet a consisté à réunir ces briques pour constituer un écosystème numérique selon le cycle de vie des données, conforme aux principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable). A partir de 2021, MASA va s’attacher à diffuser les outils et les bonnes pratiques auprès de la communauté archéologique.


Apports réels mais des limitations

Nicolas Priniotakis, enseignant-chercheur à l’université de Cergy-Paris où il a créé une licence professionnelle Patrimoine, visualisation et modélisation 3D, qui a vocation à utiliser l’image pour produire et transmettre de la connaissance patrimoniale, notamment en archéologie, se montre enthousiaste mais également lucide sur les apports de l’intelligence artificielle [14]. « L’IA pourrait également nous permettre de trouver des résultats hors-champ. Par exemple en croisant des corpus de données d’origines diverses, à l’image de la variété de disciplines qui nourrissent l’archéologie. On pourrait par exemple tenter de prédire la position de vestiges archéologiques souterrains [..], en créant une cartographie des zones probables à partir du croisement de données existantes comme les strates géologiques, la géographie du lieu, la présence d’eau, les mouvements de transhumance, la localisation de carrières… » Cependant : « L’archéologie est une science de cas particuliers, la notion d’automatisation de tâche n’est pas forcément pertinente. Par ailleurs, le résultat d’une recherche est souvent un empilement d’hypothèses, le cheminement déductif, par exemple pour une datation, a son importance. Il faut pouvoir discuter des hypothèses en jeu, on ne peut pas se satisfaire d’une boîte noire. »


Conclusion

L’archéologie, comme pour la plupart des domaines de recherche, est un nouveau terrain de jeu et d’expérimentation pour les programmes d’Intelligence Artificielle. Ils ont démontré leur utilité, leur pertinence et leur efficacité, au travers notamment des différents exemples exposés dans cet article. Toutefois, c’est aussi une science à part où la contextualisation des indices et l’interprétation des détails sont aussi importantes que les fouilles en elles-mêmes. En définitive, je ne suis pas sûr que l’IA devienne un jour Indiana Jones (il lui manquera également le chapeau et le fouet) mais elle pourrait tout à fait devenir le Henry Jones du futur (NB : le père du personnage d’Indiana Jones, incarné au cinéma par Sean Connery, qui était plus absorbé par ses recherches et ses analyses que par le monde qui l’entourait).


Lire sur Medium


Laurent LUCIEN ,

Expert AI For Tomorrow,

Docteur et consultant en Intelligence Artificielle, chercheur et blogueur


Bibliographie

[1] https://www.courrierinternational.com/article/origines-un-secret-des-rouleaux-de-la-mer-morte-revele-par-lintelligence-artificielle

[2] https://fr.wikipedia.org/wiki/Manuscrits_de_la_mer_Morte

[3] http://dss.collections.imj.org.il/

[4] https://cordis.europa.eu/project/id/640497/fr

[5] https://www.connaissancedesarts.com/monuments-patrimoine/archeologie/israel-un-secret-des-manuscrits-de-la-mer-morte-perce-a-laide-de-lintelligence-artificielle-11156048/

[6] https://link.springer.com/content/pdf/10.1007/s42979-020-00286-w.pdf

[7] https://cordis.europa.eu/article/id/411445-tool-that-is-an-archaeologist-s-dream/fr

[8] https://perso-etis.ensea.fr/paumard/thesis.pdf

[9] https://www.i24news.tv/fr/actu/israel/1599658909-israel-des-chercheurs-reconstituent-des-textes-babyloniens-a-l-aide-de-l-intelligence-artificielle

[10] https://www.sciencedirect.com/science/article/abs/pii/S0305440319300846?via%3Dihub

[11] https://www.ibm.com/blogs/research/2019/11/nasca-lines-geoglyphs/

[12] https://cordis.europa.eu/project/id/034924/fr

[13] https://www.iledefrance-meudon.cnrs.fr/fr/cnrsinfo/memoires-des-archeologues-et-des-sites-archeologiques-le-consortium-masa-au-service-de-la

[14] https://dataanalyticspost.com/ia-investit-archeologie/