La nouvelle intelligence artificielle de DeepMind, entreprise appartenant à Google, offre aux historiens un puissant pour l’interprétation du passé.
Nommé Ithaca, le système d’IA développé par DeepMind permet de déterminer la localisation et d’effectuer la restauration d’anciens textes grecs avec une précision de 72%. Ithaca est en outre capable de dater les inscriptions à moins de 30 ans de leur âge réel.
L’IA de DeepMind restaure et identifie les textes anciens
Pour développer ce nouvel outil d’IA, Google DeepMind a collaboré avec des universitaires spécialisés dans les textes classiques. Ithaca consiste en un système de réseaux de neurones artificiels profonds qui aide les historiens à déchiffrer le texte d’inscriptions endommagées de la Grèce antique. Cette nouvelle intelligence artificielle se base sur un système de restauration antérieur nommé Pythia.
Ithaca n’aide pas seulement les historiens à restaurer un texte. Cette IA peut également identifier le lieu d’origine d’un texte et sa date de création, indique un article publié par l’équipe de recherche dans la revue Nature.
L’équipe de recherche a publié une version interactive en ligne et le code source ouvert d’Ithaca.
De nombreuses sources anciennes, écrites sur des rouleaux, des papyrus, de la pierre, du métal ou de la poterie, sont tellement endommagées que d’importants pans de textes sont souvent illisibles. Déterminer l’origine des textes anciens peut également être un défi en raison des nombreux déplacements de ceux-ci. En outre, la datation au carbone et les méthodes similaires ne permettent pas de déterminer avec précision leur production car elles peuvent endommager ces artefacts inestimables.
« Ces inscriptions sont des témoignages de la pensée, de la langue, de la société et de l’histoire des civilisations passées », a expliqué Théa Sommerschield de l’Université Ca’ Foscari de Venise en Italie. « Cependant, la majorité des inscriptions qui ont survécu ont été endommagées au cours des siecles. Par conséquent, leurs textes sont maintenant illisibles ou fragmentaires. Par ailleurs, ils peuvent avoir été déplacés de leur lieu d’origine ou avoir fait l’objet de trafics divers. »
Fonctionnement d’Ithaca de DeepMind
Lorsqu’ils récupèrent un texte, les historiens cherchent à atteindre trois objectifs. Ces derniers sont la restauration du texte, sa datation et son lieu d’origine. Pour cela, ils étudient et recherchent les traits et motifs distinctifs dans le style d’écriture. Par la suite, ces données sont comparées à celles d’anciens textes déjà restaurés et datés.
« Un humain éprouve des difficultés pour exploiter l’ensemble des données pertinentes existantes et pour découvrir les modèles sous-jacents à chaque fois », a déclaré Sommerschield.
Les scientifiques ont collaboré avec des chercheurs de DeepMind pour que l’IA d’apprentissage automatique Ithaca soit capable d’atteindre les trois objectifs.
Pour la formation d’Ithaca, les scientifiques ont eu recours à un groupe d’anciens textes grecs déjà étudiés et dont la datation est située entre 700 av. J.-C. et 500 ap. J.-C. Les chercheurs ont ensuite masqué certains caractères dans les textes. Les prédictions d’Ithaca pour ces textes masqués ont ensuite été comparées avec les inscriptions anciennes réelles.
Par après, les chercheurs ont eu recours à un ensemble de données de près de 8.000 inscriptions déjà étudiées. Ces données ont servi lors de tests de performance d’Ithaca seul ou assisté de deux historiens spécialisés dans les textes anciens. Les résultats ont montré qu’Ithacha, à lui seul, était capable de restaurer les textes avec une précision de 62%.
Toutefois, les restaurations ont été les plus précises lorsque la nouvelle intelligence artificielle de DeepMind a travaillé avec les historiens.
Lors d’une utilisation d’Ithaca par les historiens, la performance concernant la restauration de texte a atteint 72%, a expliqué Sommerschield. Par ailleurs, Ithaca a été capable de prédire avec une précision de 71% le lieu d’origine en Méditerranée d’un texte. L’IA a pu dater ces textes à moins de 30 ans de leur véritable date de création.
Méthode révolutionnaire
Les chercheurs ont expliqué que la méthode Ithaca permet de réaliser des améliorations significatives par rapport aux méthodes traditionnelles uniquement humaines. Toutefois, il est encore nécessaire de réaliser plus de tests avec d’autres historiens. En outre, les utilisateurs devront suivre une formation technique pour être capables d’utiliser cet outil.
Il s’agit cependant d’une avancée considérable pour la restauration d’un texte ancien. Les spécialistes des textes anciens n’ont plus qu’à saisir un texte sur l’interface en ligne pour obtenir des visualisations utilisables. Enfin, Ithaca devrait ètre développé dans n’importe quel langue et sur tous types de supports écrits.