Comment l'IA aide à déchiffrer les inscriptions anciennes

Table des matières:

Comment l'IA aide à déchiffrer les inscriptions anciennes
Comment l'IA aide à déchiffrer les inscriptions anciennes
Anonim

Clé à emporter

  • Un nouvel outil basé sur l'IA pourrait aider les historiens à déchiffrer les textes anciens.
  • Ithaca est le premier réseau neuronal profond capable de restaurer le texte manquant d'inscriptions endommagées, d'identifier leur emplacement d'origine et d'aider à établir la date à laquelle elles ont été créées.
  • L'IA est utile pour remplir les données manquantes comme l'emplacement et la date du texte, car elle est bonne pour apprendre des modèles très complexes en analysant les données.
Image
Image

Les progrès récents de l'intelligence artificielle (IA) alimentent les efforts pour comprendre le passé.

Ithaca, un modèle d'apprentissage automatique construit par des chercheurs en intelligence artificielle de DeepMind, peut deviner les mots manquants ainsi que l'emplacement et la date du langage écrit, selon un nouvel article. Cet effort pourrait aider les historiens à déchiffrer les manuscrits anciens.

« Ithaca est un réseau neuronal profond, et en tant que tel, il est incroyablement capable de trouver des modèles cachés dans de grandes quantités de données », a déclaré l'historienne Thea Sommerschield, co-auteur du récent article, à Lifewire dans un e-mail. interview. "Ces modèles peuvent être textuels (grammaticaux, syntaxiques ou liés à une "formule" répétée dans de nombreux textes) ou contextuels (certains mots apparaissant systématiquement dans certains genres de textes: par exemple, un décret politique de l'Athènes classique mentionnant les mots "alliance, conseil, assemblée…')."

Révéler le passé

Ithaca est le premier réseau neuronal profond capable de restaurer le texte manquant des inscriptions endommagées, d'identifier leur emplacement d'origine et d'aider à établir la date à laquelle elles ont été créées, a déclaré Sommerschield.

Ithaque porte le nom de l'île grecque de l'Odyssée d'Homère. Les chercheurs ont découvert qu'Ithaca atteint une précision de 62 % dans la restauration des textes endommagés, une précision de 71 % dans l'identification de leur emplacement d'origine et peut dater les textes à moins de 30 ans de leur date d'origine.

Les aides à la visualisation d'Ithaca sont destinées à faciliter l'interprétation des résultats par les chercheurs. Les auteurs de l'article ont écrit que les historiens atteignaient une précision de 25 % lorsqu'ils travaillaient seuls pour restaurer des textes anciens. Mais, les performances de l'historien augmentent à 72 % lors de l'utilisation d'Ithaca, surpassant les performances du modèle et montrant le potentiel de coopération homme-machine.

« Ithaca propose des résultats interprétables, mettant en évidence l'importance croissante de la coopération entre les experts humains et l'apprentissage automatique, et montre comment l'association d'experts humains avec des architectures d'apprentissage en profondeur pour s'attaquer à des tâches en collaboration peut surpasser les performances individuelles (sans aide) des humains et modèle sur les mêmes tâches », a déclaré Sommerschield à Lifewire.

Par exemple, les historiens sont actuellement en désaccord sur la date d'une série de décrets athéniens importants pris à une époque où vivaient des personnages notables tels que Socrate et Périclès, a écrit Sommerschield dans un article de blog. On a longtemps pensé que les décrets avaient été rédigés avant 446/445 avant notre ère, bien que de nouvelles preuves suggèrent une date des années 420 avant notre ère. "Bien que cela puisse sembler être une petite différence, ces décrets sont fondamentaux pour notre compréhension de l'histoire politique de l'Athènes classique", a-t-elle écrit

Le travail le plus proche d'Ithaca est un ancien outil d'apprentissage automatique appelé Pythia que Sommerschield et ses collaborateurs ont publié en 2019. Pythia a été le premier modèle de restauration de texte ancien à utiliser des réseaux de neurones profonds.

"Aujourd'hui, Ithaca est le premier modèle à s'attaquer de manière holistique aux trois tâches centrales du flux de travail de l'épigraphe", a déclaré Sommerschield dans un e-mail. "Non seulement il fait progresser l'ensemble de pointe précédent de Pythia, mais il utilise également l'apprentissage en profondeur pour l'attribution géographique et chronologique pour la toute première fois et à une échelle sans précédent.”

L'IA pour aider les historiens

Image
Image

AI est utile pour remplir les données manquantes comme l'emplacement et la date du texte, car il est bon pour apprendre des modèles très complexes en analysant les données, a déclaré Brad Quinton, PDG de la société d'IA Singulos Research, à Lifewire par e-mail.

« En utilisant des techniques d'apprentissage automatique, l'IA peut parcourir un grand nombre d'exemples « bien connus » pour trouver des modèles entre, par exemple, un texte donné et sa date et son lieu de création », a ajouté Quinton. "Souvent, ces modèles sont si complexes qu'ils ne seraient pas évidents pour un expert humain."

La prédiction des données manquantes est une tâche courante pour l'IA basée sur l'apprentissage automatique. Par exemple, GPT-3 d'OpenAI peut prédire les mots manquants dans une phrase ou même les phrases manquantes dans un paragraphe. Et de nombreux systèmes de traitement d'image basés sur l'IA ont été utilisés pour restaurer la vidéo et les images en prédisant intelligemment ce qui a été perdu de l'original.

Conceptuellement, les chercheurs pourraient utiliser des techniques similaires pour déterminer la date et l'origine de l'art ou des outils, ou d'autres artefacts historiques fabriqués par l'homme où l'on s'attend à un changement dans le style et la technique sous-jacents au fil du temps et selon l'emplacement de origine », a déclaré Quinton.

Conseillé: