Des articles

Un nouveau logiciel permet de dater des manuscrits médiévaux à partir de mots populaires

Un nouveau logiciel permet de dater des manuscrits médiévaux à partir de mots populaires



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Par Jessica Lewis

De hepcat à slacks, de droit à whassup, les mots et les phrases ont aidé les romanciers et les cinéastes à évoquer un moment ou un lieu particulier. Maintenant, des chercheurs de l'Université de Toronto ont développé un logiciel qui peut déterminer avec soin et de manière fiable les dates de documents britanniques médiévaux en fonction de l'apparence de mots ou d'expressions populaires.

U de T Centre d'études médiévales et le Documents of Early England Data Set (DEEDS) Project a fait appel à Gelila Tilahun pour développer un logiciel qui déchiffrerait leur base de données d'environ 10000 documents de charte et de propriété britanniques, qui datent tous d'environ 1066 jusqu'aux années 1400, la majorité étant de 1100 à 1300.

Tilahun, qui faisait son doctorat au Département des sciences statistiques, a créé le logiciel qui utilise la base de données DEEDS comme source. Lorsque son logiciel reçoit un texte non daté, il agrège la probabilité d'occurrence des mots et des phrases du texte à chaque période, puis estime que la date du texte est la valeur temporelle qui maximise les probabilités agrégées.

Être capable d'estimer la probabilité d'occurrence d'un mot ou d'une phrase signifie que l'évolution de l'utilisation des termes populaires peut être examinée. Par exemple, la forme d'adresse «Francis et Anglicis» (français et anglais) était couramment utilisée par les barons français et anglais pour s'adresser à leurs ouvriers et / ou soldats à partir du milieu des années 1100. Lorsque la Normandie a été perdue au profit de la France en 1204 et que les Anglais n'ont plus de terres foncières en Normandie, la forme d'adresse a progressivement disparu de l'usage.

«L'idée est que la langue évolue avec le temps. Certains mots et certaines phrases finissent par mourir et d'autres continuent », dit-elle. «Ces mots ont leur propre vie. C’est incroyable de voir comment nous pouvons déchiffrer la date d’un document en fonction de l’évolution de l’usage des mots. »

La datation de ces types particuliers de documents s'est avérée être un défi. «Les Britanniques n'ont jamais daté leurs documents. Il existe plus d'un million de documents et personne ne sait quand ils ont été rédigés », explique Tilahun. «Vous ne pouvez pas utiliser de styles d’écriture ou de sceaux, car beaucoup de ces documents ne sont pas sur leur parchemin d’origine. Ces documents passeraient par différents monastères - les gens viendraient avec un contrat qui les lie à leur propriété - mais tout s'est finalement détérioré, de sorte que les scribes en écrivaient continuellement à la main de nouvelles copies. Maintenant, tout ce que nous avons, ce sont les mots.

L'objectif est de mettre le logiciel en ligne afin que n'importe qui puisse soumettre un document à dater. Tilahun dit qu'ils travaillent également sur la modification de l'algorithme pour déterminer d'où vient le document.

L’article de Tilahun sur le projet, «Dating Medieval English Charters», co-écrit par Andrey Feuerverger et Michael Gervers de l’U of T, a été publié dans un récent numéro de Les annales de la statistique appliquée. .

Source: Université de Toronto


Voir la vidéo: Comment La France se rend-elle complice du conflit au Yémen? - #AMFiS2019 (Août 2022).