Reconnaissance d'entités nommées

Cet outil permet d'identifier les entités nommées d'un corpus en utilisant au choix trois modèles : Spacy, Flair, ou un modèle Bert. Le corpus peut être au format texte ou au format XML-TEI. Dans ce dernier cas, les entités seront annotées directement dans le texte avec la balise <Entity> avec leur type en attribut annotation. A noter que ce processus ne conserve pas la structuration et le formatage à l'intérieur des balises parcourues ; tous les formatages à l'extérieur de ces balises sont en revanche restitués.

L'utilisation de cette balise <Entity> rend utilisable le XML en sortie dans la plateforme Ariane.

Voir la documentation complète

Entités nommées (fra)

Format de votre corpus

Structure du document XML


Moteur de REN


Déposer le(s) fichier(s) ou cliquer ici.

Traitement en cours...