Cet outil permet d'identifier les entités nommées d'un corpus en utilisant au choix trois modèles : Spacy, Flair, ou un modèle Bert. Le corpus peut être au format texte ou au format XML-TEI. Dans ce dernier cas, les entités seront annotées directement dans le texte avec la balise <Entity> avec leur type en attribut annotation. A noter que ce processus ne conserve pas la structuration et le formatage à l'intérieur des balises parcourues ; tous les formatages à l'extérieur de ces balises sont en revanche restitués.
L'utilisation de cette balise <Entity> rend utilisable le XML en sortie dans la plateforme Ariane.
Voir la documentation complète
Traitement en cours...