Extraction Wikisource

La plateforme collaborative Wikisource contient de très nombreux textes littéraires libres de droits. L'outil ci-dessous permet de constituer un corpus à partir de ces textes, en renseignant leur URL.

Création rapide

Cette option permet de générer un corpus aléatoire parmi les œuvres en français de Wikisource.

1

A partir d'URL(s)

Copier ici les URLs des textes à collecter. Il est possible de collecter un texte intégral à partir d'un sommaire [exemple]. Dans ce cas, cocher la case Sommaire en face de l'Url indiquée.

Ajouter URL
Tâches suivantes
×

Tâches suivantes

Extraire les entités nommées
Étiqueter en parties du discours
Teinte - Conversion en TEI-XML
Visualisation