Corpus Unitex anglais

Documents ISTEX servant à évaluer la détection d’entités nommées par Unitex-CasSys.

v1

Nombre de documentsistex:quantityOfItems
/api/run/count-all
Description du corpus

Type de corpusdcterms:type
Corpus gold
Domaine(s)dbpedia:domain

Multidomaines

Anglais
Destinataire(s)istex:addressee
Inist-CNRS, équipe ISTEX-RD.
Evaluer la qualité de la détection d’entités nommées par l'outil Unitex-CasSys, dont les cascades ont été construites par le Laboratoire d'Informatique de l'Université François Rabelais de Tours dans le cadre d'un partenariat avec ISTEX.
  • Annotation manuelle du corpus pour comparaison avec le corpus annoté par Unitex
  • Les offsets des entités nommées pour chaque document sont téléchargeables ici
Méthode de constitution du corpus

Critères
  • Choix de documents contenant les entités nommées choisies dans ISTEX :
    • noms de personnes
    • noms de lieux administratifs et géographiques
    • organismes, organismes financeurs, organismes fournisseurs de ressources
    • dates
    • url
    • pointeurs vers les références bibliographiques
    • références bibliographiques
  • Documents en français.
La requête
NB : Cette requête peut être réutilisée telle quelle sur le démonstrateur ISTEX ou directement sur l'API ISTEX en ajoutant le préfixe "https://api.istex.fr/document/?q=".
Comment citer ce corpus

Institut de l'information scientifique et technique - UPS 76 (Inist-CNRS) (2018) : Corpus Unitex anglais (Documents issus d'ISTEX pour l’évaluation de la détection d’entités nommées par l’outil Unitex-CasSys.). ISTEX - data.istex.fr, https://unitex-collection.corpus.istex.fr/ark:/67375/VH5-1WLG8S8N-L

Inist-CNRS
Contributeur(s)dcterms:contributor
Morale, Enza (collecteur de données)
Date de créationdcterms:created
2016-01-11
Date de publicationdcterms:issued
2018-12-17
Naviguer dans le contenu du corpus
Les graphiques ci-dessous permettent, d'une part, de visualiser la répartition des documents du corpus selon différents angles de vue bibliométriques et, d'autre part, de proposer un aperçu des valeurs trouvées dans les différentes catégories d'entités nommées.
Editeurs
Langue des documents
Types de publication
Types de documents
Mots-clés d'auteur
Catégories Science Metrix
Catégories Inist
Catégories Scopus
Catégorie Scopus - Niveau 1
Catégorie Scopus - Niveau 2
Catégorie Scopus - Niveau 3
Catégories WOS
Revues
Années de publication
Présence de XML structuré
Versions PDF
Scores de qualité
Entité nommée Nom de personne
Entité nommée Nom de lieu administratif
Entité nommée Nom de lieu géographique
Entité nommée Nom d'organisme
Entité nommée Nom d'organisme financeur
Entité nommée Nom d'organisme fournisseur de ressource
Entité nommée Date
Entité nommée url
Entité nommée Pointeur vers référence biblio
Powered by Lodex 9.3.8