Collection Vieillissement

Description de la collection

Cette collection regroupe des corpus de documents ISTEX en texte intégral appartenant à la thématique du vieillissement.

La thématique du vieillissement était l’une de celles retenues en septembre 2014, lors de la première rencontre des partenaires du projet ISTEX (Laboratoire d’Informatique de Tours, Laboratoire d’Informatique de Nantes-Atlantique, Université de Lorraine, Université d’Aix-Marseille, Institut National de Recherche en Informatique et en Automatique, HUMA-NUM, INIST-CNRS). Il s’agit du vieillissement humain normal (psychologie, physiologie, gérontologie) et pathologique (médecine, gériatrie).

La première version du corpus Vieillissement a été créée fin 2014 alors que les documents du fonds ISTEX ne pouvaient pas encore être extraits via l’API. Les thématiques « Gerontology » et « Nursing » du Web of Science ont servi à la sélection des revues portant sur la thématique du vieillissement. Cette version comportait 7 434 documents, issus des revues de deux éditeurs scientifiques : Elsevier et Oxford University Press.

Les partenaires du projet ISTEX-R ont effectué des tests d’analyse diachronique sur cette première version, ce qui a mis en évidence une répartition chronologique des documents (1996 à 2001 pour Elsevier et de 2000 à 2010 pour Oxford University Press) ne permettant pas une recherche sur l’évolution diachronique de la thématique. Le corpus s’est alors vu enrichir de documents issus de revues de trois autres éditeurs scientifiques : Royal Society of Chemistry, Institute of Physics et Nature, ce qui a conduit à une deuxième version du corpus, comptant 9 801 documents répartis chronologiquement de 1995 à 2010.

Le corpus a ensuite été ramené aux 8 707 documents contenant un résumé, élément nécessaire aux traitements effectués par ISTEX-R.

ISTEX-R : Projet de recherche appliquée associant le Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), l'Analyse et Traitement Informatique de la Langue Française (ATILF) et l'Institut de l'Information Scientifique et Technique (Inist-CNRS).

Liste des corpus
    Powered by Lodex 14.0.76