Sources
Information Psychiatrique : L’ensemble des numéros allant de 1945 à 1997 (sauf 1991 et 1993)
Description du projet
Elle a été construite selon le procédé suivant :
- Scanner des tables de matière des journaux
- Traitement par OCR des scans
- Conception et passage dans un programme Python permettant l’automatisation du passage des scans OCR à une base de donnée en .csv
- Relecture et harmonisation
- Création de deux bases de données distinctes, l’une organisée selon les auteur.rices, l’autre selon les articles
Limites globales de la base de données
1 – L’ensemble des saisies s’est faite de façon automatisée. Elle a été ensuite vérifiée une seule fois pour les deux journaux. En ce sens, les erreurs de saisie ne sont pas à exclure, en particulier pour les titres et les initiales.
2 – La base de données sur l’Information Psychiatrique en raison des normes éditoriales utilisées et des difficultés posées au niveau de l’automatisation ne contient pas les variables : Volume, Fascicule.
Description des bases de données :
Article_final :
Cette base de données recense l’ensemble des articles d’un journal. Chaque article n’apparaît qu’une fois et peut avoir plusieurs auteurs.
Auteur_final :
Cette base de données recense l’ensemble des références aux auteur.rices qui ont publié. Un article peut ainsi apparaître plusieurs fois s’il a plusieurs auteur.rices (3 références à l’article dans la base de données si trois personnes l’ont écrit).
La variable Initiales renvoie à l’ensemble des auteur.rices d’un article et non pas uniquement à celui ou celle de la ligne de référence.