Le temps passe si vite que l’été se termine, et je me souviens encore du premier jour de mon stage. Depuis le 28 avril, je fais un stage dans le cadre du projet de bibliothèque numérique Thresors de la Renaissance sous la direction d’Anne Réach-Ngô (Institut de Langues et Littératures européennes, Université de Haute-Alsace) et Régis Witz (ingénieur d’étude à la Maison Interuniversitaire des Sciences de l’Homme Alsace). Le projet consiste à étudier la circulation des données entre une bibliothèque numérique de la plate-forme EMAN (Edition de Manuscrits et Archives Numériques, ENS-CNRS, ITEM et Thalim) et la base de données COMET (COMpilations littéraires à intitulés METaphoriques, dir. Anne Réach-Ngô et Marine Parra, plate-forme HEURIST). Les données portent sur toutes les éditions d’œuvres imprimées entre 1470 et 1650 qui incluent dans leur titre le terme «Thrésor» qui désigne un genre éditorial particulier visant à assurer la valorisation d’ouvrages de toutes sortes produits le plus souvent par compilation.
Comme vous pouvez le constater, j’ai eu la chance de travailler avec des trésors, qui sont des œuvres liés à différents domaines d’activité : médecine, littérature, musique, jurisprudence et autres. Mais revenons à ce que j’ai fait dans le cadre de ce stage. Le travail peut être divisé en plusieurs parties. Dans un premier volet autour de la plate-forme EMAN, la première partie est le travail sur les données proprement dites qui devaient être enrichies à partir d’un premier état des données élaborées par Anne Réach-Ngô dans le cadre de son projet de recherche « Les Thresors de la Renaissance, une vitrine éditoriale de la culture française ? » (IUF, 2015-2020). Cela a consisté à identifier les auteurs de certaines œuvres, à chercher des sources qui confirmeraient ces éléments et à produire la transcription de quelques péritextes qui n’avaient pas encore été traités. La deuxième partie du travail a lieu directement sur la plate-forme EMAN : saisie de données manquantes, correction et vérification de données déjà en ligne et harmonisation des données déjà enregistrées. Dans un deuxième volet du stage, mené en parallèle, j’ai participé à la réflexion sur la circulation des données entre EMAN et HEURIST. L’un des enjeux de cette problématique méthodologique développée par Anne Réach-Ngô consiste à interroger la préparation des données en amont pour que celles-ci puissent être diversement exploitées, soit en vue d’une publication en mode bibliothèque numérique (EMAN), soit en vue d’une exploitation en mode base de données (HEURIST). Cela m’a conduite à devoir apprendre à créer et à utiliser des bases de données sur la plate-forme Heurist afin de pouvoir effectuer des tests d’import, des restructurations de la base COMET et des adaptations au sein des données de Thresors de la Renaissance. Pour cela, j’ai également appris à travailler avec un grand nombre de données dans le programme OpenRefine qui facilite la manipulation des données et leur réuitilisation suivant diverses visées.
Le cabinet du vray thresor, par R. Bonnefons, 1606 Bibliothèque nationale d'Autriche
J’ai aimé travailler sur des projets et surtout, mes tâches étaient très diversifiées. Chaque semaine, j’avais des mission qui n’étaient pas basées uniquement sur quelque chose de spécifique, je pouvais passer une partie du temps à travailler avec des données dans une bibliothèque numérique et une partie à faire des recherches d’informations. Cela m’a également aidé à plonger dans le projet et à en comprendre sa structure. La tâche la plus difficile pour moi était la transcription de textes en langue du XVIe siècle, car cela nécessitait beaucoup de concentration et d’attention.
Pendant le travail sur le projet, j’ai révisé de nombreuses œuvres et je voudrais souligner que de nombreux livres n’étaient pas seulement un trésor de par leur titre, mais aussi de par leur décoration intérieure. Bientôt, le projet sera ouvert à tout le monde et aura l’occasion de plonger dans le monde merveilleux des «Thresors». L’ouverture, plus tard, de la base de données COMET, permettra de confronter ce corpus à d’autres corpus de compilations à intitulés métaphoriques, notamment celui des Jardins sur lequel travaille la doctorante d’Anne Réach-Ngô, Marine Parra, avec laquelle elle élabore la base HEURIST.