Éditer des corpus sur le net |
Modération: Michael SINATRA (Directeur du Centre de Recherche Interuniversitaire sur les Humanités Numériques (CRIHN)), Professeur, Université de Montréal)
L'Édition Numérique Collaborative et Critique de l'Encyclopédie de Diderot et D'Alembert (ENCCRE) comme prototype d'un laboratoire virtuel de recherches sur l'Encyclopédie et les Lumières
par Alexandre GUILBAUD (Maître de conférences, Sorbonne Université)
Librement accessible à l’adresse http://enccre.academie-sciences.fr depuis le 19 octobre 2017, l’Édition Numérique Collaborative et CRitique de l’Encyclopédie (1751-1772), l’ENCCRE, est un projet numérique réalisé par une équipe internationale et pluridisciplinaire de 130 membres, parmi lesquels figurent plus d’une centaine de chercheurs spécialistes de l’Encyclopédie de Diderot et D'Alembert, des chercheurs en informatique, des ingénieurs, des étudiants et des bénévoles.
L’édition réalisée dans ce cadre repose une ambitieuse politique d’annotation fondée sur plusieurs niveaux d’articulation entre la matérialité de l’exemplaire original sur lequel s’appuie l’édition, la représentation numérique de l’œuvre et l’apparat critique que nous sommes en mesure de constituer. L’ENCCRE s’appuie en effet sur une interface de consultation, complétée, en amont, par une interface collaborative d’édition munie de nombreux outils à disposition des chercheurs pour décrire, annoter et effectuer des recherches sur l’œuvre. Nous examinerons les possibilités et limites actuelles de cet espace numérique au regard de ce qu’il tend et aspire progressivement à devenir : un laboratoire virtuel de recherche sur l’Encyclopédie, où l’étude collective de l’œuvre et de son contexte doit permettre aux diverses facettes de l’histoire des idées, des sciences et des techniques au siècle des Lumières de se rencontrer, de s’enrichir et d’avancer de concert.
Le Programme des registres de la Comédie-Française : un corpus numérique en extension
par Agathe SANJUAN (Conservatrice-archiviste, Bibliothèque-Musée de la Comédie-Française)
Le Programme des registres de la Comédie-Française associe depuis 2008 plusieurs universités françaises, américaines, canadiennes, et un établissement culturel – la Comédie-Française – autour d’un ensemble d’archives physiques d’une très grande richesse nous renseignant sur l’histoire du théâtre depuis la fin du XVIIe siècle. Par le numérique, ce corpus de documents s’est transformé en corpus de données toujours plus vaste, s’élargissant au fil des années et des contributions de chercheurs, apportant leur pierre à la réflexion sur les méthodes, les outils et l’exploitation des données.
Néanmoins, le chercheur est confronté à une nouvelle difficulté : le raisonnement s’appuie sur un corpus en extension. Au fil des mois, des financements et des projets on rajoute des corpus, des tables, des outils de visualisation. Alors que la consultation des archives papier est nécessairement limité à l’unité de communication en salle de lecture, l’archive numérique n’est peut-être pas réellement « définitive ». Si la pérennité est assurée par l’interopérabilité des systèmes et l’archivage du site sur des plateformes d’État, l’accroissement des corpus et la mobilité des outils (visualisations, design) pose de nouveaux défis à la recherche et à la démarche scientifique.
Projet eBalzac : construire une bibliothèque hypertextuelle des sources intellectuelles
par Andrea DEL LUNGO (Professeur, Sorbonne Université), Karolina SUCHECKA (Doctorante, Université de Lille)
Le projet ANR Phœbus–eBalzac (www.ebalzac.com), porté par les équipes CELLF et LIP6 de Sorbonne Université et par l’équipe ALITHILA de l’Université de Lille, consiste à mettre en résonance l’ensemble de l’œuvre balzacienne avec un vaste corpus d’écrits contemporains qui ont pu la nourrir (œuvres romanesques, littérature panoramique, ouvrages scientifiques). L’objectif du projet est de permettre des recherches et des comparaisons intertextuelles élaborées afin de détecter des citations, des reprises ou des plagiats éventuels, et de constituer ainsi une cartographie de l’univers intellectuel de Balzac à partir des traces que d’autres textes ont laissées dans l’œuvre.
Lors de cette communication, nous décrirons les enjeux littéraires, informatiques et éditoriaux de la constitution d’une bibliothèque hypertextuelle des sources balzaciennes. Comment traiter une base de données de plus de 20 000 homologies binaires obtenue grâce au logiciel TEXTPAIR, développé en collaboration avec l’Université de Chicago ? Comment pré-traiter le corpus afin d’augmenter la pertinence de ces résultats et de limiter le nombre des banalités ? Enfin, comment optimiser la visualisation, par exemple à l’aide de graphes, pour qu’elle soit la plus lisible possible et fournisse des informations adaptées aux besoins spécifiques des lecteurs ? Ces questions, auxquelles nous tâchons de répondre dans la phase actuelle du projet, constitueront les points centraux de l’intervention.
Organisation :
Maison Européenne des Sciences de l'Homme et de la Société (MESHS)
Cette manifestation est soutenue par l'Etat et le Conseil Régional Hauts-de-France dans le cadre du CPER ISI-MESHS. |
URI/Permalink: