Projets

Katabase - Manuscripts Sales Catalogues

Le canon littéraire n’étant pas stable, la reconstitution de ses anciens états reste un enjeu important de la recherche. Qui lisait quoi, à quelle époque? Le projet MSS, pour Manuscripts Sales catalogueS, propose d’utiliser la circulation des manuscrits comme une nouvelle source pour l’étude de la réception des auteurs, et donc des mutations du canon.

Le XIXe siècle parisien voit naître un nouveau marché : celui des manuscrits d’hommes et de femmes célèbres. Les experts, au premier rang desquels se trouvent ceux issus de la famille Charavay, publient des journaux et des catalogues qui documentent l’évolution des prix et la constitution de collections privées. Ces traces écrites laissées par le marché constituent donc une formidable source encore inexploitée par les historiens, les philologues et les économistes intéressés par l’étude du patrimoine écrit ancien.

Le projet Katabase rassemble une équipe pluridisciplinaire, composée de spécialistes de l’histoire du livre, des ventes aux enchères et des humanités numériques pour faire avancer les techniques d’extraction d’informations dans les documents dits « historiques », mais aussi mettre en valeur cette documentation inédite, qui éclaire à nouveau frais un passé encore mal connu.

Publications

  • Anna Scius Bertrand, Simon Gabay, Ljudmila Petkovic, Juliette Janes, Caroline Corbières, et al.. The BIR database – Identifying typographic emphasis in list-like historical documents. HIP@ICDAR21 - The 6th International Workshop on Historical Document Imaging and Processing, Sep 2021, Lausanne, Switzerland. ⟨10.1145/3476887.3476913⟩. ⟨hal-03355683
  • Simon Gabay, Ljudmila Petkovic, Alexandre Bartz, Matthias Gille Levenson, Lucie Rondeau Du Noyer. Katabase: À la recherche des manuscrits vendus. Humanistica 2021, Humanistica, May 2021, Rennes, France. ⟨hal-03066108
  • Simon Gabay, Lucie Rondeau Du Noyer, Matthias Gille Levenson, Ljudmila Petkovic, Alexandre Bartz. Quantifying the Unknown: How many manuscripts of the marquise de Sévigné still exist?. Digital Humanities DH2020, ADHO, Jul 2020, Ottawa, Canada. ⟨hal-02898929
  • Mohamed Khemakhem, Simon Gabay, Béatrice Joyeux-Prunel, Laurent Romary, Léa Saint-Raymond, et Lucie Rondeau Du Noyer. Information Extraction Workflow for Digitised Entry-based Documents. DARIAH Annual event 2020, May 2020, Zagreb / Virtual, Croatia. ⟨hal-02508549
  • Simon Gabay, Lucie Rondeau Du Noyer, Mohamed Khemakhem. Selling autograph manuscripts in 19th c. Paris: digitising the Revue des Autographes. IX Convegno AIUCD, AIUCD, Jan 2020, Milan, Italy. ⟨hal-02388407
  • Lucie Rondeau Du Noyer, Simon Gabay, Mohamed Khemakhem, Laurent Romary. Scaling up Automatic Structuring of Manuscript Sales Catalogues. TEI 2019: What is text, really? TEI and beyond, Sep 2019, Graz, Austria. ⟨hal-02272962
  • Mohamed Khemakhem, Laurent Romary, Simon Gabay, Hervé Bohbot, Francesca Frontini, et Giancarlo Luxardo. Automatically Encoding Encyclopedic-like Resources in TEI. The annual TEI Conference and Members Meeting, Sep 2018, Tokyo, Japan. ⟨hal-01819505
  • Simon Gabay, Mohamed Khemakhem, Laurent Romary. Les catalogues et GROBID. Doctorat. Du catalogue aux humanités numériques : quelles méthodes pour quels résultats ?, Paris, France. 2018. ⟨cel-01951107