Le corpus du chercheur, une quête de l’impossible ? Quelques considérations introductives

Par Cécile Treffort
Publication en ligne le 02 avril 2014

Texte intégral

1L’idée d’avoir consacré une rencontre entre jeunes chercheurs autour de la notion de corpus met parfaitement en valeur que celle-ci apparaît à la fois comme fondamentale et problématique dans le cadre de l’élaboration d’une recherche scientifique. D’emblée, il est nécessaire de distinguer les corpus documentaires à visée collective, produits par un individu ou une équipe pour des utilisateurs dont le nombre et les attentes sont infinis, et ceux à visée personnelle, destinés à apporter à la fois la matière et l’illustration d’un propos scientifique, à donner véritablement corps à un discours historique particulier. C’est bien évidemment la deuxième catégorie qui est au centre des interrogations des doctorants réunis à Poitiers pour cette rencontre.

2Il paraît toutefois nécessaire de souligner que les deux types d’entreprises offrent de nombreuses ressemblances, notamment dans leurs phases de conception, d’élaboration et d’organisation, même si leurs vocations terminales divergent. Elles nécessitent tout d’abord de déterminer l’objet qui sera au cœur de la collecte, toujours extrait d’une entité plus vaste dans une logique d’emboîtement et relevant, en parallèle, de typologies transversales. Pour que le corpus ait un sens, il faut que le chercheur en détermine les contours, en lien direct avec sa finalité. Que les objets récoltés soient matériels, textuels ou mixtes, les opérations qui conduisent à la composition d’un corpus sont en outre toujours les mêmes : définition de l’objet, repérage des occurrences (par dépouillement, prospection...), construction de la grille d’analyse, établissement et standardisation des données (en transformant la forme de la source en un document), et enfin accroissement, limité ou non, de l’ensemble.

3L’usage de la métaphore corporelle pour désigner un ensemble documentaire servant de fondement à une réflexion scientifique appelle d’ailleurs à réfléchir sur les enjeux d’une telle terminologie. Dans la tradition chrétienne, si prégnante dans le Moyen Age occidental, Dieu a créé l’homme à son image, modelé son corps avec de la terre et lui a donné vie par son souffle, qui est Esprit. Le corpus, de nature matérielle, tangible et périssable, préexiste donc mais ne peut se mouvoir sans l’anima. Les grammairiens latins n’ont pas oublié que cette métaphore peut s’appliquer au discours lui-même, les consonnes représentant le corps et les voyelles l’âme qui donne vie et mouvement à l’homme. Le corpus est né d’un processus de création ; la volonté divine l’a composé de membra, tous différents et pourtant tous nécessaires les uns aux autres dans une perspective organique, le tout étant rendu cohérent grâce à la tête, caput. Les membra eux-mêmes associent des ossa, qui persistent après la mort de l’individu, et une caro, putrescible, le tout étant composé des quatre elementa qui forment le monde créé. En utilisant le terme de corpus, le chercheur contemporain suggère qu’il conçoit sa documentation comme un ensemble à la fois composite et cohérent, organique et hiérarchisé, articulé avec le reste du monde.

4Le corps, qui change de forme au cours de son existence, n’a de vie que quand l’esprit l’anime. Dans la pensée chrétienne, il est périssable, destiné à disparaître temporairement lorsqu’au moment de la mort, il est déserté par l’âme, puis à revenir à la fin des temps sous une forme glorieuse, réceptacle d’une âme purifiée. Cette double vivification du corps par l’esprit et cette transformation de nature aux temps eschatologiques pourrait également être une belle métaphore du va-et-vient constant entre le corpus documentaire et la pensée scientifique, le corpus étant composé par le chercheur avant l’établissement d’une thèse qui à son tour permet un retour sur le corpus pour l’arrêter définitivement. Si nous gardons enfin à l’esprit que, toujours dans la pensée chrétienne, c’est l’Esprit et le Verbe de Dieu lui-même qui a pris corps, s’est incarné, nous pouvons arrêter de filer la métaphore. Dans la réalité scientifique, le corpus documentaire de tout chercheur est tout à la fois l’émanation, la traduction et l’illustration de sa pensée.

De la nécessité d’un corpus dans la pratique du médiéviste

5Toute recherche intellectuelle n’induit pas systématiquement l’usage d’un corpus. Il est des sciences, comme les mathématiques ou la philosophie, pour lesquelles la puissance de la pensée ou l’enchaînement des idées peut légitimer de manière absolue le résultat obtenu. Il en est d’autres, comme la chimie ou la médecine, qui privilégient l’expérience, éventuellement répétée, pour valider le postulat scientifique. Cependant, l’usage d’un corpus de référence, qui par nature réunit des données déjà existantes mais éparses, est indispensable aux disciplines puisant dans le passé la source de leur savoir.

6Le corpus se distingue d’autres catégories documentaires fondées, comme lui, sur le rassemblement, la collection, la réunion, la compilation. Ainsi, il a une nature différente de l’inventaire, du catalogue ou autres listes diversement qualifiées qui fournissent les clés d’accès aux données, sans détailler leur contenu. Il se distingue également des florilèges et autres formes d’échantillonnage au rang desquelles on peut mettre les « preuves » des anciens ouvrages d’histoire, par sa recherche d’exhaustivité ou d’une représentativité raisonnée. Cette caractérisation par la négative – ce que les corpus ne sont pas – permet paradoxalement d’en mieux cerner les contours.

7Si l’on excepte les encyclopédistes du Moyen Age, Isidore de Séville au premier chef et tous ses continuateurs, qui avaient l’ambition d’enserrer tout le savoir du monde dans un seul ouvrage, il est clair que la connaissance humaine ne peut être abordée que de manière fragmentée. La constitution de corpus a d’abord relevé d’une perspective utilitaire, notamment en ce qui concerne le droit. Les juristes ont ainsi composé très tôt des corpus de droit civil ou canon rassemblant l’ensemble des textes nécessaires à leur pratique ; la nature juridique des documents étant aisément déterminable, les corpus les regroupant étaient d’autant plus faciles à circonscrire que l’objet de la collecte était le contenu et non la forme littéraire ou matérielle des textes. Les textes normatifs étant la source des décisions ultérieures, le but pragmatique de ces corpus était évident, d’où une organisation systématique intimement liée aux pratiques de leurs utilisateurs. Peut-être pourrait-on associer à ces corpus utilitaires d’autres productions médiévales, comme par exemple les cartulaires, compilations raisonnées et organisées de documents diplomatiques destinées à asseoir les droits d’une famille ou d’une institution en réunissant, de manière pratique, les documents permettant de les justifier, de les préserver et au besoin de les défendre.

8Les corpus documentaires changent de nature lorsqu’ils ne relèvent pas d’une finalité pragmatique mais d’une perspective scientifique. La tradition érudite a été déterminante en la matière : mettant la source, c’est-à-dire l’objet intellectuel ou matériel produit à l’époque étudiée, à l’origine de la réflexion historique, elle a entraîné presque naturellement la constitution de grands recueils appelés monumenta ou corpus, établissant par leur appellation un lien étroit entre la somme des données recueillies et leur fonction de mémoire de l’humanité passée. De très nombreux champs disciplinaires s’appuient désormais sur des corpus à l’ampleur variable mais assez indispensable pour justifier l’existence d’équipes vouée à ce genre d’entreprise éditoriale.

9Le développement des méthodes informatiques semble avoir accéléré le mouvement par la facilité technique offerte au chercheur dans l’acquisition, le traitement et la restitution des données. Le fait de réfléchir aujourd’hui sur la notion même de corpus est sans doute née, entre autres, de cette formidable accélération : à l’heure où chacun peut composer rapidement son propre corpus, sous forme notamment de base de données, il devient plus que nécessaire de demander comment procéder, et surtout, pourquoi.

Le corpus, un objet documentaire

10Dans la pratique historique, le corpus est d’abord un objet documentaire. Si cette dimension n’est pas unique, elle est fondamentale, née du postulat évoqué précédemment du primat de la source dans la réflexion scientifique. Toute approche historique, née de l’analyse des faits, idées ou productions dans une perspective temporelle, se nourrit en effet des traces laissées par le passé, sources de notre connaissance sur ce dernier. C’est en cela que tout médiéviste, qu’il le revendique ou qu’il s’en défende, est tributaire de la tradition positiviste qui a en outre profondément ancré l’idée que la recherche d’objectivité est indispensable à une recherche honnête. La constitution d’un corpus documentaire paraît répondre à cette exigence, la multiplication des témoignages semblant assurer le repérage d’invariables et minorant le contexte qui subjective la donnée.

11La constitution d’un corpus est de fait sous-tendue, implicitement, par une approche à la fois sérielle et comparative. La réunion d’éléments comparables permet en effet dans l’absolu de légitimer un postulat par l’observation de sa répétition, de relever des phénomènes insoupçonnés de ressemblance ou encore de mettre en lumière les traits significatifs d’un objet par l’identification de ses différences avec les autres. L’approche comparative exige d’identifier et de caractériser les éléments comparables puis, pour constituer le corpus, d’en standardiser la forme et de les systématiser, c’est-à-dire de les faire entrer dans une logique qui associe classification, hiérarchisation et organisation.

12Ressentir la nécessité d’un corpus révèle donc une approche particulière de la recherche historique : placer l’objet antique ou médiéval à l’origine de la pensée scientifique ; le considérer dans son rapport aux objets de même type ; accepter d’en transformer l’apparence sinon la substance pour le rendre utilisable dans une perspective heuristique, c’est-à-dire qui porte en elle les résultats de la dynamique intellectuelle dont elle est issue.

Le corpus, une démarche heuristique

13Parce que le corpus sert à la découverte tout autant qu’il s’en nourrit, il apparaît en effet comme éminemment heuristique dans les différentes phases de son existence, de sa conception à sa diffusion. L’élaboration d’un corpus répond toujours à des choix : celui, primordial, de lui donner corps, celui de le limiter avant de l’augmenter. Il n’existe pas de corpus sans esprit qui le vivifie, et c’est là que réside à la fois son intérêt et sa difficulté : il doit être précédé d’une idée à laquelle il donnera sa matière mais si l’idée est infirmée, nuancée, contredite par le corpus, celui-ci, à son tour, en voit sa structure transformée. Éternellement mouvant, le corpus idéal se prête mal à une formalisation définitive car son élaboration accompagne étroitement le processus intellectuel de la recherche. Obligeant à définir, à choisir et à éliminer, il se bat constamment contre l’intelligence historique consciente de la complexité, de la nuance, de la mutabilité des choses, des faits ou des signes.

14Révélateur des usages anciens, le corpus réunit des objets d’étude qui sont le résultat d’une triple dynamique (production, transmission et réception) qui est également source d’interrogation pour le chercheur. Il soulève en effet le problème, fondamental, de la nature de la source : si celle-ci correspond à l’objet matériel ou intellectuel produit dans l’Antiquité ou au Moyen Age, elle parvient obligatoirement tronquée et modifiée par l’action de la nature et des hommes à travers le temps. Le document « ancien », obligatoirement différent de ce qu’il était originellement, doit en outre être transformé, traduit sous une forme graphique et/ou verbale pour entrer dans des classifications toujours réductrices. Ce processus, indispensable pour produire une connaissance historique, engage personnellement le chercheur dans l’élaboration du corpus : c’est son point de vue qui en délimite les contours et son intelligence qui en produit le contenu, faisant à ce titre de l’objectivité un leurre.

15Les données choisies, extraites, délimitées, transformées, doivent ensuite être organisées, intellectuellement et matériellement, pour faire de la collection un corpus, à l’instar des ossements desséchés de la vision d’Ézéchiel, recomposés en corps par le souffle divin, préfigurant ainsi la résurrection finale. La constitution d’un vrai corpus exige ainsi de l’esprit humain de classer, hiérarchiser et établir des liens organiques entre les différents éléments retenus. Si l’usage des moyens informatiques a minoré le problème de l’ordre de présentation, il n’en reste pas moins que le processus intellectuel conduisant à l’organisation d’un corpus fait partie intégrante de la recherche, de la construction d’une véritable thèse, par sa capacité à rendre obligatoire, là encore, des choix. L’intelligence historique, qui se refuse spontanément à désunir ce qui est un, à limiter ce qui est infini et plus généralement à transformer ce qui est, doit se faire violence pour aboutir à un corpus cohérent et stable donc utilisable par le chercheur. La classification des éléments composant un corps complexe, ce qu’est par définition un corpus documentaire, est sans doute la chose la plus difficile mais également la plus nécessaire qui soit pour en comprendre les articulations.

16Conception, élaboration, organisation : dans toutes ces phases comme dans celle qui consiste à remplir le cadre défini pour faire de la collection un vrai corpus, il y a nécessité à choisir et, partant, à éliminer. Construction arbitraire du chercheur qui lui imprime sa marque, le corpus est donc parallèlement un puissant outil de réflexion qui alimente constamment la recherche, autant par son contenu que par sa dynamique propre. S’il veut remplir entièrement sa fonction, il doit changer de forme à la fin de la recherche pour en accompagner la restitution intellectuelle et le partage. A l’origine composition qui n’a de sens que par les questions qu’on veut lui poser, le corpus prend toute sa valeur au regard des réponses qu’il peut désormais fournir. Les contours, le contenu et la structure du corpus définitif, qu’il soit ouvert ou fermé, naissent ainsi conjointement de l’évolution du corpus de travail et des résultats progressifs de la recherche, la réflexion scientifique étant l’élément structurant de l’ensemble.

Pour survivre à la quête de l’impossible...

17Le chercheur doit finalement assumer le fait que tout corpus est une trahison de la matière antique ou médiévale : limitant, éliminant, transformant la source originale, il crée un document de travail répondant à la nécessité scientifique de la sériation et de la comparaison, donc de la systématisation.

18Le chercheur qui accumule sans choisir, qui collecte sans éliminer, qui réunit sans réduire, risque de ressembler à Bouvard et Pécuchet, figures célèbres nées de l’imagination de Gustave Flaubert. Dans son roman inachevé, ce dernier dresse le portrait sans concession de deux autodidactes qui passent de discipline en discipline, de la botanique à la médecine en passant par l’archéologie, accumulant livres et objets dans une demeure de plus en plus encombrée sans progresser pour autant ni en intelligence ni en connaissance. Guy de Maupassant disait de leur histoire : « J’y revois l’antique fable de Sisyphe : ce sont deux Sisyphe modernes et bourgeois qui tentent sans cesse l’escalade de cette montagne de la science, en poussant devant eux cette pierre de la compréhension qui sans cesse roule et retombe. Mais eux, à la fin, haletants, découragés, s’arrêtent et, tournant le dos à la montagne, se font un siège de leur rocher » (Le Gaulois, 6 avril 1881).

19Sans doute Bouvard et Pécuchet furent-ils victimes d’une boulimie de la connaissance et d’une stérilisation des savoirs car ils ne surent pas faire de cette recherche de l’impossible un processus dynamique, celui qui transforme constamment l’objet de sa quête. Sans cesse mouvant, le corpus du chercheur peut répondre aux exigences de la recherche scientifique s’il est sans cesse revivifié, à toutes les étapes de son élaboration et de son utilisation, par l’esprit et l’intelligence humaine : les jeunes chercheurs dont les articles sont ici réunis nous en donnent quelques beaux exemples, et on ne peut que remercier chaleureusement l’association Janua de nous en permettre aujourd’hui la lecture.

Pour citer ce document

Par Cécile Treffort, «Le corpus du chercheur, une quête de l’impossible ? Quelques considérations introductives», Annales de Janua [En ligne], n° 2, Les Annales, mis à jour le : 02/04/2014, URL : https://annalesdejanua.edel.univ-poitiers.fr:443/annalesdejanua/index.php?id=725.

Quelques mots à propos de :  Cécile Treffort

Professeure en histoire du Moyen Âge à l’Université de Poitiers,  directrice du CESCM (UMR 7302). – Thématiques de recherche : culture carolingienne, rites funéraires, épigraphie médiévale, monde monastique, Aquitaine médiévale – Contact : cecile.treffort@univ-poitiers.fr