elicop.gif (2748 bytes)

Présentation du site ELICOP

Etude LInguistique de la COmmunication Parlée

 

Veerle Brosens

Katholieke Universiteit Leuven

 

Le site ELICOP donne un aperçu de tout ce qui a été entrepris ces dernières années au Département de Linguistique de la K.U.Leuven dans le domaine de l’analyse linguistique du français parlé, en particulier par la constitution d’un corpus automatisé mis à la disposition des chercheurs. Traditionnellement plutôt délaissée par les linguistes qui attachent plus d’importance au code écrit et qui reculent devant le travail onéreux de la transcription de l’oral, la langue parlée est relativement peu ou mal connue. Les corpus de français parlé existent, mais ils ne sont souvent que de l’écrit oralisé (discours, pièces de théâtre).

Ce n’est que récemment que les corpus de français parlé ont retenu l'attention des chercheurs. Comme le souligne Claire Blanche-Benveniste (1996, p. 25), les corpus de langue parlée "au travers des ‘fautes’ de performance aident à voir ce qui est central et typique dans une langue". C’est dans cet esprit que les responsables du projet qui a finalement reçu le nom ELICOP, se sont proposé de constituer un grand corpus informatisé de la langue parlée. Un important travail de constitution de corpus avait déjà été réalisé dans le cadre de deux projets de recherche dans les années 80 (le projet ELILAP) et au début des années 90 (le projet LANCOM). En 1997, les promoteurs du projet ELICOP ont commencé par rassembler systématiquement en les automatisant tous les matériaux disponibles. Par la suite, ils ont établi les principes selon lesquels les corpus seraient formellement uniformisés. Grâce à cette homogénéité formelle, l’ensemble des corpus, accessible sur Internet, peut être consulté pour tout type de recherches et d’applications linguistiques. Par ses possibilités extraordinaires, l'informatique donne une nouvelle dimension aux recherches linguistiques. Toujours dans le contexte d’ELICOP, plusieurs logiciels ont été élaborés et mis au point.

Les résultats des recherches montrent comment la production orale peut s'écarter, sans pour autant être incorrecte, de ce que prescrit la grammaire traditionnelle. Ceci s’explique par le fait que la description du français a toujours été basée sur l’écrit. Or, c’est précisément l’oral qui reflète le français tel qu’il est parlé par les francophones dans la vie courante. L'instrument nouveau que constitue ELICOP facilite la prise en considération du code oral en tant que composante essentielle de la langue. Regroupant plusieurs corpus d’origine et de nature différentes, il met à la disposition des chercheurs un échantillon représentatif de la langue parlée dans toute sa diversité. Ces matériaux permettent des recherches spécialisées dans tous les domaines de la linguistique. Par rapport à d’autres corpus existants, ELICOP a l’originalité de présenter, en plus de la dimension linguistique, une dimension didactique. En permettant d'étudier la réalité du discours oral, le projet répond aux besoins de tous ceux qui, tant en FLM qu'en FLE, s'interrogent sur les différents aspects de la communication orale.

 

Dans les premières rubriques, nous présentons la chronologie de la constitution des corpus au sein des différents projets, en évoquant les spécificités de chaque corpus, ainsi que les objectifs poursuivis par les responsables des projets. Dans les rubriques suivantes, nous parcourons les différentes étapes dans la préparation et l’exploitation des corpus. Il s’agit successivement de la transcription, de l’annotation, de la consultation et de l’exploitation des corpus. Nous montrons plus particulièrement comment l’ordinateur peut aider le chercheur à effectuer des analyses linguistiques sur un corpus. Le tour d’horizon permet de voir la richesse et la diversification du corpus global quant au contenu, tout comme son uniformité et son accès remarquablement simple quant à la forme.

 

Références