
Veerle Brosens
Katholieke Universiteit Leuven
Le site ELICOP donne un aperçu de tout ce qui a été entrepris ces dernières années au Département de Linguistique de la K.U.Leuven dans le domaine de lanalyse linguistique du français parlé, en particulier par la constitution dun corpus automatisé mis à la disposition des chercheurs. Traditionnellement plutôt délaissée par les linguistes qui attachent plus dimportance au code écrit et qui reculent devant le travail onéreux de la transcription de loral, la langue parlée est relativement peu ou mal connue. Les corpus de français parlé existent, mais ils ne sont souvent que de lécrit oralisé (discours, pièces de théâtre).
Ce nest que récemment que les corpus de français parlé ont retenu l'attention des chercheurs. Comme le souligne Claire Blanche-Benveniste (1996, p. 25), les corpus de langue parlée "au travers des fautes de performance aident à voir ce qui est central et typique dans une langue". Cest dans cet esprit que les responsables du projet qui a finalement reçu le nom ELICOP, se sont proposé de constituer un grand corpus informatisé de la langue parlée. Un important travail de constitution de corpus avait déjà été réalisé dans le cadre de deux projets de recherche dans les années 80 (le projet ELILAP) et au début des années 90 (le projet LANCOM). En 1997, les promoteurs du projet ELICOP ont commencé par rassembler systématiquement en les automatisant tous les matériaux disponibles. Par la suite, ils ont établi les principes selon lesquels les corpus seraient formellement uniformisés. Grâce à cette homogénéité formelle, lensemble des corpus, accessible sur Internet, peut être consulté pour tout type de recherches et dapplications linguistiques. Par ses possibilités extraordinaires, l'informatique donne une nouvelle dimension aux recherches linguistiques. Toujours dans le contexte dELICOP, plusieurs logiciels ont été élaborés et mis au point.
Les résultats des recherches montrent comment la production orale peut s'écarter, sans pour autant être incorrecte, de ce que prescrit la grammaire traditionnelle. Ceci sexplique par le fait que la description du français a toujours été basée sur lécrit. Or, cest précisément loral qui reflète le français tel quil est parlé par les francophones dans la vie courante. L'instrument nouveau que constitue ELICOP facilite la prise en considération du code oral en tant que composante essentielle de la langue. Regroupant plusieurs corpus dorigine et de nature différentes, il met à la disposition des chercheurs un échantillon représentatif de la langue parlée dans toute sa diversité. Ces matériaux permettent des recherches spécialisées dans tous les domaines de la linguistique. Par rapport à dautres corpus existants, ELICOP a loriginalité de présenter, en plus de la dimension linguistique, une dimension didactique. En permettant d'étudier la réalité du discours oral, le projet répond aux besoins de tous ceux qui, tant en FLM qu'en FLE, s'interrogent sur les différents aspects de la communication orale.
Dans les premières rubriques, nous présentons la chronologie de la constitution des corpus au sein des différents projets, en évoquant les spécificités de chaque corpus, ainsi que les objectifs poursuivis par les responsables des projets. Dans les rubriques suivantes, nous parcourons les différentes étapes dans la préparation et lexploitation des corpus. Il sagit successivement de la transcription, de lannotation, de la consultation et de lexploitation des corpus. Nous montrons plus particulièrement comment lordinateur peut aider le chercheur à effectuer des analyses linguistiques sur un corpus. Le tour dhorizon permet de voir la richesse et la diversification du corpus global quant au contenu, tout comme son uniformité et son accès remarquablement simple quant à la forme.