L’exploitation des corpus

Une fois terminé le travail ingrat et onéreux de la transcription et de l’annotation -pour une minute d’enregistrement, il faut compter à peu près une heure de transcription et d’encodage- on peut passer à l’exploitation des données. Et bien vite on se rend compte que la langue parlée constitue un autre code linguistique avec sa grammaire propre, fort différente de celle du code écrit. D’une part, on constate que les ratés, les phrases avortées, les hésitations, les lapsus, les chevauchements de parole, etc. sont récurrents. D’autre part, on rencontre de nombreuses séquences qui du point de vue du code écrit seraient jugées comme agrammaticales. L’oral est rarement coulé dans le moule syntaxique de l’écrit !

Le corpus ELILAP avait déjà servi de matériau à un certain nombre de recherches approfondies dans les années 80, à la fois à la K.U.Leuven et ailleurs. Nous mentionnons, parmi d'autres travaux à Leuven ceux sur la fréquence des phonèmes en français parlé (De Kock, 1983), les mots charnières (Delbecque, 1983), la syllabation automatique (Delbecque & Bas, 1983) et le e muet (Delbecque & Debrock, 1985).

Le corpus LANCOM, pour sa part, a constitué la base d’une série de travaux de fin d’études réalisés par des étudiants en langues romanes à la K.U.Leuven. Ces travaux portaient sur des thèmes linguistiques, didactiques et interactionnels variés : l’interrogation, l’impératif, les procédés de thématisation et de focalisation, la mise en relief et la présentation, l’expression d’une opinion, l’expression de la cause, les auxiliaires, les temps du passé, le subjonctif, le discours indirect, le passif, la comparaison, le futur, l'ordre des mots, les connecteurs de cause, etc.
[Pour une description de ces études, voir Travaux de fin d'études.]
[Pour un aperçu des résultats, voir Debrock (1994), Debrock & Flament-Boistrancourt (1996), Debrock & Gevaert (1996), Flament-Boistrancourt & Debrock (1997), Flament-Boistrancourt & Gevaert (1997), Debrock (1999), Debrock, Flament-Boistrancourt & Gevaert (1999) et Flament-Boistrancourt & Cornette (1999).]

Dans tous ces travaux de fin d'études, on procède de la même manière. Dans un premier temps, le chercheur présente dans une partie théorique une étude critique d'un phénomène linguistique particulier tel qu’il est décrit dans les grammaires descriptives et pédagogiques les plus récentes, dans certains manuels scolaires (rédigés en Flandre pour des apprenants néerlandophones) et dans des articles spécialisés de linguistique. Ensuite, tous les exemples du phénomène à l'étude, attestés dans les corpus, sont analysés. Comme on peut s'y attendre, les divergences entre la production orale et la norme prescrite par les grammaires et les manuels qui se basent exclusivement sur l’écrit sont très grandes.

L’enseignement du FLE qui attache beaucoup d’importance à la communication orale, gagnerait donc à tenir compte des résultats de ces études. En effet, trop souvent, ce qui est corrigé lors d’un exercice d’expression orale dans une classe de FLE, n’est pas perçu dans le discours oral des francophones comme une faute. Pour que les allophones produisent un français plus authentique, l’enseignement du FLE devrait davantage tenir compte des caractéristiques de l’oral. Dans ce but, les résultats des recherches effectuées sont présentés régulièrement aux professeurs de français en Belgique néerlandophone dans le cadre de sessions de formation continue.

De nouveaux mémoires, ainsi que des thèses de doctorat sont actuellement en préparation à la K.U.Leuven, entre autres sur la négation, les prépositions, le conditionnel et le langage des professeurs de FLE. Dans d'autres universités belges, ainsi qu'à l'étranger, de nombreux chercheurs ont déjà consulté nos corpus pour leurs recherches. Comme il a été dit, le corpus ELICOP est directement accessible sur Internet à partir de 2001.

 

Références

Articles ELILAP :

 

Articles LANCOM

 

26/02/01