Lexploitation des corpus
Une fois terminé le travail ingrat et onéreux de la transcription et de lannotation -pour une minute denregistrement, il faut compter à peu près une heure de transcription et dencodage- on peut passer à lexploitation des données. Et bien vite on se rend compte que la langue parlée constitue un autre code linguistique avec sa grammaire propre, fort différente de celle du code écrit. Dune part, on constate que les ratés, les phrases avortées, les hésitations, les lapsus, les chevauchements de parole, etc. sont récurrents. Dautre part, on rencontre de nombreuses séquences qui du point de vue du code écrit seraient jugées comme agrammaticales. Loral est rarement coulé dans le moule syntaxique de lécrit !
Le corpus ELILAP avait déjà servi de matériau à un certain nombre de recherches approfondies dans les années 80, à la fois à la K.U.Leuven et ailleurs. Nous mentionnons, parmi d'autres travaux à Leuven ceux sur la fréquence des phonèmes en français parlé (De Kock, 1983), les mots charnières (Delbecque, 1983), la syllabation automatique (Delbecque & Bas, 1983) et le e muet (Delbecque & Debrock, 1985).
Le corpus LANCOM, pour sa part, a constitué la base dune série
de travaux de fin détudes réalisés par des étudiants en langues romanes à la
K.U.Leuven. Ces travaux portaient sur des thèmes linguistiques, didactiques et
interactionnels variés : linterrogation, limpératif, les procédés de
thématisation et de focalisation, la mise en relief et la présentation,
lexpression dune opinion, lexpression de la cause, les auxiliaires, les
temps du passé, le subjonctif, le discours indirect, le passif, la comparaison, le futur,
l'ordre des mots, les connecteurs de cause, etc.
[Pour une description de ces études, voir Travaux de fin
d'études.]
[Pour un aperçu des résultats, voir Debrock (1994), Debrock & Flament-Boistrancourt (1996), Debrock & Gevaert
(1996), Flament-Boistrancourt & Debrock (1997),
Flament-Boistrancourt & Gevaert (1997), Debrock (1999), Debrock,
Flament-Boistrancourt & Gevaert (1999) et Flament-Boistrancourt & Cornette
(1999).]
Dans tous ces travaux de fin d'études, on procède de la même manière. Dans un premier temps, le chercheur présente dans une partie théorique une étude critique d'un phénomène linguistique particulier tel quil est décrit dans les grammaires descriptives et pédagogiques les plus récentes, dans certains manuels scolaires (rédigés en Flandre pour des apprenants néerlandophones) et dans des articles spécialisés de linguistique. Ensuite, tous les exemples du phénomène à l'étude, attestés dans les corpus, sont analysés. Comme on peut s'y attendre, les divergences entre la production orale et la norme prescrite par les grammaires et les manuels qui se basent exclusivement sur lécrit sont très grandes.
Lenseignement du FLE qui attache beaucoup dimportance à la communication orale, gagnerait donc à tenir compte des résultats de ces études. En effet, trop souvent, ce qui est corrigé lors dun exercice dexpression orale dans une classe de FLE, nest pas perçu dans le discours oral des francophones comme une faute. Pour que les allophones produisent un français plus authentique, lenseignement du FLE devrait davantage tenir compte des caractéristiques de loral. Dans ce but, les résultats des recherches effectuées sont présentés régulièrement aux professeurs de français en Belgique néerlandophone dans le cadre de sessions de formation continue.
De nouveaux mémoires, ainsi que des thèses de doctorat sont actuellement en préparation à la K.U.Leuven, entre autres sur la négation, les prépositions, le conditionnel et le langage des professeurs de FLE. Dans d'autres universités belges, ainsi qu'à l'étranger, de nombreux chercheurs ont déjà consulté nos corpus pour leurs recherches. Comme il a été dit, le corpus ELICOP est directement accessible sur Internet à partir de 2001.
Références
Articles ELILAP :
Articles LANCOM
26/02/01