La syllabation automatique du français parlé

______________________________________________

DELBECQUE, N.

BAS, E.

1. Introduction

Une définition opérationnelle de la notion de syllabe est nécessaire afin de pouvoir comparer deux ou plusieurs structures langagières. L’étude présente traite de la syllabation du français parlé. Pour le français écrit, un programme d’ordinateur pour la coupe syllabique a déjà été établi (cf. Duchesne-Degey, 1975).

Cf. Pulgram (1970) : le groupe rythmique

= un "cursus"
= un groupe pausal
= l’unité morphophonologique minimale
= une unité à la fois segmentale et suprasegmentale

  • Le "cursus" se comporte comme un "nexus" (= une série de lexèmes se comportant phonologiquement comme un seul mot, bien que morphologiquement comme plusieurs mots).

Mais : il a des limites nettement indiquées par les pauses.

ß

Le "cursus" constitue donc un seul mot phonologique.

= la seule unité phonologiquement délimitée dans le "cursus"
= une unité phonologique dont les marges sont déterminées par des règles phonotactiques

Cf. Pulgram (1970) : une hiérarchie de règles phonotactiques de syllabation applicables à la phonotactique spécifique d’une langue donnée.

 

2. Etat de la question

2.1. Définitions phonétiques

ß

Une syllabe ~ un sommet d’aperture, une séquence explosive suivie d’une séquence implosive

ß

Une syllabe ~ l’ensemble des phonèmes articulés dans une même contraction de la double série des muscles intercostaux

 

2.2. Définitions phonologiques

= précurseur de Pulgram qui introduit la notion de syllabe phonologique.

ß

Une syllabe = "a minimal pattern of phoneme combination with a vowel as nucleus, preceded and followed by a consonant unit or permitted consonant combination" (O’Connor & Trim 1953, 122)

Þ En anglais, la plupart des mots perdent leur identité segmentale et suprasegementale et forment un "nexus".

Þ En français et en latin classique, tous les groupes délimités par des pauses sont des "cursus".

Þ Il n’existe probablement pas de langue qui consiste uniquement en "mots".

ß

L’analyse en syllabes présuppose une description des frontières syllabiques :
Le noyau de la syllabe est une seule voyelle phonologique, il y a autant de syllabes qu’il y a de noyaux.

- le principe de la syllabicité ouverte maximale
- le principe du "coda" minimal et de l’ "attaque" maximale
- le principe du "coda" irrégulier

 

3. La syllabation automatique du français contemporain parlé

3.1. Introduction

La syllabe = une unité phonologique (le groupe rythmique français, le "cursus") dont les marges sont à déterminer par des règles phonotactiques (cf. Pulgram).

Þ Méthode formelle, systématique et inductive.

 

3.2. Analyse

Les transcriptions phonématiques automatisées représentent 3h15’ :

Tableau 1 à 4 : classement des phonèmes suivant leur fréquence décroissante

ß

image globale des attaques et codas les plus fréquents pour le français

Problème : Le corpus est trop restreint pour faire ressortir les attaques et codas marginaux.

  • Une attestation unique suffit pour inclure une attaque ou un coda parmi les possibles, mais ne donne qu’une indication provisoire sur le caractère plus ou moins marginal.
  • L’absence d’un phonème n’équivaut pas nécessairement à son inexistence.

 

Notre méthode se base sur la thèse formulée par Pulgram (1970). Nous avons reformulé les règles de Pulgram pour le français :

1) Les limites syllabiques sont marquées par des pauses.

2) Une limite syllabique est prévue derrière chaque voyelle.

ß

Il n’y a que des syllabes ouvertes.

3) Au cas où la syllabe ouverte se terminerait par une voyelle non attestée à la limite syllabique, il faut transférer de l’attaque de la syllabe suivante autant de consonnes que nécessaire pour donner à la syllabe un coda non vocalique permis.

4) Lorsque l’attaque de la syllabe suivante est formé par une ou plusieurs consonnes qui n’apparaissent pas en position initiale, il faut en détacher le nombre nécessaire de consonnes et les attacher à la syllabe précédente comme coda.

5) Si ce déplacement donne lieu à un coda qui n’est plus régulier, il faut procéder à un nouveau transfert de la position syllabique finale à la position syllabique initiale, même si ce transfert aboutit à une séquence inadmissible en début de syllabe.

« règle de Pulgram

Cf. tendance générale de l’accentuation du français à placer l’accent sur la voyelle finale du groupe rythmique : devant la pause ce sont essentiellement des voyelles qui se démarquent, derrière la pause essentiellement des consonnes.

 

Le décompte des phonèmes et des séquences de phonèmes qui apparaissent devant et derrière les pauses a été confié à l’ordinateur.

Tableaux 1 et 3 : listes de fréquence par locuteur

Tableau 2 et 4 : les cas absents

 

La coupe syllabique :

Þ derrière la voyelle et devant la consonne

Þ on attribue à chaque voyelle une valeur syllabique
             = règle générale

ß

Il faut apporter les corrections nécessaires pour les semi-voyelles et/ou les groupes de consonnes.
         = règles particulières

 

Tableaux 5 et 6 : la distribution des groupes de phonèmes rencontrés devant et derrière la pause à fréquence supérieure à 1
        = base empirique pour l’établissement des règles particulières

ß

Þ groupe non marginal

Þ groupe non marginal

Þ groupe marginal

 

Tableaux 7 et 8 : les fréquences espérées

Þ combinaisons régulières, non marginales

Þ tester l’hypothèse zéro afin de déterminer si la différence qui sépare la fréquence espérée de la fréquence observée est significative ou non :

- valeur inférieure à 0,05 : décalage significatif
      Þ combinaison marginale

- valeur supérieure à 0,05 : décalage non significatif
       Þ combinaison non marginale

(Dans le corpus la fréquence d’aucun des cas douteux n’excède 30 : tous les calculs sont basés sur le test de Bernoulli.)

 

Tableaux 9 et 10 : les résultats du test de Bernoulli

ß

96 combinaisons devant pause et 92 combinaisons après pause doivent être soumises au programme pour la coupe syllabique.

 

3.3. Règles opératoires pour la syllabation automatique

1) A l’intérieur d’une séquence entre deux pauses, une coupe syllabique se fait derrière chaque voyelle.

2) Si l’attaque de la syllabe suivante est constituée par une seule consonne ou par une semi-voyelle suivies d’une voyelle :

3) Si la syllabe suivante commence par une combinaison de deux consonnes :

a) vérifier s’il s’agit d’une combinaison régulière (cf. test de Bernoulli)

b) si la première consonne est un R , il faut la détacher de l’attaque de la syllabe suivante et l’attacher à la syllabe précédente comme coda

c) si la première consonne est un l, il faut la transférer au coda de la syllabe précédente

d) si la première consonne est un s, il faut la détacher de l’attaque de la syllabe suivante et l’attacher à la syllabe précédente comme coda, sauf si la deuxième consonne est s, k, t ou ...

 

Remarques supplémentaires pour la programmation des règles de syllabation automatique dans la transcription phonématique :

1) les combinaisons de deux consonnes à point d’articulation identique :

Þ la première des deux consonnes doit être omise pour la syllabation

Þ coupe syllabique entre les deux consonnes

2) le hiatus (= une exception sur les règles de syllabation automatique) :

Þ coupe syllabique après la finale consonantique

 

3.4. Conclusion provisoire

Ces quelques règles rudimentaires suffisent pour rendre compte de pas moins de 93% des coupures syllabiques.

 

29/06/99