La syllabation automatique du français parlé ______________________________________________ |
DELBECQUE, N.
BAS, E.
1. Introduction
Une définition opérationnelle de la notion de syllabe est nécessaire afin de pouvoir comparer deux ou plusieurs structures langagières. Létude présente traite de la syllabation du français parlé. Pour le français écrit, un programme dordinateur pour la coupe syllabique a déjà été établi (cf. Duchesne-Degey, 1975).
Cf. Pulgram (1970) : le groupe rythmique
= un "cursus"
= un groupe pausal
= lunité morphophonologique minimale
= une unité à la fois segmentale et suprasegmentale
- Le "cursus" se comporte comme un "nexus" (= une série de lexèmes se comportant phonologiquement comme un seul mot, bien que morphologiquement comme plusieurs mots).
Mais : il a des limites nettement indiquées par les pauses.
ß
Le "cursus" constitue donc un seul mot phonologique.
= la seule unité phonologiquement délimitée dans le "cursus"
= une unité phonologique dont les marges sont déterminées par des règles phonotactiques
- Ces règles peuvent être dérivées dune analyse de la langue en des unités contrastives fonctionnelles.
Cf. Pulgram (1970) : une hiérarchie de règles phonotactiques de syllabation applicables à la phonotactique spécifique dune langue donnée.
- Létude présente se base, avec les modifications nécessaires sur lalgorithme établi par Lehfeldt.
2. Etat de la question
2.1. Définitions phonétiques
Il classe les phonèmes en sept catégories, allant de laperture zéro à laperture maximale.
ß
Une syllabe ~ un sommet daperture, une séquence explosive suivie dune séquence implosive
- Le larynx effectue dabord un travail de tension musculaire croissante sur la ou les consonnes qui commencent la syllabe, puis un travail de tension musculaire décroissante, partant de la voyelle et se poursuivant sur la ou les consonnes qui suivent.
- Le sommet de la syllabe (= le "point vocalique") peut être défini comme le point où la courbe de tension musculaire passe de lascendant au descendant.
ß
Une syllabe ~ lensemble des phonèmes articulés dans une même contraction de la double série des muscles intercostaux
- Les différences de deux spectogrammes du type V-C-V (lun présentant des inflexions uniquement de la première voyelle et lautre uniquement de la deuxième) constituent des différences de syllabation.
- Consonne implosive (VC/V) « consonne explosive (V/CV)
2.2. Définitions phonologiques
- En fin de compte la syllabation nest autre quun procédé délimination.
= précurseur de Pulgram qui introduit la notion de syllabe phonologique.
- Établir les classes de voyelle et de consonne à la suite dun traitement statistique de la comparaison systématique de la distribution de tous les phonèmes.
- Déterminer les frontières syllabiques en anglais.
ß
Une syllabe = "a minimal pattern of phoneme combination with a vowel as nucleus, preceded and followed by a consonant unit or permitted consonant combination" (OConnor & Trim 1953, 122)
- "nexus" = une série de lexèmes se comportant phonologiquement comme un seul mot, bien que morphologiquement comme plusieurs mots (cf. supra)
Þ En anglais, la plupart des mots perdent leur identité segmentale et suprasegementale et forment un "nexus".
- "cursus" = un groupe (cf. "nexus") délimité par des pauses constitue un seul "mot phonologique".
Þ En français et en latin classique, tous les groupes délimités par des pauses sont des "cursus".
- "word"
Þ Il nexiste probablement pas de langue qui consiste uniquement en "mots".
ß
Lanalyse en syllabes présuppose une description des frontières syllabiques :
Le noyau de la syllabe est une seule voyelle phonologique, il y a autant de syllabes quil y a de noyaux.
- Des règles de syllabation phonotactiques permettent de décider quelles consonnes sont liées au premier noyau ("coda") et quelles consonnes vont avec le deuxième noyau ("attaque").
- Principe phonologique de base : la première/dernière syllabe dun "cursus", "nexus" ou "word" présente les mêmes contraintes phonotactiques à gauche/à droite que le mot. Pour la détermination des marges syllabiques à lintérieur de ces unités, règnent les mêmes contraintes.
- Les règles de spécification, permettant de choisir la solution distributionnelle correcte, se basent sur trois principes :
- le principe de la syllabicité ouverte maximale
- le principe du "coda" minimal et de l "attaque" maximale
- le principe du "coda" irrégulier
- Tous les groupes de phonèmes initiaux et finaux existant dans une langue donnée sont établis.
- Un procédé statistique permet de trouver la fréquence de tous ces groupes.
- Les combinaisons observées peuvent être divisées en combinaisons consonantiques "marginales" (irrégulières) et "non marginales" (régulières).
- A laide dun ordinateur il procède à la syllabation des unités phonologiques établies.
3. La syllabation automatique du français contemporain parlé
3.1. Introduction
La syllabe = une unité phonologique (le groupe rythmique français, le "cursus") dont les marges sont à déterminer par des règles phonotactiques (cf. Pulgram).
Þ Méthode formelle, systématique et inductive.
3.2. Analyse
Les transcriptions phonématiques automatisées représentent 3h15 :
Tableau 1 à 4 : classement des phonèmes suivant leur fréquence décroissante
ß
image globale des attaques et codas les plus fréquents pour le français
Problème : Le corpus est trop restreint pour faire ressortir les attaques et codas marginaux.
- Une attestation unique suffit pour inclure une attaque ou un coda parmi les possibles, mais ne donne quune indication provisoire sur le caractère plus ou moins marginal.
- Labsence dun phonème néquivaut pas nécessairement à son inexistence.
Notre méthode se base sur la thèse formulée par Pulgram (1970). Nous avons reformulé les règles de Pulgram pour le français :
1) Les limites syllabiques sont marquées par des pauses.
2) Une limite syllabique est prévue derrière chaque voyelle.
ß
Il ny a que des syllabes ouvertes.
3) Au cas où la syllabe ouverte se terminerait par une voyelle non attestée à la limite syllabique, il faut transférer de lattaque de la syllabe suivante autant de consonnes que nécessaire pour donner à la syllabe un coda non vocalique permis.
4) Lorsque lattaque de la syllabe suivante est formé par une ou plusieurs consonnes qui napparaissent pas en position initiale, il faut en détacher le nombre nécessaire de consonnes et les attacher à la syllabe précédente comme coda.
5) Si ce déplacement donne lieu à un coda qui nest plus régulier, il faut procéder à un nouveau transfert de la position syllabique finale à la position syllabique initiale, même si ce transfert aboutit à une séquence inadmissible en début de syllabe.
- Il convient, pour le français, de faire retomber la charge de lirrégularité sur une attaque plutôt que sur un coda.
« règle de Pulgram
Cf. tendance générale de laccentuation du français à placer laccent sur la voyelle finale du groupe rythmique : devant la pause ce sont essentiellement des voyelles qui se démarquent, derrière la pause essentiellement des consonnes.
Le décompte des phonèmes et des séquences de phonèmes qui apparaissent devant et derrière les pauses a été confié à lordinateur.
Tableaux 1 et 3 : listes de fréquence par locuteur
- Hypothèse : Il y a des phonèmes et des séquences de phonèmes qui napparaissent pratiquement pas à la pause.
Tableau 2 et 4 : les cas absents
La coupe syllabique :
Þ derrière la voyelle et devant la consonne
Þ on attribue à chaque voyelle une valeur syllabique
= règle générale
ß
Il faut apporter les corrections nécessaires pour les semi-voyelles et/ou les groupes de consonnes.
= règles particulières
Tableaux 5 et 6 : la distribution des groupes de phonèmes rencontrés devant et derrière la pause à fréquence supérieure à 1
= base empirique pour létablissement des règles particulières
- Les groupes qui napparaissent quune seule fois sont considérés comme marginaux.
- Pour les autres, il faut, à partir des fréquences observées, calculer les fréquences espérées correspondantes afin de pouvoir déterminer le statut de régularité ou de marginalité.
ß
- Si la fréquence observée dun groupe est plus élevée que sa fréquence espérée :
Þ groupe non marginal
- Si la fréquence absolue dun groupe ne doit pas être considérée (le seuil de signification étant fixé à 0,05) comme significativement moins élevée que la fréquence espérée correspondante :
Þ groupe non marginal
- Si la fréquence observée dun groupe se situe nettement en dessous de la fréquence espérée (le seuil de signification étant toujours fixé à 0,05) :
Þ groupe marginal
Tableaux 7 et 8 : les fréquences espérées
- Lorsque la fréquence observée excède la fréquence espérée :
Þ combinaisons régulières, non marginales
- 77 des 118 combinaisons attestées devant pause
- 73 des 113 combinaisons attestées après pause
- Lorsque la valeur espérée dépasse la valeur observée :
Þ tester lhypothèse zéro afin de déterminer si la différence qui sépare la fréquence espérée de la fréquence observée est significative ou non :
- Chi-deux pour les combinaisons dont la fréquence est supérieure à 30
- le test de Bernoulli pour les cas moins fréquents :
- valeur inférieure à 0,05 : décalage significatif
Þ combinaison marginale- valeur supérieure à 0,05 : décalage non significatif
Þ combinaison non marginale
(Dans le corpus la fréquence daucun des cas douteux nexcède 30 : tous les calculs sont basés sur le test de Bernoulli.)
Tableaux 9 et 10 : les résultats du test de Bernoulli
- Devant pause, 22 sur 118 combinaisons attestées sont marginales.
- Après pause, 21 sur 113 combinaisons attestées sont marginales.
ß
96 combinaisons devant pause et 92 combinaisons après pause doivent être soumises au programme pour la coupe syllabique.
3.3. Règles opératoires pour la syllabation automatique
1) A lintérieur dune séquence entre deux pauses, une coupe syllabique se fait derrière chaque voyelle.
2) Si lattaque de la syllabe suivante est constituée par une seule consonne ou par une semi-voyelle suivies dune voyelle :
- vérifier lacceptabilité de lattaque
- revenir en arrière pour vérifier lacceptabilité du coda
3) Si la syllabe suivante commence par une combinaison de deux consonnes :
a) vérifier sil sagit dune combinaison régulière (cf. test de Bernoulli)
b) si la première consonne est un R , il faut la détacher de lattaque de la syllabe suivante et lattacher à la syllabe précédente comme coda
c) si la première consonne est un l, il faut la transférer au coda de la syllabe précédente
d) si la première consonne est un s, il faut la détacher de lattaque de la syllabe suivante et lattacher à la syllabe précédente comme coda, sauf si la deuxième consonne est s, k, t ou ...
Remarques supplémentaires pour la programmation des règles de syllabation automatique dans la transcription phonématique :
1) les combinaisons de deux consonnes à point darticulation identique :
Þ la première des deux consonnes doit être omise pour la syllabation
Þ coupe syllabique entre les deux consonnes
2) le hiatus (= une exception sur les règles de syllabation automatique) :
Þ coupe syllabique après la finale consonantique
3.4. Conclusion provisoire
Ces quelques règles rudimentaires suffisent pour rendre compte de pas moins de 93% des coupures syllabiques.
29/06/99