2. Information phonétique

Afin de rendre compte des plus importantes caractéristiques au niveau de la prononciation, la transcription graphique comprend de nombreuses informations phonétiques.

 

2.1. Typologie

Les annotations suivantes ont été prévues pour tous les corpus : les pauses (2.1.1.), les réductions vocaliques ou consonantiques (2.1.2.) et les allongements syllabiques (2.1.3.). La rigueur avec laquelle ces annotations ont été appliquées est toutefois quelque peu différente pour les corpus ELILAP et LANCOM. Les responsables du projet ELILAP ont opté pour un encodage exhaustif et ont identifié vraiment tout ce qui peut être identifié, en partant du principe qu’il vaut mieux ajouter des marques superflues plutôt que d'n omettre, ce qui entraîne parfois des redondances. Les promoteurs du projet LANCOM, par contre, ont avant tout signalé les erreurs.

Les responsables du projet ELILAP ont de plus prévu des annotations pour les cas suivants : l’enchaînement (2.1.4.), la liaison (2.1.5.), la gémination (2.1.6.) et l’appui marqué de la consonne finale (2.1.7.). Ces annotations n'ont pas été retenues dans LANCOM.

 

2.1.1. Les pauses

Les pauses sont classées en trois catégories : les pauses courtes, moyennes et longues. La durée des pauses correspond à la convention suivante : une pause est déclarée ‘longue’ lorsque le transcripteur peut compter jusqu’à huit selon un rythme convenu, ‘courte’ s’il ne dépasse pas quatre, la pause ‘moyenne’ se situant entre quatre et huit.

 

2.1.2. Les réductions vocaliques ou consonantiques

Par réduction vocalique ou consonantique, est entendue la chute d’une voyelle ou d’une consonne normalement prononcée ou prononcée dans certains cas. Ainsi, dans la séquence quatre personnes, quatre est couramment prononcée [k a t ]. La chute du e muet en est un cas particulier. Dans les corpus ELILAP, tous les e muets instables élidés sont indiqués par un signe, afin d'éviter le piège de la normalisation, même si, dans certains cas, ceci revient à supprimer un élément qui, en principe, n'est jamais produit à l’oral (comme dans année, jolie).

 

2.1.3. Les allongements syllabiques

L’allongement d’une syllabe est indiqué lorsqu’il fait apparaître une prononciation marquée. C’est souvent le cas devant une pause.

 

2.1.4. L’enchaînement

 L’enchaînement consonantique est le phénomène qui, dans un groupe phonétique où se suivent deux mots dont le premier est à finale consonantique, le second à initiale vocalique, consiste à lier la consonne finale à l’élément vocalique initial. Dans le système phonétique français, la consonne finale du premier mot tend à former syllabe avec le mot suivant, et est perçue comme l’initiale de ce mot. Ceci s’observe le mieux dans les cas où il y a hésitation ou un léger arrêt entre deux mots successifs. En dehors de ces cas, les mots se succèdent sans aucune interruption.  (DEBROCK, M. & MERTENS, P., Phonétique générale et française, Une introduction, Presses Universitaires de Louvain, 1993, p. 48)

Exemple : il arrête un voleur (Les consonnes finales concernées ('l' et 't') sont toujours prononcées, même lorsque les mots suivants commencent par une consonne.)

Etant donné que l’enchaînement est la règle, il n’est pas marqué. Les cas de non-enchaînement, c’est-à-dire lorsque la consonne finale ne s’appuie pas sur la voyelle initiale suivante, font exception et sont donc être signalés.

 

2.1.5. La liaison

 La liaison consonantique est le phénomène qui consiste à faire apparaître dans un groupe phonétique [Il s'agit également d'un mot à finale consonantique suivi d'un mot à initiale vocalique.], une consonne finale normalement muette [Lorsque le mot suivant n'a pas d'initiale vocalique.] (...) et à la lier à un élément vocalique initial. (...) la consonne de liaison tend à devenir l’initiale du mot suivant.  (Ibidem)

Exemple : le petit âne (Contrairement à la consonne d'enchaînement, la consonne de liaison 't' est prononcé uniquement lorsque entre les mots en question, il existe un lien syntaxique et que le dernier mot commence par une voyelle.)

Tous les cas de liaison sont indiqués par la même étiquette (voir 2.2. Encodage). Il s'agit aussi bien des cas de liaison obligatoire, que des cas où une liaison facultative est réalisée. Par contre, les cas de liaison facultative non réalisée sont indiqués par une autre étiquette. Le marquage de la non-liaison doit faciliter le recensement des contextes où la liaison aurait pu être réalisée. Seuls les cas où la liaison est interdite ne sont pas marqués.

 

2.1.6. La gémination

Lorsque deux consonnes ayant le même lieu d’articulation – soit qu’elles sont identiques, soit qu’elles ne diffèrent que par le trait de voisement – entrent en contact, souvent à la suite de la chute d'un e muet (à la jonction de deux mots ou, parfois, à l’intérieur d’un mot), ceci peut donner lieu à la réalisation d’une géminée.

Exemple : un arabe bavard, un homme moderne, extrêmement, il l' dit

Les cas de gémination sont marqués. L’absence de notation, par contre, implique que la gémination est neutralisée dans la prononciation.

 

2.1.7. L'appui marqué de la consonne finale

L’appui marqué de la consonne finale entraîne parfois l’apparition d’un e muet à valeur syllabique (Il ne s'agit pas ici d'une simple détente consonantique). Ce renforcement est peu fréquent, mais nettement perceptible ; il semble apparaître de préférence devant une pause.

 

2.2. Encodage

Au départ, l’encodage des annotations variait d'un corpus à l'autre. En cherchant à uniformiser le plus possible ces annotations selon les conventions de SGML, il n'a cependant pas été possible de les transformer toutes. Aussi a-t-il été décidé de maintenir deux versions du corpus. Dans la première version, tous les signes sont conservés tels quels. [Les signes originels n'étant pas séparés du texte par un blanc, il est impossible d'effectuer des requêtes exhaustives, puisque tous les mots pourvus d'un signe deviennent nécessairement exclus des résultats des recherches.] Dans l’autre version, seul le marquage qui a pu être transformé en étiquettes SGML a été repris. Le tableau ci-dessous reprend aussi bien les signes originels que les nouvelles étiquettes SGML.

Les signes placés à la jonction de deux mots ont pu être transformés facilement, les nouvelles étiquettes SGML étant séparées du texte par un blanc. Ainsi la signalisation des pauses, de la liaison, de la non-liaison, du non-enchaînement et des voyelles allongées n’a pas posé de problèmes. [Dans le cas des voyelles allongées, le signe originel est bel et bien placé à l'intérieur du mot, mais il n'y a généralement pas de doute quant à la voyelle concernée.]

Les signes placés à l’intérieur d’un mot, par contre, ne peuvent être remplacés aussi facilement. Si l’étiquette est placée derrière le mot en question, toute information concernant l’endroit exact où se manifeste le phénomène se perd. [La position aurait pu être indiquée à l’intérieur de l’étiquette SGML. Pourtant cette possibilité n'a pas été retenue, le système d’encodage devenant ainsi trop complexe.] Il s’agit des phénomènes suivants : les réductions vocaliques ou consonantiques, les géminées et les consonnes finales hyperaccentuées.

 

Tableau : Les signes originels et les nouvelles étiquettes SGML

Phénomène Signe originel Exemple Etiquette SGML Exemple
Pause Pause courte : =

Pause moyenne : = =

Pause longue : = = =

il a vu sa = fille = dans cette robe = alors j' ai dit monsieur = les manches = = il dit c' est formidable c' est sensationnel = <ph_pause l=L> L=length (1, 2, 3) il a vu sa <ph_pause l=1> fille <ph_pause l=1> dans cette robe <ph_pause l=1> alors j' ai dit monsieur <ph_pause l=1> les manches <ph_pause l=2> il dit c' est formidable c' est sensationnel <ph_pause l=1>
Liaison
(liaison obligatoire et liaison facultative réalisée)
+ vous+ avez la retraite vieillesse <ph_liaison> vous <ph_liaison> avez la retraite vieillesse
Non-liaison
(liaison facultative non réalisée)
* j' ai toujours* aimé mon métier <ph_noliaison> j' ai toujours <ph_noliaison> aimé mon métier
Non-enchaînement | il a son diplôme d' ingénieur| à la fin là du mois <ph_break> il a son diplôme d' ingénieur <ph_break> à la fin là du mois
Voyelle allongée : étudia:nts
mai:s
euh:
<ph_long> étudiants <ph_long>
mais <ph_long>
euh <ph_long>
Réduction vocalique ou consonantique /

ELILAP : la barre oblique est placée après le son en question

LANCOM : la barre oblique est placée devant le son concerné




ELILAP :
seule/ment mon re/pas de/ midi

 

LANCOM :
p/etit déjeuner
je n/e travaille pas

   
Géminée @ je préfér@e/rais
comm@e/ ministre/
   
Consonne finale hyperaccentuée , un truc,
tandis, que
   

 

08/01/01