2. Information phonétique
Afin de rendre compte des plus importantes caractéristiques au niveau de la prononciation, la transcription graphique comprend de nombreuses informations phonétiques.
2.1. Typologie
Les annotations suivantes ont été prévues pour tous les corpus : les pauses (2.1.1.), les réductions vocaliques ou consonantiques (2.1.2.) et les allongements syllabiques (2.1.3.). La rigueur avec laquelle ces annotations ont été appliquées est toutefois quelque peu différente pour les corpus ELILAP et LANCOM. Les responsables du projet ELILAP ont opté pour un encodage exhaustif et ont identifié vraiment tout ce qui peut être identifié, en partant du principe quil vaut mieux ajouter des marques superflues plutôt que d'n omettre, ce qui entraîne parfois des redondances. Les promoteurs du projet LANCOM, par contre, ont avant tout signalé les erreurs.
Les responsables du projet ELILAP ont de plus prévu des annotations pour les cas suivants : lenchaînement (2.1.4.), la liaison (2.1.5.), la gémination (2.1.6.) et lappui marqué de la consonne finale (2.1.7.). Ces annotations n'ont pas été retenues dans LANCOM.
Les pauses sont classées en trois catégories : les pauses courtes, moyennes et longues. La durée des pauses correspond à la convention suivante : une pause est déclarée longue lorsque le transcripteur peut compter jusquà huit selon un rythme convenu, courte sil ne dépasse pas quatre, la pause moyenne se situant entre quatre et huit.
2.1.2. Les réductions vocaliques ou consonantiques
Par réduction vocalique ou consonantique, est entendue la chute dune voyelle ou dune consonne normalement prononcée ou prononcée dans certains cas. Ainsi, dans la séquence quatre personnes, quatre est couramment prononcée [k a t ]. La chute du e muet en est un cas particulier. Dans les corpus ELILAP, tous les e muets instables élidés sont indiqués par un signe, afin d'éviter le piège de la normalisation, même si, dans certains cas, ceci revient à supprimer un élément qui, en principe, n'est jamais produit à loral (comme dans année, jolie).
2.1.3. Les allongements syllabiques
Lallongement dune syllabe est indiqué lorsquil fait apparaître une prononciation marquée. Cest souvent le cas devant une pause.
« Lenchaînement consonantique est le phénomène qui, dans un groupe phonétique où se suivent deux mots dont le premier est à finale consonantique, le second à initiale vocalique, consiste à lier la consonne finale à lélément vocalique initial. Dans le système phonétique français, la consonne finale du premier mot tend à former syllabe avec le mot suivant, et est perçue comme linitiale de ce mot. Ceci sobserve le mieux dans les cas où il y a hésitation ou un léger arrêt entre deux mots successifs. En dehors de ces cas, les mots se succèdent sans aucune interruption. » (DEBROCK, M. & MERTENS, P., Phonétique générale et française, Une introduction, Presses Universitaires de Louvain, 1993, p. 48)
Exemple : il arrête un voleur (Les consonnes finales concernées ('l' et 't') sont toujours prononcées, même lorsque les mots suivants commencent par une consonne.)
Etant donné que lenchaînement est la règle, il nest pas marqué. Les cas de non-enchaînement, cest-à-dire lorsque la consonne finale ne sappuie pas sur la voyelle initiale suivante, font exception et sont donc être signalés.
« La liaison consonantique est le phénomène qui consiste à faire apparaître dans un groupe phonétique [Il s'agit également d'un mot à finale consonantique suivi d'un mot à initiale vocalique.], une consonne finale normalement muette [Lorsque le mot suivant n'a pas d'initiale vocalique.] (...) et à la lier à un élément vocalique initial. (...) la consonne de liaison tend à devenir linitiale du mot suivant. » (Ibidem)
Exemple : le petit âne (Contrairement à la consonne d'enchaînement, la consonne de liaison 't' est prononcé uniquement lorsque entre les mots en question, il existe un lien syntaxique et que le dernier mot commence par une voyelle.)
Tous les cas de liaison sont indiqués par la même étiquette (voir 2.2. Encodage). Il s'agit aussi bien des cas de liaison obligatoire, que des cas où une liaison facultative est réalisée. Par contre, les cas de liaison facultative non réalisée sont indiqués par une autre étiquette. Le marquage de la non-liaison doit faciliter le recensement des contextes où la liaison aurait pu être réalisée. Seuls les cas où la liaison est interdite ne sont pas marqués.
Lorsque deux consonnes ayant le même lieu darticulation soit quelles sont identiques, soit quelles ne diffèrent que par le trait de voisement entrent en contact, souvent à la suite de la chute d'un e muet (à la jonction de deux mots ou, parfois, à lintérieur dun mot), ceci peut donner lieu à la réalisation dune géminée.
Exemple : un arabe bavard, un homme moderne, extrêmement, il l' dit
Les cas de gémination sont marqués. Labsence de notation, par contre, implique que la gémination est neutralisée dans la prononciation.
2.1.7. L'appui marqué de la consonne finale
Lappui marqué de la consonne finale entraîne parfois lapparition dun e muet à valeur syllabique (Il ne s'agit pas ici d'une simple détente consonantique). Ce renforcement est peu fréquent, mais nettement perceptible ; il semble apparaître de préférence devant une pause.
Au départ, lencodage des annotations variait d'un corpus à l'autre. En cherchant à uniformiser le plus possible ces annotations selon les conventions de SGML, il n'a cependant pas été possible de les transformer toutes. Aussi a-t-il été décidé de maintenir deux versions du corpus. Dans la première version, tous les signes sont conservés tels quels. [Les signes originels n'étant pas séparés du texte par un blanc, il est impossible d'effectuer des requêtes exhaustives, puisque tous les mots pourvus d'un signe deviennent nécessairement exclus des résultats des recherches.] Dans lautre version, seul le marquage qui a pu être transformé en étiquettes SGML a été repris. Le tableau ci-dessous reprend aussi bien les signes originels que les nouvelles étiquettes SGML.
Les signes placés à la jonction de deux mots ont pu être transformés facilement, les nouvelles étiquettes SGML étant séparées du texte par un blanc. Ainsi la signalisation des pauses, de la liaison, de la non-liaison, du non-enchaînement et des voyelles allongées na pas posé de problèmes. [Dans le cas des voyelles allongées, le signe originel est bel et bien placé à l'intérieur du mot, mais il n'y a généralement pas de doute quant à la voyelle concernée.]
Les signes placés à lintérieur dun mot, par contre, ne peuvent être remplacés aussi facilement. Si létiquette est placée derrière le mot en question, toute information concernant lendroit exact où se manifeste le phénomène se perd. [La position aurait pu être indiquée à lintérieur de létiquette SGML. Pourtant cette possibilité n'a pas été retenue, le système dencodage devenant ainsi trop complexe.] Il sagit des phénomènes suivants : les réductions vocaliques ou consonantiques, les géminées et les consonnes finales hyperaccentuées.
Tableau : Les signes originels et les nouvelles étiquettes SGML
| Phénomène | Signe originel | Exemple | Etiquette SGML | Exemple |
| Pause | Pause courte : = Pause moyenne : = = Pause longue : = = = |
il a vu sa = fille = dans cette robe = alors j' ai dit monsieur = les manches = = il dit c' est formidable c' est sensationnel = | <ph_pause l=L> L=length (1, 2, 3) | il a vu sa <ph_pause l=1> fille <ph_pause l=1> dans cette robe <ph_pause l=1> alors j' ai dit monsieur <ph_pause l=1> les manches <ph_pause l=2> il dit c' est formidable c' est sensationnel <ph_pause l=1> |
| Liaison (liaison obligatoire et liaison facultative réalisée) |
+ | vous+ avez la retraite vieillesse | <ph_liaison> | vous <ph_liaison> avez la retraite vieillesse |
| Non-liaison (liaison facultative non réalisée) |
* | j' ai toujours* aimé mon métier | <ph_noliaison> | j' ai toujours <ph_noliaison> aimé mon métier |
| Non-enchaînement | | | il a son diplôme d' ingénieur| à la fin là du mois | <ph_break> | il a son diplôme d' ingénieur <ph_break> à la fin là du mois |
| Voyelle allongée | : | étudia:nts mai:s euh: |
<ph_long> | étudiants <ph_long> mais <ph_long> euh <ph_long> |
| Réduction vocalique ou consonantique | / ELILAP : la barre oblique est placée après le son en question LANCOM : la barre oblique est placée devant le son concerné |
ELILAP : seule/ment mon re/pas de/ midi
LANCOM : |
||
| Géminée | @ | je préfér@e/rais comm@e/ ministre/ |
||
| Consonne finale hyperaccentuée | , | un truc, tandis, que |
08/01/01