Diacritiques et synthèse vocale

Comme pas mal de geek j’aime bien les machines qui parlent. Mais encore faut-il qu’elles prononcent correctement les mots. Et pour cela, pas la peine de tergiverser, il faut que l’orthographe soit correcte, ce qui inclut les accents.

Dia… quoi ?

Les diacritiques sont des signes qui servent à modifier la prononciation des lettres (ou graphèmes).
Une langue est constituée de phonèmes, dont le nombre est limité d’ailleurs. Dans l’alphabet latin les phonèmes sont représentés par les 26 lettres. Évidemment ces lettres ne suffisent pas d’où l’usage d’accents, cédilles et autres signes.
Pour assurer une bonne compréhension des mots les diacritiques doivent donc être utilisées avec les minuscules mais aussi les majuscules.

Certes, mais moi on m’a appris à ne pas mettre d’accent sur les majuscules.

Un dictionnaire, ça vous parle ? Parce que jeter un œil dans un Larousse ou un Robert permet d’avoir l’assurance qu’en français les majuscules et les capitales sont accentuées.
En informatique c’est la règle typographique et non pas la règle dactylographique qui s’applique. Un ordinateur ce n’est pas une machine à écrire. De plus les règles utilisées en dactylographie sont issues de l’anglais (version outre-atlantique), la seule langue utilisant l’alphabet latin ne connaissant pas les diacritiques.
En clair une machine à écrire est une forme d’appauvrissement de la langue.

Et le rapport avec la synthèse vocale ?

Une synthèse vocale va fonctionner suivant deux concepts bien connus :

  • la méthode globale ;
  • la méthode syllabique.

Avec la méthode globale les mots sont enregistrés à l’avance, de préférence par une charmante voix, et restitués dans un environnement « maîtrisé ». On obtient donc une qualité vocale élevée (façon GPS ou annonce SNCF) mais au prix d’un vocabulaire limité. À titre d’information le français moderne comporte plus de 100 000 mots, auxquels il faut ajouter les conjugaisons des verbes (12 000 verbes dans le Bescherelle) et les noms propres (36 700 communes sur le territoire national). Enregistrer l’intégralité des mots français est une tâche colossale.
Avec la méthode syllabique les phonèmes sont enregistrés, le logiciel de lecture les assemble pour constituer les syllabes et donc restituer les mots. La qualité vocale est plus faible mais le nombre de mots qui peut être restitué est virtuellement sans limite. C’est cette méthode qui domine sur le marché, notamment pour la lecture de sites Web.

Exemples concrets.

Je pars du principe que votre site Web est codé en UTF8. Si ce n’est pas le cas je vous invite à faire la conversion.
Vous écrivez en capitale le mot « retraité », ce qui sans accent donne « RETRAITE ». Si la phrase est du style « les retraités sont dans la rue » pour la plupart des lecteurs le texte aura du sens.
Mais un lecteur d’écran (logiciel qui fournit les informations au synthétiseur vocal) lui verra le mot /ʁə.tʁɛt/ et non pas le mot /ʁə.tʁɛ.te/. Vous noterez qu’entre les deux mots seule la dernière syllabe diffère. La faute à l’accent sur le e.
Autre exemple, plus concret, le mot « résumé » qui en capitale donne « RESUME ». Dans ce cas 2 syllabes sur 3 diffèrent.

Bien sûr j’en entend qui vont me dire, « oui, mais avec Google, t’as pas de problème d’accent » ou « bien moi, je comprends la différence ».

D’abord pour ce qui concerne les moteurs de recherche ceux-ci utilisent des systèmes d’interclassement qui font le lien entre les différentes variantes d’un graphème. Hors cela n’affecte que l’orthographe et non pas la prononciation. De plus cette méthode entraîne une ambiguïté entre les mots : « retraite » et « retraité » n’ont pas du tout le même sens bien qu’ils appartiennent au même champ lexical.
Attardons-nous sur les sons « re » et « ré » (resume ou résumé). Dans le premier cas le code Unicode donne 0052 0045 (RE), dans le second cas le code est 0052 00C9 (RÉ). Les langages de programmation ne connaissent pas le concept « d’ambiguïté ». Dans le premier cas le logiciel rendra le son /ʁə/ et dans le second /ʁe/. Le système de correspondance entre phonème et graphème est utilisé mécaniquement par le logiciel, il n’y a aucune forme de réflexion.
Quelques tests sur des acronymes courants (genre EDF) permettent de se rendre compte du problème. Et je passe sur des mots comme « charisme » (cha ou ka ?).

Pour finir

Les règles d’orthographe et d’orthotypographie sont anciennes. Elles ont pour but d’aider à la compréhension du message écrit. Ne pas les respecter c’est ne pas respecter le lecteur, qui donc quittera votre site rapidement.
Dans les cas des personnes mal-voyantes ce type d’erreur peut rendre la navigation malaisée.
Tout ceci montre que pour rendre un site Web accessible le simple fait d’apprendre à se servir d’un clavier (et d’un vulgaire traitement de texte) permet de faire un pas en avant.
Encore faut-il avoir la volonté d’apprendre. Et là, c’est pas gagné.

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

La discussion continue ailleurs

URL de rétrolien : http://blog.philippe-poisse.eu/index.php?trackback/40

Fil des commentaires de ce billet