Les linguistes spécialisés en phonétique analysent souvent les sons de la parole à l'aide de spectrogrammes. Les spectrogrammes sont utiles pour l'analyse linguistique parce qu'ils te permettent de voir simultanément plusieurs signaux de parole. Par exemple, tu peux voir les fréquences des composantes, les impulsions glottales, le voisement, les formants des voyelles et le lieu d'articulation, le tout sur un seul spectrogramme. Avec un peu d'entraînement, tu peux même estimer ce que dit un orateur en lisant simplement le spectrogramme.
Aussi précieux que soient les spectrogrammes, ils peuvent au départ être un peu écrasants. Pour comprendre ce qui se passe dans un spectrogramme, tu as besoin de quelques informations de base.
Un spectrogramme est un graphique des fréquences composantes d'une onde sonore en fonction du temps. Les fréquences composantes sont la gamme de fréquences présentes dans le son.
Pour clarifier, lorsque tu entends un son unique, tu entends en réalité un grand nombre de fréquences différentes empilées les unes sur les autres. Ces fréquences empilées sont les composantes de l'onde, et la composante la plus basse est la hauteur que tu entends (également appelée fréquence fondamentale, ou F0).
Fig. 1 - Le spectrogramme représente le temps sur l'axe des abscisses, la fréquence sur l'axe des ordonnées et l'amplitude sous forme de différences de couleur ou d'obscurité.
Un spectrogramme montre le temps sur l'axe des x et la fréquence sur l'axe des y. Cela signifie que le bas du spectrogramme correspond à la fréquence la plus basse et le haut à la fréquence la plus élevée. Se déplacer de gauche à droite sur le spectrogramme, c'est avancer dans le temps.
Un spectrogramme présente également une troisième dimension : l'amplitude (le volume sonore). Les différences d'amplitude sont représentées par des différences de couleur ou d'obscurité sur le spectrogramme. Les lignes plus sombres correspondent à des fréquences dont l'amplitude est plus élevée, tandis que les zones plus claires correspondent à des fréquences dont l'amplitude est plus faible.
Spectrogramme et spectre
Le mot spectrogrammevient du mot spectre .
Un spectre est un tracé des composantes d'une onde à un moment donné.
Tu peux considérer un spectre comme un instantané unique d'un spectrogramme. Si tu veux y réfléchir d'une autre manière, un spectrogramme est constitué de nombreux spectres alignés les uns à côté des autres. Chaque grand "pic" visible sur le spectre est l'une des lignes horizontales plus foncées visibles sur le spectrogramme.
Fig. 2 - Un spectre est comme une tranche d'un spectrogramme posée sur le côté, avec la fréquence sur l'axe des x et l'amplitude sur l'axe des y.
Exemples de spectrogrammes
Il existe deux types de spectrogrammes : les spectrogrammes à large bande et les spectrogrammes à bande étroite.
Spectrogramme à large bande
Le type de spectrogramme le plus couramment utilisé pour l'analyse est le spectrogramme à large bande. Ce type de spectrogramme a un aspect plus "flou", avec de nombreuses lignes verticales. Dans la parole, ces lignes verticales représentent les impulsions glottiques : l'ouverture et la fermeture répétées de la glotte. Ces impulsions glottales représentent l'harmonisation des sons de la parole. Un spectrogramme à large bande t'aide à voir comment un son change au fil du temps.
Pour visualiser un spectrogramme à large bande dans ton logiciel d'analyse, règle la "longueur de la fenêtre" sur 0,005 s.1
Spectrogramme à bande étroite
Un spectrogramme à bande étroite ressemble à une série de fines bandes horizontales, un peu comme un filet de poisson. Ces fines bandes sont les composantes de l'onde. Sur un spectrogramme à bande étroite, il est facile de voir les différences d'amplitude entre les différentes composantes.
Pour visualiser un spectrogramme à bande étroite, règle la "longueur de la fenêtre" sur 0,05 s, voire 0,5 s.1
Fig. 3 - Le même clip audio apparaît différemment sur un spectrogramme à bande large et sur un spectrogramme à bande étroite. Le graphique au-dessus du spectrogramme est la forme d'onde du son.
Analyse du spectrogramme
Il est possible d'estimer ce que dit une personne simplement en regardant le spectrogramme de l'énoncé. Tu auras l'occasion de t'exercer à cette tâche dans quelques instants. En attendant, voici quelques signaux que les linguistes recherchent lorsqu'ils analysent un spectrogramme.
Lorsque tu vois plusieurs bandes horizontales foncées sur le spectrogramme, tu es probablement en présence d'une voyelle. Sur un spectrogramme à large bande, tu verras également des lignes verticales représentant les impulsions glottales pendant une voyelle.
Lorsque le spectrogramme est plus clair et ne présente pas de bandes claires, tu es probablement en présence d'une consonne.
Les sections aléatoires et "floues" d'un spectrogramme indiquent souvent des fricatives, comme [f, v, s, z, ʃ, ʒ, h].
Une ligne sombre en bas du spectrogramme pendant une consonne indique le voisement. Tu verras cela dans les consonnes voisées comme [b, d, ɡ, m, n, ŋ, l, v, z]. Si tu ne vois pas cette ligne, tu es probablement en présence d'une consonne sans voix comme [p, t, k, f, s, θ, ʃ].
Pendant une consonne, une zone très sombre en haut du spectrogramme indique probablement une sibilante ; ce sont des mots avec un son s, avec un bruit fort à une fréquence élevée, comme [s, ʃ, ʒ].
Lorsqu'une partie du spectrogramme ressemble à une voyelle mais contient des bandes horizontales moins nombreuses et plus claires, tu es peut-être en présence d'un approximant comme [w, ɹ, l, j].
Ces signaux ne te disent pas tout sur un énoncé, mais ils peuvent t'aider à faire des suppositions éclairées.
Voyelles sur un spectrogramme
Tu te souviens de ces bandes horizontales foncées que tu vois sur le spectrogramme pendant les voyelles ? Ces bandes sont les formants de la voyelle. Les valeurs relatives des formants t'aident à déterminer le lieu d'articulation de la voyelle, ou la position du conduit vocal lors de la production de la voyelle. Les formants les plus pertinents pour l'analyse linguistique sont les trois premiers formants : F1, F2 et F3.
Fig. 4 - Les lignes rouges sur ce spectrogramme indiquent les formants des voyelles.
Le formant le plus bas, F1, t'indique inversement la hauteur d'une voyelle. Plus la F1 est basse, plus la voyelle est haute. F1 est la ligne sombre la plus proche du bas du spectrogramme. Les voyelles hautes sont des sons comme [i], comme dans abeille ou mouton, ou [u], comme dans soupe ou bleu. Ces voyelles auront la valeur F1 la plus basse. Les voyelles basses sont des sons comme [a], comme dans boîte ou fête. Ces voyelles auront la valeur F1 la plus élevée.
Lahauteur de la voyelle fait référence à la hauteur de la langue dans la bouche lors de la production d'une voyelle. Si tu fais attention à la position de ta bouche, tu peux sentir que ta langue est plus haute quand tu dis sheep que quand tu dis shop.
Le formant suivant, F2, t'indique à quel point une voyelle est en arrière. Plus le F2 est bas, plus la voyelle est éloignée. Les voyelles les plus en avant sont les sons comme [i] et [e], comme dans assiette. Les voyelles les plus en arrière sont des sons comme [u] et [o], comme dans pole ou order. Elles ont la valeur F2 la plus basse.
L'arrière fait référence à la position horizontale de la langue lors de la production d'une voyelle. Si tu prononces le mot botte, tu remarqueras que ta langue est poussée vers l'arrière de ta bouche et que c'est la partie arrière de ta langue qui porte le plus de tension. Compare cela au mot betterave, où ta langue est poussée vers l'avant et où la partie antérieure de ta langue est tendue.
Ce tableau résume les valeurs relatives de F1 et F2 pour les cinq voyelles présentes dans la plupart des langues.
Voyelle
Valeur F1
Valeur F2
i (front haut)
bas
haut
e (front moyen)
moyen
haut
a (milieu bas)
haut
moyen
o (milieu du dos)
moyen
bas
u (haut du dos)
bas
bas
Le deuxième formant le plus élevé est F3. F3 ne te dit pas grand-chose sur la plupart des voyelles, mais il joue un rôle unique dans les voyelles de couleur r. Les sons R, comme dans la prononciation américaine générale de bird, ont une valeur F3 très faible par rapport aux autres sons. Ces sons sont donc faciles à repérer sur un spectrogramme.
Tu peux remarquer qu'une quatrième ligne de formants est visible sur un spectrogramme. Des formants plus élevés, notamment F4, F5, etc. apparaissent dans les sons de la parole. Cependant, ces formants ne révèlent pas autant de choses sur les sons de la parole que les F1-F3 et ne sont pas couramment pris en compte dans l'analyse linguistique.
Enfin, les transitions de formants peuvent t'aider à identifier le lieu d'articulation des consonnes voisines. Les formants d'une voyelle changent lorsqu'un locuteur passe d'une consonne à la suivante. La direction de ces changements de formants peut t'aider à déterminer où se trouvent les consonnes. Par exemple, le passage d'une voyelle à un son [k] entraînerait une augmentation de F2 et un abaissement de F3 (c'est ce qu'on appelle un "pincement vélaire" sur un spectrogramme).
Entraînement à la lecture de spectrogrammes
Maintenant, entraîne-toi à analyser un spectrogramme. Les exemples de spectrogrammes présentés dans cette explication ont tous visualisé le même énoncé. Zoome sur le premier quart de l'énoncé : que vois-tu ?
Fig. 5 - Tu peux deviner les sons que tu regardes en analysant certains signaux sur le spectrogramme.
Ce spectrogramme commence par un long segment ne contenant qu'une barre de voisement. Cela indique une consonne voisée qui peut être soutenue pendant longtemps. Il n'y a pas non plus de bruit fort aléatoire, il ne s'agit donc probablement pas d'une fricative. Certains candidats probables sont [m, n] ou [l].
Le segment suivant semble plus fort, d'après les grandes sections sombres. Tu peux également voir des impulsions glottales et des formants visibles. Cela ressemble à une voyelle. F1 semble assez bas, et F2 est très élevé par rapport à F1. Il s'agit probablement d'une voyelle frontale relativement haute.
Le segment suivant présente toujours des formants et des impulsions glottales visibles, mais il est beaucoup plus silencieux. Cela indique qu'il s'agit d'une approximation. F2 et F3 sont très proches l'un de l'autre dans cet énoncé, mais il est clair qu'ils descendent tous les deux jusqu'à un point bas dans ce segment. Ce faible F3 est caractéristique d'un son r.
Le dernier segment ressemble beaucoup au deuxième segment. Cela suggère qu'il s'agit d'une voyelle dont le lieu d'articulation est similaire à celui de la voyelle précédente.
Tu as fait quelques suppositions éclairées - quel est le mot que tu regardes ici ? Il s'avère que ce spectrogramme montre un locuteur prononçant le mot Marie!
Essaie de répéter cette analyse sur le reste des énoncés pour t'entraîner davantage ! Tu peux voir la réponse ci-dessous.
Fig. 6 - Les segments de Mary aime les framboises, annotés à la fois en alphabet latin et en alphabet phonétique international.
Ce spectrogramme montre un locuteur qui dit Mary aime les framboises!
Spectrogramme - Points clés
Un spectrogramme est un graphique des fréquences composantes d'une onde sonore en fonction du temps. Les fréquences composantes sont la gamme de fréquences présentes dans le son.
Il existe deux types de spectrogrammes : les spectrogrammes à large bande et les spectrogrammes à bande étroite.
Un spectrogramme à large bande t'aide à voir comment un son change au fil du temps, tandis qu'un spectrogramme à bande étroite t'aide à voir les différences d'amplitude entre les composantes.
Les bandes horizontales foncées sur un spectrogramme représentent les formants d'une voyelle.
Les signaux visibles sur un spectrogramme ne te disent pas tout sur un énoncé, mais ils peuvent t'aider à faire des suppositions éclairées.
Références
Boersma, Paul & Weenink, David (2022). Praat : faire de la phonétique par ordinateur [Programme informatique]. Version 6.2.23, récupérée le 8 octobre 2022 sur http://www.praat.org/.
Apprends plus vite avec les 13 fiches sur Spectrogramme
Inscris-toi gratuitement pour accéder à toutes nos fiches.
Questions fréquemment posées en Spectrogramme
Qu'est-ce qu'un spectrogramme en linguistique?
Un spectrogramme en linguistique est une représentation visuelle des fréquences sonores d'un signal en fonction du temps.
Comment lire un spectrogramme?
Pour lire un spectrogramme, vous regardez les axes: le temps en abscisse, la fréquence en ordonnée et l'intensité sonore en couleur ou en niveau de gris.
A quoi sert un spectrogramme en études de langues?
Un spectrogramme aide à analyser les sons de la parole, notamment les phonèmes et les intonations, ce qui est utile en phonétique et en linguistique.
Quels outils sont utilisés pour créer un spectrogramme?
Des logiciels comme Praat, MATLAB, et Audacity sont couramment utilisés pour créer et analyser des spectrogrammes.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.