Simulation de champs acoustiques : en partant du principe que l'auditeur est immergé dans un champ acoustique artificiel, son système auditif peut être exposé à des paramètres spectraux qui correspondent pour eux à l'équivalent d'une situation d'écoute naturelle. Si les sons reproduit approchent ceux qu'ils devraient être en situation naturelle, le résultat de la localisation devrait correspondre à ces derniers. Grâce à la reproduction d'un stimulus physique (champ acoustique) qui est seulement axé sur la reproduction des propriétés physiques d'une distribution de signaux dans l'espace. Trois types de problèmes sur les champs acoustiques peuvent être identifié.

Type de problème : diffusion interne au système d'écoute.

Il correspond au problème de restitution d'un champ acoustique à l'intérieur du système de diffusion (voir figure). Les repères noirs indiquent les sources reproduites. Le champ acoustique reproduit est donné comme une onde plane ayant une direction de propagation.

Ambisonics

synthèse d'une onde planeEst une technique bien connue depuis les années 70. Le champ acoustique cible (qui peut être reproduit) est décrit par ses harmoniques cylindrique (si l'on travaille en 2D. Un jeu de solutions orthogonales de l'équation des ondes exprimée en coordonnées cylindriques). Un réseau de sources (de haut-parleurs) est utilisé pour recréer ces harmoniques sphériques (mesurées ou synthétisées) au point d'écoute. Si l'ordre Ambisonics est augmentée (le nombre d'harmoniques), alors le sweet spot grandit (en fonction de la fréquence). Ambisonics comme le 5.1 souffre probablement d'une mauvaise implantation en pratiques du système de diffusion par des personnes non expertes.

Il est relativement facile de comprendre Ambisonics comme un filtre passe-bas spatial de la WFS. Par conséquence, Ambisonics, par opposition avec la WFS, implique la contribution de l'ensemble du sytème de diffusion (toute les haut-parleurs émettent un signal même si logiquement il ne devraient pas). Typiquement, le décodage ambisonique est la multiplication d'un signal mono résultant d'un jeu linéaire de gains qui produisent un jeu de signaux. Chaque gain est associé à une source reproduite. Pour une source dynamique, ces même gains varient dans le temps. Il est important de noter que certains gains deviennent négatifs (hors phase) et devraient être (j'avais noté quelques implémentation d'Ambisonics qui négligeaient le signe, c'est une erreur qui viole l'idée d'origine qui est derrière Ambisonics).

Le son Ambisonics classique est un problème intérieur de la reproduction du champ acoustique depuis il reproduit la pression acoustique qui est donnée par la reproduction des sources dans l'espace de diffusion.

Wave Field Synthesis

Elle est connue pour être la plus prometteuse technique d'un champ acoustique simulé pour le problème intérieur. Utilisant un réseau de haut-parleurs (espacement très réduit des haut-parleurs) entourant la surface d'écoute. La WFS vise à reconstruire un champ acoustique (la pression acoustique physique en amplitude et phase) dans une large zone d'écoute. Puisque le champ acoustique est reproduit sur une large zone d'écoute (en opposition avec les systèmes possédant un sweet spot : une zone d'écoute optimale restreinte à un auditeur seul), l'auditeur peut avoir une expérience des sons en perspective consistente lorsqu'il se déplace (on peut adopter une position d'écoute différente que la position d'écoute au centre du système de diffusion). Par exemple, la sensation de perspective peut apparaitre avec source sonores virtuelles proches et loin. La plus éloignée semble garder toujours la même direction angulaire par rapport à l'auditeur (la source suit l'auditeur dans son déplacement).

Autres techniques

Reproduction par intensité : cette approche, explorée par de nombreux chercheurs est moins communes dans des produits commerciaux ou dans les pratiques habituelles, est concernée par la reproduction d'un champ par intensité (amplitude et direction spatiales de l'intensité sonore) dans une zone de l'espace. Typiquement, l'intensité d'un champ cible est prévu et le système de reproduction essaye d'approcher cette cible. L'intensité du champ cible peut être décrit par la position des sources virtuelles ou par un champ plus exotique (un simple exemple est la création d'une zone de silence juste derrière et une zone sonore illuminée : l'un est capable d'apprécier le silence derrière un ami ou un partenaire qui écoute de la musique). La reproduction d'un champ par intensité est quelque chose ressemblant à une simplification de la WFS, le champ cible est décrit par un paramètre général : intensité. La distribution spatiale de la phase est négligée.

L'intensité sonore : est une mesure vectoreille (directionnel) de la propagation de l'énergie sonore (Watts mécanique) par unité de surface (1m2). A quelques mètres de la source, le champ d'intensité sonore est un champ de vecteurs tous alignés avec la propagation du son, à partir de la source entourant le volume.

Reproduction des propriétés statistiques d'un champ acoustique : divers paramètres physiques du champ acoustique (diffusion, corrélation spatiale, énergie, etc...) sont reproduits comme des fonctions de coordonnées spatiales.

Type de problème : extrapolation du champ acoustique

SFE est le cas limite entre le problème de diffusion interne au système d'écoute et le problème de diffusion aux limites du système d'écoute. Cela correspond à un film dans le domaine visuel, SFE est la simulation d'un champ acoustique à l'intérieur d'un volume qui est adjacent à la reproduction de la surface d'une source. Un exemple simple est une audience faisant face au système d'extrapolation du champ et que les sources virtuelles soient derrière ce système.

La WFS pour la SFE est un simple cas "dégénéré" de la WFS pour le problème de diffusion à l'intérieur du système d'écoute : la zone d'écoute tend à être un espace semi infini faisant face à un réseau de source reproduit infini. Dans une implémentation pratique réelle, le réseau de reproduction est tronqué spatialement.

Type de problème : la diffusion extérieure au système d'écoute

synthèse d'une onde plane 2Ce problème correspond à la simulation d'un champ acoustique dans un volume qui entoure un jeu de sources complexes. Comme le montre la figure, les marques noires indiquent les sources reproduites. Le champ reproduit correspond à des ondes planes orientées dans le sens des flêches.

Le motif de reproduction de la directivité : dans ce cas, un réseau de source dense est utilisé pour synthétisé ou reproduire le motif de rayonnement d'une source. La directivité de la source synthétisée est ensuite utilisé comme un instrument. Un système versatile de reproduction de la directivité peut ensuite imiter le motif de rayonnement d'un violon ou d'une trompette (la directivité dépendant de la fréquence).

Simulation de la perception

Cette approche implique l'illusion d'une source positionnée dans un espace 3D basé sur la connaissances des mécanismes de localisation. Cela implique qu'une partie du processus d'écoute naturelle soit inclue ou simulée par la technique de simulation de la perception.

La stéréophonie

principe stéréophoniqueLa stéréophonie vise à créer une source fantôme entre un ou plusieurs haut-parleurs. (sur la figure, les lignes vertes et les flêches montrent l'illusion reproduite).

La stéréophonie est basée sur le double principe qui est un simple modèle de l'arrivée d'un son aux oreilles : la différence interaurale d'intensité IID et la différence interaurale de temps ITD. Ces deux paramètres créent typiquement une latéralisation dans une situation d'écoute naturelle. La stéréophonie d'intensité et de temps sont basés respectivement sur ces deux paramètres. En utilisant un ou plusieurs haut-parleurs, on reproduit à l'oreille de l'auditeur au point d'écoute un IID et/ou un ITD.

En accord avec cette définition, une source stéréophonique est une approche simulée de la perception. En effet, la stéréo essaye de reproduire ces deux paramètres qui sont dérivés d'un stimulus physique de l'écoute spatiale (le champ acoustique dans lequel est immergé l'auditeur) sans simulation du stimulus physique (le champ acoustique en lui même). Comme une source stéréo est inspiré de la connaissance de la perception humaine, cela simule la perception spatiale d'un son pour créer une illusion auditive [W.B. Snow, Basic Principles of Stereophonic Sound, 1953].

Convention (notation) d'un systême stéréophonique. Par convention, un système stéréophonique s'étend à l'ensemble des systèmes multicanaux. On déclare x-y.z où x est le nombre de haut-parleurs frontaux, y le nombre de haut-parleurs surround et z le nombre de caissons de basse. Un home cinema typique possèdera un système 3-2.1 (ou 5.1) avec 3 canaux frontaux, 2 canaux surround et un caisson de basse.

Il est plus facile de comprendre un système multicanal stéréophonique lorsque l'on utilise uniquement deux haut-parleurs. Ces derniers, utilisant une différence de temps et d'intensité fonctionnent ensemble et simule un IID et un ITD au point d'écoute.

La stéréophonie, comme technique de simulation de la perception, est de temps à autres controversé. Par exemple, on a tendance à dire que si l'on utilise un seul haut-parleur placé dans l'espace et que l'on y diffuse un son, on utilise une approche stéréophonique qui n'est pas reliée à la simulation de la perception. Cette affirmation est fausse car ceci n'est pas une approche stéréophonique mais monophonique. Par conséquence, ceci ne peut être pris en compte dans cette classification des méthodes de reproduction spatiales qui inclue uniquement la reproduction artificielle d'une scène sonore.

Les systèmes stéréo tendent à s'approcher de la WFS puisque le nombre de haut-parleurs augmente (dans l'idée où l'on dépasse 50 ou 100 haut-parleurs). Une idée de cette approche est données par Jessel.

La technique binaurale

principe binauralUtilisant un mannequin constitué d'une tête artificielle et de deux oreilles hébergeant chacune un microphone permet la réalisation d'un enregistrement binaural. Un enregistrement binaural inclue les indices spectraux causés par le filtrage de la tête de l'auditeur (diffraction, résonance de l'oreille externe ...) pour un son provenant de n'importe quelle direction. Ces filtres dépendent de l'incidence de l'angle d'incidence de la source sonore. La reproduction d'un enregistrement binaural par le biais d'un casque permet de recréer la pression acoustique aux oreilles de l'auditeur telle qu'elle serait en condition d'écoute naturelle. Ceci est classé comme une simulation de la perception puisque la reproduction binaurale simule la perception pré-auditive causé par le filtrage de l'oreille externe. Il est possible de remplacer le mannequin et la tête artificielle par une paire de micro binauraux et une tête humaine.

La synthèse binaurale est basée sur les mêmes principes que la reproduction. Pour la synthèse, l'enregistrement est remplacé par deux signaux obtenus par convolution d'un signal monophonique (et anéchoïque) et de la réponse enregistrée par deux microphones à partir d'un haut-parleur (sa position correspond à la position virtuelle de la source) aux oreilles de l'auditeur (ou du mannequin). Il est nécessaire d'avoir une banque de réponse des deux microphones car elle changent pour chaque position.

Approche signal ou simulation de la perception ? Plusieurs chercheurs suggèrent que les sons binauraux ne devraient pas être décrit comme étant une simulation de la perception mais comme une approche signal. Ici, nous allons décrire pourquoi je classe les sons binauraux dans une approche de simulation de la perception. Dans ma définition de la perception sonore, je fais référence à tout le processus de perception du son. Donc, dans ce contexte, la perception sonore n'inclue pas uniquement l'impression résultante, mais plutôt la perception comme un mécanisme. Comme tout le processus de perception commence avec la présence physique d'un auditeur, je suppose que les distortions spatiales causées par la présence de l'auditeur sont le point de départ de la perception sonore. C'est la partie mécanique de la perception d'un son. Donc le binaural est une approche de la simulation de la perception puisqu'il simule le premier pas de la perception sonore (filtrage induit par le torse, la tête et l'oreille externe).

Casque ou haut-parleurs ? La reproduction binaurale se fait généralement au casque. Le casque prévient des problèmes de diaphonie entre les deux signaux. La reproduction binaurale avec des haut-parleurs est possible mais requière une annulation de la diaphonie. Dans ce cas, les haut-parleurs se comportent comme un casque éloigné créant deux signaux indépendants aux oreilles de l'auditeur. Malheureusement, l'auditeur ne doit pas bouger sauf si le système de diffusion inclue un système de head tracking (permettant d'adapter les filtre en fonction du mouvement de la tête).

Source originale de l'article : Artificial reproduction of the natural spatial character of hearing