- Ne confondons pas échantillonnage et marchandage ! (2) V2- Le numérique, comment ça marche ? (4)

samedi 13 juin 2009 , par Hervé BERNARD dit RVB

La numérisation implique de transformer un signal analogique continu en un signal discontinu ou discret. C’est ce processus d’échantillonnage qui fait passer le signal de l’état continu à l’état discontinu. En effet, numériser implique d’appliquer une valeur numérique à chacun des échantillons prélevés sur le signal. Ce prélèvement ne peut être que discontinu. Pour un son, par exemple, il serait impossible de faire cette mesure tous les 1/1000^e de seconde, non seulement, il faudrait des instruments de mesure capable de travailler à cette cadence, mais la quantité d’informations à gérer deviendraitt rapidement pharamineuse.

Comme cette valeur numérique ne peut-être arbitraire, on va donc mesurer (quantifier) chacun de ces échantillons, cette mesure nous fournira leur valeur numérique. Dans le cas du champ de tomate, cette valeur correspondra à son prix au kilo, dans le cas d’un signal numérique, cette valeur correspondra à un nombre de bits.

Comme nous l’avons vu pour le champ de tomates, la première étape de la numérisation consiste à déterminer la distance entre chaque échantillon couramment appelé : pas d’échantillonnage. C’est ce pas qui va déterminer le nombre d’échantillon prélevé à la seconde pour un son, ou, pour une image, le nombre de pixels contenu sur la surface du capteur. Dans le cas d’un film cinématographique, nous sommes en présence de deux type d’échantillonnage :
– celui de chacun des photogrammes qui déterminera la définition de chacune des images de notre film ;
– celui du mouvement, qui est déterminé par le nombre d’images enregistrée à la seconde. Pour un film cinématographique dont la cadence est de 24 images à la seconde, le pas d’échantillonnage sera de 1/24è de seconde tandis que pour une vidéo il sera, en Europe de 25 images à la seconde (soit1/25é) et de 30 images à la seconde (soit1/30é) aux États-Unis d’Amérique du Nord.

Prélever des échantillons, c’est découper le signal analogique (continu) en un nombre x de tranches pour les mesurer à intervalles réguliers afin d’obtenir un certain nombre de valeurs. La distance entre chaque prise d’échantillon est le pas d’échantillonnage. Plus cette distance est petite, meilleur est la qualité de l’échantillonnage. Cependant, cette qualité dépend aussi de la régularité du pas [1] ou intervalle d’échantillonnage.

– D’une part, la difficulté de cette opération est d’estimer le nombre d’échantillons nécessaire pour que leur succession puisse se substituer au signal original.
– D’autre part, il ne suffit donc pas seulement de travailler en numérique, il faut aussi avant tout bien échantillonner. Un son haché, une droite en escalier sont le résultat d’un trop grand pas d’échantillonnage. C’est-à-dire d’une distance trop importante entre chaque prélèvement. Le pas d’échantillonnage est donc déjà, à lui seul, une manière de discriminer l’information. De fait, si ce pas est trop important, comme aucune valeur ne correspond aux espaces situés entre deux échantillons, même si la mesure est précise, nous aurons une importante perte d’information.

Cette illustration représente un signal analogique et un signal numérique. Comme on peut le voir, entre chaque échantillon quantifié, il n’y a aucune information. Ici, le signal a été découpé en quatre tranches.

Il ressort de ces deux définitions que dans le domaine du son, on aura un échantillonnage temporel : ce que l’on doit mesurer c’est un signal qui se déroule dans le temps. Dans le domaine de l’image fixe, on va effectuer un échantillonnage spatial (on mesure la valeur RVB des points situés dans un repère orthonormé définit par la grille du capteur CCD ou CMOS).

Tandis que dans le domaine de la vidéo et du cinéma, on va employer à la fois un échantillonnage temporel : le nombre d’images enregistrées à la seconde. (On en déduit que le cinéma et la vidéo analogique utilisent eux-aussi un échantillonnage temporel respectif de 24 images et de 50 trames à la seconde [2]) et un échantillonnage spatial (la grille d’analyse de chaque image). Dans le domaine de l’image animée, plus la valeur de cet échantillonnage temporel sera élevée moins l’effet de la stroboscopie sera perceptible ?

Kung Fu Motion Visualization from Tobias Gremmler on Vimeo.

Kung Fu Motion Visualization, une création vidéographique de Tobias Gremmler illustre simultanément la question de l’échantillonnage spatial et temporel.

L’échantillonnage spatial détermine la définition de chacun des photogrammes du film ou de chacune des photos. Il est défini soit par un nombre de points global (6 millions de pixels par exemple) ou par deux chiffres précisant le nombre de points sur la longueur et la largeur de l’image (3000 x 2000 pixels). Si le premier nombre donne le nombre de photosites du capteur, il a pour inconvénient de ne fournir aucune information sur le format de l’image. Son rapport (16/9, 4/3, carré ...) reste inconnu, tandis que la seconde notation donne simultanément des informations sur le format de l’image. Rigoureusement employée (longueur x largeur), cette seconde notation, outre le nombre de photosites, précise le sens de l’image : horizontal ou vertical.

Numériser le plus grand nombre de points possible dans une image pour obtenir une image de qualité n’est pas suffisant. Faut-il encore quantifier (mesurer) correctement ces points, afin de capter les bonnes couleurs, c’est-à-dire la modulation chromatique et lumineuse de chacun des points pour restituer correctement la plage dynamique de l’image. C’est pourquoi, le nombre de bits par couleur primaire joue un très grand rôle. Il représente la gamme de couleurs reproduite par un périphérique (écran, imprimante…) ou le nombre de couleurs individuelles ou de niveaux d’intensité, qu’il peut analyser (scanner, appareil photo...).

Pour une image, la quantification est exprimée soit par un nombre de bits total soit, par un nombre de bits par canal rouge, vert et bleu. Lorsque chaque canal de couleur est défini par un nombre codé sur 8 bits, il existe 256 niveaux de luminosité possibles pour chaque couleur, ce qui permet de décrire 16,7 millions de couleurs [3] (256 niveaux x 256 x 256) tandis qu’en 12 bits, ce nombre passe à 4 096 niveaux par couleur.

Si l’on a choisi un codage en RVB [4] pour numériser une image, c’est parce que c’est l’un des codages qui correspond le mieux à la vision humaine compte-tenu de la difficulté de fabriquer des filtres couleurs de qualité. En effet, un CCD est uniquement sensible à l’intensité lumineuse, il fonctionne comme un pluviomètre à lumière. La séparation des couleurs se fait grâce à des filtres placés devant le capteur. Nous aurions eu une vision quadrichromique comme certains animaux, le filtrage du capteur se ferait sur quatre couleurs.

Illustrations extraites du DVD À la recherche de la fidélité, un DVD d’assistance au réglage des home cinémas édités et vendus par la CST. Conception et réalisation : Hervé Bernard et Denis Mercier
© Hervé Bernard 2009,

Première partie de cet article

Troisième partie

La quantification et l’échantillonnage sont donc étroitement liés. Ces deux opérations sont essentielles, car ajouter ultérieurement des bits au signal initial, ne l’améliore pas, cela ne fait que réduire les pertes d’arrondis lors des différents calculs effectués sur le signal : application de filtres visuels ou sonores, agrandissement-réduction d’une image…

_________________________________________________________________________________________
Regard sur l’image,
un ouvrage sur les liens entre l’image et le réel.
350 pages, 150 illustrations, impression couleur, format : 21 x 28 cm,
France Métropolitaine : prix net 47,50 € TTC frais d’expédition inclus,
Tarif pour la CEE et la Suisse 52,00 € , dont frais d’expédition 6,98 €,
EAN 13 ou ISBN 9 78953 66590 12,
Pour acquérir cet ouvrage dans la boutique
_________________________________________________________________________________________

Pour aller plus loin :

– L’image numérique et le le cinéma, un pont entre l’argentique et le numérique, par Hervé BERNARD, Éditions Eyrolles

– A la recherche de la fidélité], DVD sur le réglage des home-cinéma, édité par la CST, par Hervé Bernard et Denis Mercier, en vente sur son site

Notes

[1] En effet, si ce pas est irrégulier, la qualité du signal sera irrégulière, certains éléments auront été analysé plus finement tandis que d’autres seront analysés moins finement. Donc la retranscription de l’information sera de qualité inégale.

[2] Trame : une image vidéo PAL, Secam ou NTSC est divisée en deux trames dites paires et impaires car la première contient toutes les lignes paires de l’image tandis que la seconde contient toutes les lignes impaires. C’est parce que la trame paire est enregistrée en premier qu’elle s’affiche en premier puis, lui succède la trame impaire. C’est cet artifice qui donnait l’impression que la télévision produisait un meilleur rendu du mouvement que le cinéma. En fait, l’échantillonnage vidéo PAL est donc de 25 images à la seconde ou de 50 trames/sec. En NTSC, ces deux valeurs sont de 30 et 60.

[3] En fait, ces 16,7 millions de couleurs n’existent pas, il vaudrait mieux parler de nuances nécessaires à la création d’un dégradé sans rupture de continuité perceptible par l’œil.

[4] Le mode de description RVB est imparfait, plusieurs triplets RVB sont associables à une même couleur. De plus, il ne peut pas reproduire certaines couleurs tout comme la pellicule photographique n’enregistre pas certains pigments utilisés en peinture.

Mots-clés Image numérique , échantillonnage , Dictionnaire de la photo numérique , Dictionnaire de la photonumérique , L’image numérique et le Cinéma , aliasing , antialiasing , photonumérique , crénelage , repli de spectre , effet d’escalier , trame