- Ne confondons pas échantillonnage et marchandage ! (1)- Le numérique, comment ça marche (3)

jeudi 21 mai 2009 , par Hervé BERNARD dit RVB

L’enregistrement d’un son ou d’une image est l’opération qui consiste à transformer ce son ou cette image en un signal afin de le diffuser et/ou d’en garder une trace durable sur un support pour en permettre une rediffusion ultérieure.

Cet enregistrement est de fait une forme de description de l’information que l’on veut archiver et il se fait sur un support physique [1]. En analogique, cette description se fait, pour un son grâce à une variation de l’intensité d’un courant électrique et par des variations de la densité des grains d’argent pour une image.

De fait, pour fabriquer un signal, il est nécessaire de le décrire. Si, dans le monde analogique, cette description a parfois recours à l’échantillonnage : le nombre d’images à la seconde, au cinéma et en vidéo, elle passe nécessairement par l’échantillonnage dans le monde numérique. Par conséquent, l’échantillonnage est l’une des notions qui fonde la théorie de l’information et plus particulièrement celle du traitement du signal.

**Déficience et mémoire**

L’enregistrement des données numériques n’échappent pas aux erreurs de traitement comme toutes les techniques d’enregistrement.

Définition :

L’échantillonnage, c’est le prélèvement d’une fraction représentative d’un objet, d’un ensemble [2] pour en constituer une description selon un angle appelé dans la théorie du signal biais. De cette définition découle deux nécessités :

– déterminer une cadence de prélèvement ou fréquence de prise de cet échantillon ;
– déterminer la taille de cet échantillon doit être suffisante pour être significative.

Si l’on échantillonne, c’est pour caractériser un élément, c’est-à-dire pour le décrire. Par exemple, dans le cas d’un champ de tomates, l’échantillonnage permettra de décrire leur qualité afin d’en déterminer leur prix de vente. Ici, le biais est l’établissement du prix des tomates de ce champ.

Échantillonner implique donc de faire un traitement statistique des informations collectées. En effet, compte-tenu de la taille des champs de tomates contemporains, il est hors de question d’analyser les tomates unes par une pour en déterminer leur prix. Ce traitement statistique se fait notamment à travers les notions de moyenne et d’écart. C’est pourquoi, afin de faciliter ce travail statistique, les échantillons sont prélevés à une cadence régulière. Dans cet exemple, l’échantillonnage correspondra à un prélèvement d’une ou plusieurs tomate(s) à une distance régulière : toutes les trois rangées ou tous les cinquante pieds.

Ainsi, si dans un premier échantillonnage de votre champ, vous ramassez une tomate tous les cinq mètres et dans un second échantillonnage, vous optez pour deux tomates tous les dix mètres vous obtenez deux échantillonnages des tomates de ce champ qui contiennent le même nombre de tomates mais, leur pas d’échantillonnage (c’est-à-dire la distance séparant chaque échantillon) est différent puisque le pas de ce second échantillonnage est le double de celui du premier. Ces deux échantillonnage bien que contenant le même nombre de tomates produisent donc deux descriptions différentes de la qualité des tomates de ce champ. En effet, comme dans le premier échantillonnage, la distance séparant les échantillons est plus courte, cet échantillon se révélera plus précis que le second. Par ailleurs, dans le cas, du second, deux tomates simultanément, si l’une est malade, l’autre sera probablement malade. De fait, pour une tomate tous les cinq mètres, la probabilité de passer à côté d’une zone aride, malade ou au contraire prospère est deux fois moins grande que dans le second échantillon. La description de la qualité des tomates obtenu par le premier échantillonnage est donc, à priori, plus précise que dans le second.

Après avoir montré dans cet exemple, l’importance de la cadence de l’échantillonnage, nous allons maintenant aborder la question de la taille de chacun échantillon prélevé. Toujours dans l’hypothèse de notre champ de tomate, si l’on prélève un échantillon d’une taille inférieure à une tomate entière, c’est-à-dire un morceau de tomate, nous nous trouvons confronté à un autre problème : le choix de ce morceau. Choix qui va induire une nouvelle source d’erreur : la probabilité que chaque prélèvement contienne ou non une partie abîmée de la tomate. Donc, dans ce cas, afin de limiter les erreurs dans la réalisation de notre échantillonnage, nous sommes obligés de considérer que la taille minimum de l’échantillon sera celui d’une tomate entière. On remarquera que la notion d’échantillonnage est directement liée aux probabilités à travers les notions de moyenne et d’écart. Il est clair que si lors de notre échantillonnage, chaque prélèvement est composé de cinq tomates au lieu d’une, notre description n’en sera que plus précise. Cependant, elle sera probablement moins précise que si l’on prélève une tomate tous les mètres.

Première remarque : certains en déduiront que pour échantillonner correctement, il faut donc prélever tout le champ de tomates. Cependant, nous remarquerons que cette solution est antinomique de la définition même de l’échantillonnage. En effet, elle est contre-productive. Par ailleurs, comme le montre le théorème de Nyquist, cette remarque est erronée.

Seconde remarque : quand un échantillonnage est imparfait, entaché d’erreur, non seulement il est erronée mais, comme nous le montre notre champ de tomates, il va générer une information erronée, car l’acheteur de nos tomates sous la foi de cet échantillonnage va acheter les tomates à un prix trop élevé ou au contraire trop faible. Par conséquent, un mauvais échantillonnage n’est pas seulement mauvais, il fabrique une fausse information.

Après ces préliminaires qui nous ont permis de définir l’échantillonnage, nous étudierons dans les prochains épisodes le théorème de Nyquist, une application de l’échantillonnage dans le monde analogique avec la restitution du mouvement au cinéma, puis l’échantillonnage dans le monde numérique appliqué à la définition de l’image, à la description de ses couleurs ainsi qu’au monde sonore.

Suite de cet article Ne confondons pas échantillonnage et marchandage !

_________________________________________________________________________________________
Regard sur l’image,
un ouvrage sur les liens entre l’image et le réel.
350 pages, 150 illustrations, impression couleur, format : 21 x 28 cm,
France Métropolitaine : prix net 47,50 € TTC frais d’expédition inclus,
Tarif pour la CEE et la Suisse 52,00 € , dont frais d’expédition 6,98 €,
EAN 13 ou ISBN 9 78953 66590 12,
Pour acquérir cet ouvrage dans la boutique
_________________________________________________________________________________________

- Focale, argentique-numérique : quelles différences ?

Le numérique, comment ça marche ?
Le numérique est basé sur la numérisation en base 2 (elle utilise uniquement deux chiffres, le 1 et le 0). A la base de l’informatique, la numérisation binaire a été choisie parce qu’un ordinateur ne connaît que deux situations : le courant passe ou le courant ne passe pas.
Le bit est la plus petite unité informatique d’information gérée par un ordinateur. Il sert à coder toutes les informations sous la forme de 0 ou de 1. Huit bits forment un octet qui peut représenter de nombreux types d’informations comme une lettre de l’alphabet, un chiffre décimal ou un autre caractère. Cet octet est l’équivalent du « mot >> de la langue française. Le bit sert notamment à déterminer la qualité d’un signal (sonore ou visuel) lors de sa numérisation.

Le paradoxe de Simpson, à propos des biais de l’échantillonnage

Pour aller plus loin :
- L’image numérique et le le cinéma, un pont entre l’argentique et le numérique, par Hervé BERNARD, Éditions Eyrolles

– A la recherche de la fidélité, DVD sur le réglage des home-cinéma, édité par la CST, par Hervé Bernard et Denis Mercier

Notes

[1] Par exemple, dans le cas d’un signal sonore, cette description est produite par une variation d’un signal électrique

[2] Échantillon ou morceau coupé sur une marchandise pour donner une idée de la pièce ; petite quantité d’un produit permettant d’en apprécier la valeur.

Mots-clés Hervé Bernard RvB , image argentique , Image numérique , échantillonnage , aliasing , antialiasing , photonumérique , crénelage , repli de spectre , son numérique , effet d’escalier