L'analyse en composantes principales

Résumé

Traitement d'images

Quand on observe la Terre à partir d'un point de vue élevé, on est surpris de constater que la gamme de couleurs des paysages naturels est assez peu variée, et qu'il existe peu de couleurs très vives. Vues de l'espace, les zones continentales tempérées apparaissent vertes, et les vastes zones désertiques ont des couleurs où le gris, le beige et le brun dominent.
Traduite en termes d'image numérique, cette observation explique que les histogrammes des images de la surface de la Terre ne sont guère contrastés, et que les composantes spectrales ne varient pas de manière indépendante.

Si on représente les composantes rouges et vertes d'une image numérique sur un histogramme à 2 dimensions (scattérogramme), on remarque de suite que les images de télédétection (partie inférieure) ne comportent qu'un nombre restreint de couleurs, en
comparaison avec une image très colorée.
L'allure du scattérogramme de l'image de télédétection (tous les vecteurs spectraux sont regroupés le long de la diagonale) est l'indice d'une forte corrélation entre canaux: lorsqu'un pixel a une valeur élevée dans le rouge, il y a de fortes chances pour qu'il ait également une valeur élevée dans le vert. Cela signifie aussi que les différentes composantes spectrales n'ajoutent pas beaucoup d'information à l'image, qui pourrait pratiquement s'interpréter comme une image noir et blanc.

Le but de l'analyse en composantes principales est de réorganiser les données de telle manière qu'elles ne soient plus corrélées (c.-à-d. qu'elles deviennent indépendantes). Une particularité intéressante de cette transformation, lorsqu'elle est appliquée à des données comprenant plusieurs bandes spectrales, est qu'elle concentre la quasi-totalité de l'information dans les deux ou trois premières composantes, les autres composantes ne renfermant généralement que du bruit. En ne conservant que les composantes les plus significatives pour l'analyse, il est possible de réduire considérablement le volume de données à traiter.
L'interprétation de l'image devient plus compliquée, mais dans de nombreux cas, cette technique est très efficace.