V - COMMENT LE RéSULTAT PEUT-IL êTRE VALIDé
2- Précision des données
Outre la position géographique, le contenu des données doit bien entendu également être correct. Du moins, il doit être aussi précis que possible, car des données correctes à 100 % n'existent que dans un monde idéal. Les utilisateurs des données doivent au moins avoir une idée du type d'erreurs qu'elles contiennent et de leur ordre de grandeur.
Dans le cas de cartes thématiques dérivées de classifications d'images, il convient de déterminer si les classes d'utilisation du sol figurant sur la carte (par exemple, forêt, routes, zones bâties...) correspondent bien à la réalité ; il est également important de pouvoir identifier les classes susceptibles d’être confondues les unes avec les autres.
Dans le cas de données quantitatives de télédétection (variables de surface telles que la production primaire ou la température de surface), il s’agit de déterminer l'ordre de grandeur de l'erreur et de l'écart-type.
Pour valider les données de télédétection, des données de référence, parfois appelées vérité terrain (en anglais, ground truth), sont utilisées. Celles-ci peuvent être obtenues à partir de différentes sources (interprétation de photographies aériennes, cartes thématiques, mesures de terrain...) et se présenter sous différentes formes (cartes numériques, mesures de capteurs, graphiques...). Ces données de référence ne fournissent pas seulement des informations supplémentaires lors de l'analyse des données de télédétection, elles permettent également de vérifier qu'elles sont correctement interprétées.
Exemple 1 : Détermination des erreurs dans des cartes thématiques obtenues par classification d'images
Pour quantifier les erreurs dans les cartes thématiques dérivées d'images satellites, il est possible d’utiliser ce que l'on appelle une matrice de confusion. Pour un certain nombre de points de contrôle (exemples indiqués sur l'image de droite), la classe à laquelle appartiennent réellement les pixels correspondants de l'image est déterminée. Cette "vérité terrain" est obtenue par interprétation visuelle et/ou inspection sur place à l'aide d'un GPS (dispositif GNSS). En plaçant chaque point de contrôle dans une matrice dont les colonnes contiennent les classes réelles et les lignes les classes assignées, il est possible de calculer un certain nombre de statistiques d'erreur. Par exemple, le pourcentage de pixels correctement classés s’obtient en divisant la somme des valeurs sur la diagonale (ellipse bleue) par le nombre total de points de contrôle. Dans l'exemple fictif de droite, ce pourcentage est de 328/499, soit environ 66 %.