V - HOE KUNNEN RESULTATEN GEVALIDEERD WORDEN
2- ACCURAATHEID VAN DE GEGEVENS
Naast de geografische positie moet ook de inhoud van de gegevens juist zijn. Tenminste, ze moet zo nauwkeurig mogelijk zijn want 100% correcte gegevens bestaan enkel in een ideale wereld. Gebruikers van de data moeten in elk geval een idee hebben van het type fouten dat er inzit en van hun grootteorde.
In het geval van thematische kaarten die afgeleid werden uit beeldclassificaties willen we weten of de bodemgebruiksklassen die we op de kaart zien (bvb. bos, wegen, bebouwing…) wel degelijk overeenstemmen met de werkelijkheid en willen we een idee hebben van welke klassen eventueel met mekaar verward zijn.
In het geval van kwantitatieve teledetectiegegegevens (oppervlaktevariabelen zoals bvb. primaire productie of oppervlaktetemperaratuur) willen we een idee hebben van de grootteorde van de fout en van de standaardafwijking.
Om teledetectiegegevens te valideren wordt gebruik gemaakt van referentiegegevens, soms ook wel ground truth genoemd. Die kunnen we verkrijgen uit verschillende bronnen (interpretatie van luchtfoto's, thematische kaarten, grondmetingen,...) en ze kunnen voorkomen in verschillende vormen (digitale kaarten, sensormetingen, grafieken,...). Dergelijke referentiegegevens bieden niet enkel aanvullende informatie bij de analyse van teledetectiegegevens, ze maken het dus ook mogelijk om te controleren of deze correct worden geïnterpreteerd.
Voorbeeld 1: bepalen van fouten in thematische kaarten bekomen door beeldclassificatie
Om fouten te kwantificeren in thematische kaarten die afgeleid werden uit satellietbeelden kunnen we gebruik maken van een zogenaamde confusiematrix. Voor een aantal controlepunten (voorbeelden aangeduid op het beeld rechts) bepalen we de klasse waartoe de overeenstemmende beeldpixels werkelijk behoren. Deze zogenaamde ground truth bekomen we door visuele interpretatie en/of controle ter plaatse met een GPS (GNSS toestel). Door elk controlepunt in een matrix te plaatsen waarbij de werkelijke klassen in de kolommen staan en de toegewezen klassen in de rijen kunnen we een aantal foutenstatistieken berekenen. Zo bekomen we bijvoorbeeld het percentage juist geclassificeerde pixels door de som van de waarden op de diagonaal (blauwe ellips) te delen door het totale aantal controlepunten. In het fictieve voorbeeld hiernaast is dat 328 : 499 of ongeveer 66%.



