• Ingen resultater fundet

Fejl i produktionsprocessen

In document Del 1 - Indledning (Sider 58-61)

DEL 2 - BAGGRUNDSTEORI

10.1 Fejl i produktionsprocessen

10 Fejl

For at rette fejl i et datasæt, er det nødvendigt først at identificere dem.

Dette kræver kendskab til, hvor fejlene kan opstå og hvilke typer fejl, der kan forekomme.

Fejl kan betegnes som de tilfælde, hvor det genererede data ikke stemmer overens med virkeligheden. Det kan enten være, at et objekt i datasættet ikke lever op til reglerne i specifikationen, eller at objektet ikke svarer til den virkelige verden.

Det er nødvendigt finde en metode, der kan levere data, der lever op til de opstillede krav. Det skal bestemmes hvilke instrumenter, der skal benyttes til indsamlingen, hvilke målemetoder, der skal anvendes, samt hvordan det indsamlede data skal analyseres.

I forbindelse med valg af instrument kan der opstå fejl, hvis instrumentet ikke kan måle nøjagtig nok til at indsamle de krævede data. Det kan f.eks. være at de anvendte flyfoto ikke har tilstrækkelig høj opløsning. Der er ofte tale om en afvejning af økonomi kontra præcision i forbindelse med dette valg, og det afgøres af producenten.

Når målingen foretages, er det vigtigt at instrumenterne er kalibreret og opstillet korrekt, at indsamlingen er præcis, samt at det er de rigtige ting der måles. Disse fejl kan formindskes ved hjælp af træning af de personer, der udfører målingerne. Hvis der er tale om uerfarne personer, kan der opstilles udførlige guider til hvordan målingen skal foregå, og herved afhjælpe dette problem.

Efter dataindsamlingen, foregår der en analyse af de indsamlede data, så det er muligt at generere de egentlige data ud fra dette. Her kan der opstå fejl i den indledende analyse af data, f.eks. analysen af feltbaserede data. Der kan være filtre eller automatiske metoder til analysen af data, hvor der kan opstå fejl.

Der er en flydende overgang mellem dataindsamlingen og datagenereringen, da der ved indsamlingen af data også genereres data, der eventuelt skal raffineres efterfølgende.

10.1.2 Datagenerering

Generering af data kan foregå forskellig vis. De forskellige metoder kan foranledige forskellige typer fejl. Ved at undersøge hvilke typer fejl der kan opstå ved de forskellige metoder, kan der dannes et billede af, hvilke fejl der kan forekomme i et geografisk datasæt. Der findes bl.a. følgende metoder til indsamling af data [Servigne et al., 1999]:

n Digitalisering vha. fotogrammetrisk arbejdsstation eller lignende.

Fortolkningen er visuel og subjektiv, hvilket kan føre til fejl. Ved denne metode kan der forekomme problemer med præcisionen af indsamlede punkter, og der kan også opstå fejlfortolkninger. Desuden kan det forekomme, at punkter eller objekter digitaliseres flere gange, og der dermed forekommer dubletter.

n Indtastning af data direkte via keyboard.

Her kan der

forekomme forskellige typer fejl, når en person indtaster data.

Datakilden kan være aflæst forkert, og da der ikke altid er adgang til datakilden, og dens kvalitet, er det ikke muligt at kontrollere dette. Desuden er det let at foretage en simpel tastefejl, f.eks. at komme til at tilføje, bytte om på eller glemme et ciffer.

n Automatisk indsamling. Ved denne fremgangsmåde kan der

forekomme problemer med computerens fortolkning af datakilden. Dette kan skyldes fejl i de algoritmer, der benyttes, at der er fejl i datakilden, eller at datakilden kan fortolkes på flere måder, som algoritmen ikke tager højde for.

n Overførsel af data fra andre systemer.

Kvaliteten af det importerede data er ikke altid kendt, og derved kan der forekomme fejl i forbindelse med overførslen af data. Desuden kan der forekomme semantiske fejl på grund af forskellige systemer, eksempelvis forskellige datastrukturer, koordinatsystemer o.l. konverteringer.

n Generering af data vha. eksisterende objekter i databasen. Når

en eksisterende database benyttes, kan der forekomme fejlophobning på baggrund af de benyttede objekter.

Udover disse metoder, kan der også opstå fejl på grund af fejlagtige fortolkninger af kildematerialet. Forskellige typer data er ikke altid afgrænset entydigt, og det kan give anledning til fejl. For det første kan det være at data ikke er vist repræsentativt i indsamlingsøjeblikket. For det andet kan det være svært at tolke, præcis hvor grænsen går, f. eks. mellem skov og mose, eller mellem klassifikationen på to forskellige marktyper. Det første problem kan løses ved at sørge for at få et repræsentativt billede af virkeligheden, eventuelt ved at foretage flere målinger. Det andet kræver træning af operatørerne. Desuden er det nødvendigt at klassificere objekterne korrekt, og sørge for at dette kan lade sig gøre.

Det ses, at der kan opstå fejl i dataindsamlingen. Nogle af fejlene kan findes ved blot at gennemse datasættet, f. eks. en polygon der ikke er lukket, eller et punkt der er uden for dataområdet, mens andre kræver, at der ses på topologi. Eksempelvis kan to overlappende polygoner

10.1.3 Datalagring

Data kan lagres løbende under genereringen af data, enten direkte, så hvert enkelt objekt bliver lagret ligeså snart, det registreres, eller lagres i mindre dele, således at når der er registreret et vist antal objekter lokalt, overføres de til den samlede database. Den sidste metode gør, at det er muligt, at der opstår dubletter i data, hvis eksempelvis to operatører registrerer data samtidigt. Dette problem kan afhjælpes ved at gøre det muligt, at se allerede digitaliserede objekter løbende i processen. Lagringsmetoden har betydning for præcisionen, f.eks. kan der forekomme afrundingsfejl, hvis den værdi, der skal tilføjes til databasen, ikke kan lagres med tilstrækkeligt mange betydende cifre.

Der kan også opstå problemer med den rumlige nøjagtighed i feltbaserede systemer, da modeller med høj opløsning er meget pladskrævende, mens nøjagtigheden må ofres, hvis der ønskes en model, der ikke fylder så meget. Det er altså et spørgsmål om pladsbesparing eller detaljeringsgrad [Cockcroft, 1997].

In document Del 1 - Indledning (Sider 58-61)