• Ingen resultater fundet

Det forvaltningsmæssige evalueringsparadigme

In document Kampen om evalueringen (Sider 25-33)

Jeg har tidligere nævnt (kapitel 2.1), at de seneste års evalueringstiltag på folke-skoleområdet har været karakteriseret ved anvendelsen af programevalueringer – uden at jeg dog her nærmere har defineret dette fænomen. Det vil jeg råde bod på i dette kapitel, hvor jeg desuden vil vise, hvorledes denne tilgang til og brug af evaluering dels er snævert forbunden med en bestemt opfattelse af evalueringers formål og funktion, dels er indlejret i et specifikt evalueringsparadigme. Jeg væl-ger at benævne dette paradigme det forvaltningsmæssige evalueringsparadigme, for herved at understrege det forvaltningsmæssige aspekt ved netop dette para-digme. Samtidig ønsker jeg også at betone, at der sideløbende med dette evalu-eringsparadigme forekommer andre paradigmatiske tilgange til evaluering, hvoraf det, der foruden det forvaltningsmæssige evalueringsparadigme også har rele-vans i forbindelse med denne afhandling – nemlig det professionelle evalue-ringsparadigme – vil blive undersøgt senere (kapitel 2.3).

Det er formålet med dette kapitel at undersøge gyldigheden af den påstand, at der eksisterer en umiddelbar sammenhæng mellem folkeskolelovens bestem-melser om evaluering og en angelsaksisk-inspireret evalueringstradition, der med henvisning til en New Public Management-forvaltningstradition primært tjener det formål at kontrollere kvaliteten af lovgivningens implementering, og derved kun i minder grad at fungere som et pædagogisk redskab for skolens lærere.

Den svenske evalueringsforsker Evert Vedung har, siden han i 1991 fremsatte sin definition af begrebet evaluering, haft stor indflydelse på det betydningsind-hold, som toneangivende, danske evalueringsforskere, der alle har rod i stats-kundskab (fx Albæk 2001:35; Andersen 2004:15; Dahler-Larsen 1998:11;

2000:12; 2003:17: 2006:27; Dahler-Larsen og Krogstrup 2001:14; Krogstrup

2006:17; Olsen og Rieper 2005:16), har tillagt begrebet. Evert Vedung definerer evaluering således:

UTVÄRDERING = noggrann efterhandsbedömning av utfall, slutprestationer eller förvaltning i offentlig verksamhet, vilken avses spela en roll i praktiska beslutningssituationer.

(Vedung [1991] 1998:20)

Med denne forståelse af begrebet evaluering forbinder Vedung sig i direkte til den angelsaksiske evalueringstradition, der specielt i Canada, Storbritannien og USA betragter evaluering som et integreret aspekt ved offentlige programmer (Madaus and Stufflebeam 2000). I denne optik er formålet med anvendelse af evalueringer dels at tilsikre kvaliteten af den offentlige sektors implementering af de pågældende politiske beslutninger (programmer), dels at skabe grundlag for vurderinger af effekten af konkrete indsatsers outcome med henblik på opfølgen-de beslutninger i forbinopfølgen-delse med opfølgen-de pågælopfølgen-denopfølgen-de programmers fremtid (fx om programmerne uden ændringer skal fortsættes, om de skal justeres, eller om de skal afsluttes). I konsekvens af denne evalueringsopfattelse benævnes begrebet evaluering i den angelsaksiske evalueringstradition da også almindeligvis som program evaluation.

Evert Vedungs definition, der således vedrører programevaluering, betoner eksplicit evalueringens summative karakter, hvilket naturligvis reducerer evalue-ringers potentiale som et redskab til intervention i og justering af igangværende implementeringsprocesser. Det må da også formodes, at dette problem kan have været en årsag til, at Evert Vedung sammen med Magnus Dahlberg i 2001 bidrog med et forslag til en udvidelse af den oprindelige definition fra 1991, hvormed evalueringers formative potentialer ekspliciteres:

[Evaluering er en] noggrann bedömninng av en pågående eller en avslutad offentlig intervention i skyfte att den skall spela en roll i samtida og framtida praktiske handlingssituationer. Bedömningen av interventionen begränsas till förvaltning, slutprestationer och utfall.

(Dahlberg og Vedung 2001:36)

Evaluering fungerer således som et redskab til kontrol af den offentlige sektors virksomhed på alle organisatoriske niveauer, idet det som præmis forudsættes, at denne sektors virke er funderet på politiske programmer samtidig med, at

evalue-ring netop forstås som programevalueevalue-ring. Omvendt kan det også hævdes, at når evaluering defineres som ovenfor citeret, kan dette alene lade sig gøre, fordi den politiske styring af den offentlige sektor sker på baggrund af evaluering af politisk vedtagne programmer.

Udviklingen af programevalueringsmodeller og -metoder dateres ofte til 1960’erns USA, hvorimod udbredelsen til Europa (hvis Storbritannien undtages) først for alvor er sket indenfor de seneste to årtier. Dette er naturligvis en sand-hed med modifikationer, idet anvendelsen programevalueringer i såvel USA som i Storbritannien kan spores tilbage til industrialismens gennembrud, ligesom der også i flere kontinentaleuropæiske lande kan findes eksempler på denne form for evaluering, før ekspansionen af programevalueringers anvendelse i den offentli-ge sektor for alvor indtraf i 1980’erne. Men det må være korrekt at hævde, at så-vel evalueringsforskningen som ’videnskabeliggørelsen’ og moderniseringen af anvendelsen af evalueringer i forbindelse med centrale politiske programmer i USA bevidst blev styrket og udbygget fra slutningen af 1950’erne og i tiåret heref-ter (Madaus and Stufflebeam 2000).

Programevalueringens historie indenfor uddannelsessektoren kan ifølge George Madaus og Daniel Stufflebeam spores tilbage til 1792, hvor ”William Fa-rish invented the quantitative mark to score examinations” (Madaus and Stuffle-beam 2000:4). Skabelsen af den moderne programevaluering sker imidlertid først cirka 150 år senere, og ofte dateres dennes oprindelse til den 2. september 1958, da dette var dagen, hvor præsident Dwight David Eisenhower underskrev The National Defence Education Act, hvortil der direkte var tilknyttet omfattende og systematiske evalueringsprocedurer.

Vedtagelsen af dette ambitiøse og kostbare uddannelsesprogram var direkte foranlediget af og en reaktion på det chok, det var for USA at måtte konstatere, at Sovjetunionen med opsendelsen satellitten Sputnik 1 i oktober 1957 teknologisk set tilsyneladende havde overhalet USA. I den daværende koldkrigsperiode blev dette anset for at rumme et direkte sikkerhedsproblem for den vestlige verden og dermed for USA. Som et aspekt i forbindelse med den teknologiske og tekniske oprustning blev det bl.a. erkendt, at der på nationalt plan generelt måtte investe-res i en modernisering og effektivisering af uddannelsessektoren, som undersø-gelser have dokumenteret var af katastrofal ringe kvalitet. Konkret betød det, at der specielt i relation til undervisningen indenfor matematik, naturvidenskab og fremmedsprog blev igangsat målrettede indsatser, der rettede sig mod alle ni-veauer i uddannelsessystemet. Programmet,

Act, der også inkluderede projekter med henblik på udvikling og testning af nye nationale curricula og undervisningsformer, fik tilkoblet en række evalueringsfor-skere, der til opgave fik såvel at udarbejde et operationelt evalueringskoncept som at anvende dette konkret på programmet. Selv om alle specifikke evalue-ringsmodeller i dette koncept i princippet allerede var udviklet i første halvdel af århundredet, fremstod det endelige resultat som den første moderne og sam-menhængende programevaluering til anvendelse på et større uddannelsespro-gram. George Madaus og Daniel Stufflebeam beskriver processen således:

First, the Tyler approach was used to help define objectives for the new cur-ricula and to assess the degree to which the objectives were later realized.

Second, new national standardized tests were created to better reflect the objectives and content of the new curricula. Third, the professional-judgment approach was used to rate proposals and to check periodically on the efforts on contractors. Finally, many evaluators evaluated curriculum development efforts through the use of field experiments.

(Madaus and Stufflebeam 2000: 11-12)

Som det blandt andet fremgår af dette citat, er et af de for programevalueringen centrale elementer i uddannelsesprogrammet tilstedeværelsen af curricula, der er baseret på formulerede (nationale) standarder for de enkelte fag, forløb og ud-dannelsesniveauer. Sådanne har igennem hele efterkrigstiden ligget til grund for undervisningen på grundskole- og gymnasieniveauerne (primary and secondary schools) i de angelsaksiske lande, medens det indtil for ganske få år siden ikke har været tilfældet for hovedparten af de nordiske og kontinentaleuropæiske ud-dannelsessystemer, hvor fagenes indholdskategorier og arbejdsformer i stedet blev beskrevet i form af mere generelle læreplaner.

Denne forskel i uddannelsesstrategierne, der implicit udtrykker grundlæggen-de forskelle i ungrundlæggen-dervisnings-, lærings- og dannelsessyn, er muligvis samtidig en årsag til, at programevalueringer ikke tidligere har været anvendt i sidstnævnte uddannelsessystemer. Faktisk må man stille sig spørgsmålet, om der i de nordi-ske og kontinentaleuropæinordi-ske lande overhovedet tidligere har været gennemført systematiske evalueringer af uddannelser i den betydning af begrebet evaluering, som danske evalueringsforskere tillægger begrebet, eller om det evalueringsar-bejde, der har været udført af grundskolens lærere i bl.a. Danmark, reelt kan be-tegnes som evaluering? Alene den betoning, som Magnus Dahlberg og Evert

Vedung i dette udsagn lægger på begrebets systematiske karakter, kunne indike-re, at det i henhold til denne forståelse af evaluering næppe har været tilfældet:

Bedömningen måste vidare vara noggrann (systematisk) förr att bli en utvärdering. Löst impressionistiskt tyckande är inte utvärdering. Det krävs ett minimum av systematik och precision i datainsamling, dataanalys och tillämpning av värdekriterier för att vi skall tala om utvärdering.

(Dahlberg og Vedung 2001:37)

Fraværet af programevalueringer i Europa, hvor jeg igen undtager Storbritannien, har naturligvis ikke betydet, at der fra politisk side ikke har eksisteret et ønske om fortløbende at tilsikre kvaliteten i uddannelsessektoren. Men det har her været en udbredt antagelse, at dette har kunnet lade sig praktisere gennem kvalificering af undervisernes professionelle didaktiske kompetencer, der bl.a. omfatter pæda-gogiske refleksioner og vurderinger om undervisning og læring samt kvalificeret stillingtagen til handling på baggrund heraf. Denne anderledes evalueringsopfat-telse og dermed det evalueringsparadigme, som denne er et udtryk for, uddybes i det efterfølgende kapitel (kapitel 2.3).

I takt med den øgede internationalisering (globalisering) af og mobilitet mellem såvel arbejdskraft og tjenesteydelser, finanser og valutaer, men også mellem uddannelser på tværs af landegrænser, er der blandt beslutningstagere i hele Europa opstået et behov for at udvikle og anvende komparative uddannelses- og evalueringsstandarder og akkrediteringssystemer, samt at gennemføre tværnati-onal benchmarking af de natitværnati-onale uddannelsessystemer.

Et eksempel herpå er Bologna-deklarationen6, der i 1999 blev vedtaget af un-dervisningsministrene fra 29 europæiske lande. Deklarationen, der omfattede seks hovedmålsætninger, havde og har fortsat samlet set som formål dels at ud-vikle Europa til et fælles område for videregående uddannelse, dels at gøre eu-ropæiske uddannelser attraktive for studerende udenfor Europa. Denne såkaldte Bologna-proces er siden 1999 blevet udvidet med yderligere fire hovedmålsæt-ninger, ligesom antallet af lande, der har tilsluttet sig deklarationen, er blevet for-øget, så den siden 2010 har omfattet i alt 47 lande. Et af resultaterne af dette samarbejde er den principielle tilslutning til de af ENQA7 udarbejdede fælles ret-ningslinjer for kvalitetssikring af de videregående uddannelser (Standards and

6 Kilde: http://www.ond.vlaanderen.be/hogeronderwijs/bologna/ [lokaliseret den 18. november 2010]

7

Guidelines for Quality Assurance in the European Higher Education Area), der også i Danmark har fået betydning for, hvorledes standarder for og kvalitetssik-ring af uddannelser foretages. Således arbejder såvel Akkreditekvalitetssik-ringsrådet (ACE Denmark) som Danmarks Evalueringsinstitut (EVA) i overensstemmelse med disse europæiske standarder, ligesom sidstnævnte desuden – foruden medlem-skab af ENQA – også selv er godkendt i overensstemmelse med disse standar-der.

Parallelt med udviklingen af sådanne harmoniseringstiltag er også betingel-serne for og specielt begrundelbetingel-serne for den førte uddannelsespolitik i bl.a.

Danmark forandret, hvilket er sket i takt med, at der i stigende grad gøres brug af overnationale evalueringer, der har karakter af accountability studies eller cost-benefit analysis. Dette er eksempelvis tilfældet med anvendelsen af den økono-miske samarbejdsorganisation OECD’s PISA-undersøgelser8 (som Danmark siden 2000 har deltaget i), der primært retter sig mod kvaliteten af den førte poli-tik på grundskoleområdet og indenfor ungdomsuddannelserne (primary and se-cundary education), og som netop er eksponent for et evalueringssyn, der henvi-ser til et forvaltningsmæssigt evalueringsparadigme.

Det kan konstateres, at programevaluering som styrings- og kontrolredskab i forbindelse med uddannelsespolitiske tiltag vinder stadig større udbredelse i de europæiske lande, og at de pågældende lande på denne måde substantielt sy-nes at bevæge sig i retning af den program- eller curriculum-tænkning, der igen-nem det meste af efterkrigstiden har karakteriseret og ligget til grund for angel-saksisk uddannelsespolitik.

Samtidig oplever uddannelsessektoren også, hvorledes ansvaret for kvalitets-sikrings- og kvalitetsudviklingstiltag i stigende grad fjernes fra sektorens professi-onelle og i stedet overtages af enten beslutningstagerne selv eller af institutioner, som beslutningstagerne udliciterer opgavevaretagelsen til eller overdrager be-myndigelsen til. Det kan, som det også ovenfor er nævnt, eksempelvis dreje sig om EVA eller AEC Denmark, men der kan også være tale om private konsulent-firmaer eller universiteter, der på baggrund af kontraktbaserede aftaler med et ministerium eller en styrelse løser sådanne opgaver, hvorefter procedurer og ofte detaljerede retningslinjer for implementering af centraladministrationens beslut-ninger indenfor det pågældende område returneres til uddannelsessektorens aktører.

Hvor fx sikring af forsknings- og undervisningskvaliteten, men også af dens samfundsmæssige relevans, på hovedparten af europæiske universiteter i

8 Programme for International Student Assessment

ensstemmelse med den humboldske tradition tidligere var et autonomt anliggen-de for anliggen-det enkelte universitet og anliggen-dets forskere, oplever stadig flere universiteter i de seneste år, hvorledes kvalitetssikringen af deres samlede virksomhed i sti-gende omfang sker gennem evalueringer af nationalt sanktionerede og internati-onalt harmoniserede akkrediteringer, politisk vedtagne programpuljer og økono-miske budgetrammer for universiteternes drift. Samme tendens finder sted i for-bindelse med styringen og kvalitetssikringen af professionsbacheloruddannelser, hvad enten disse udbydes af universiteter eller af university colleges. For Dan-marks vedkommende er dette blevet særlig tydeligt efter etableringen af profes-sionshøjskolerne i 2008.

Grundskolerne i en række nordiske og kontinentaleuropæiske lande har in-denfor de seneste tiår oplevet denne forandringsproces, og flere indikatorer sy-nes at pege på, at den primære årsag hertil skal findes i ønsket om en generel harmonisering af uddannelsessystemerne i EU, og at begrundelsen herfor angi-ves i den skærpede økonomiske konkurrencesituation, som EU i disse år oplever at befinde sig i som følge af den voksende globalisering. Således er det heller ikke overraskende at konstatere, at den uddannelsespolitiske dagsorden i sti-gende omfang synes formuleret af økonomiske eksperter i såvel nationale som internationale fora. OECD’s PISA-undersøgelsers indflydelse på og konkrete an-befalinger for udviklingen af de europæiske grundskoler er således blot et ek-sempel herop.

En anden årsag kunne være det økonomiske markedssyn på uddannelser, som blandt andet i Danmark blev annonceret ved regeringen Anders Fog Ras-mussens tiltræden, hvor den nyliberalistiske kulturelle værdikamp blev erklæret igangsat under sloganet ”Noget for noget!” Dette slogan minder i besnærende grad om det synspunkt, som den daværende engelske premiereminister Tony Blair koncentrerede med ordene ”What counts is what works!” (Clarke 2003), og som i lighed med Fog Rasmussens statement retter sig mod regeringens politik i forhold til driften af den offentlige sektor, herunder uddannelsesområdet.

Hvis sådanne udsagn således eksplicit omfatter det værdisyn, der anlægges på uddannelsessektorens virksomhed, og som følgelig ligger til grund for de poli-tiske tiltag, der angår fx grundskolens udvikling i Europa i disse år, er det nok værd at erindre sig den udtalelse, Europa-Kommissionens formand José Manuel Barroso fremførte i forbindelse med Tony Blairs offentliggørelse af sit fratrædel-sestidspunkt som premiereminister. I et tv-interview, den 10. maj 2007, udtalte Barroso, at det tilsyneladende var lykkedes Blair igennem sin tiårige

regeringspe-riode at nærme Europa mod Storbritannien, medens det modsatte ikke synes at have været tilfældet.

De seneste års øgede anvendelse af programevalueringer i forbindelse med kva-litetsvurdering og -sikring af grundskolens virksomhed, kombineret med de øvrige kvalitetssikringstiltag, som jeg har omtalt i dette kapitel, illustrerer hvorledes ud-dannelse set fra de lovgivende myndigheder side i stigende grad betragtes i en markedsoptik, hvilket blandt andet begrunder anvendelsen af evalueringer som et forvaltningsmæssigt anliggende.

KAPITEL 2.3

In document Kampen om evalueringen (Sider 25-33)