• Ingen resultater fundet

6. Undersøgelsesdesign

6.3 Kausalitet

Formålet med kointegrationstestene var at undersøge de forskellige dataseriers langsigtsligevægte.

For at undersøge de kortsigtede sammenhænge vælger vi at benytte Grangers kausalitetstest. Det er en hypotesetest, der har til formål at afgøre, hvorvidt en dataserie kan benyttes til at forudsige en anden dataserie. En dataserie, X, siges at være Granger-kausal med dataserien, Y, hvis det kan vises via t og F tests på forskudte værdier af X, at X giver statistisk signifikant information omkring fremtidige værdier af Y. Det er vigtigt, at de kombinerede dataserier alle er af samme orden, da modellen ellers ikke kan benyttes. Ligeledes skal der testes ved den orden, hvor dataserien er stationær. I vores dataserier vil det sige 1. orden. I udgangspunktet findes der to forskellige udgaver af modellen. Den ene benyttes, såfremt der ikke findes en langsigtsligevægt imellem dataserierne.

Denne model er udtrykt nedenfor:

58

(6.7)

L og M er her antallet af lagperioder for henholdsvis dataserierne X og Y. u(t) optræder som hvid støj. Hypoteserne, der opstilles, ser således ud:

H0: y har på kort sigt ingen signifikant betydning for x; b1 = b2 =b...= bm = 0.

H1: y har på kort sigt signifikant betydning for x; b1 ≠ b2 ≠b... ≠ bm ≠ 0.

Til at teste denne hypotese benytter vi Wald testen. Denne test undersøger, om der er nogle af de uafhængige variabler i vores model, der kan undværes, uden at modellen ændrer karakter – altså om betaværdien for variablen kan antage værdien 0 (Tabachnick & Fidell, 2001). Vi tester altså for, om både b1, b2,… og bm har nogen betydning for modellen.

I forbindelse med prisudviklingen på boligmarkedet er tolkningen således, at prisændringer i et område på kort sigt har indflydelse på prisændringerne i et andet område, såfremt H0 kan afvises.

Der er altså tale om en ripple-effekt, hvor korte prischok forplanter sig fra et sted til et andet. Da vi ikke på forhånd ved, i hvilken geografisk retning disse prisbevægelser går, tester vi begge veje. Der vil altså både blive testet for, om Y påvirker X, og om X påvirker Y.

Hvor model 6.7 benyttes i det tilfælde, hvor der ikke er kointegration imellem dataserierne, så er det nødvendigt at tilføje et fejlkorrektionsled, hvis der skal testes på kointegrerede dataserier (Worthington & Higgs, 2003). Den udvidede model ses her:

(6.8)

Her er selve fejlkorrektionen, imens er den parameter, der udtrykker, at der er en signifikant langsigtsligevægt. Tolkningen af denne model er den samme som af modellen uden langsigts-ligevægt, men værdien er vigtig, da den fortæller, om y påvirker x på lang sigt. Alternativt kan x påvirke y på lang sigt.

59

Ved anvendelse af multiple lineære regressioner er der en række krav til modellen, der skal overholdes, hvis resultaterne skal blive pålidelige. Det drejer sig om fravær af endogenitet, indflydelsesrige observationer, stærk multikollinearitet og autokorrelation. Herudover er der krav til, at fejlleddene er normalfordelte, at den afhængige variabel er lineært forbundet til de uafhængige samt tilstedeværelse af homoskedasticitet (Strubager & Sønderskov, 2011). Kravet om endogenitet er i forbindelse med undersøgelse for ripple-effekter vanskeligt. Hvis det er vist, at X påvirker Y med en lagperiode på en eller mere, så vil den afhængige variabel påvirke den uafhængige variabel, når man tester for, om Y påvirker X med en lagperiode med mere end en. Da vi netop har besluttet at teste i begge retninger, er dette en relevant problemstilling. Da vi har valgt at teste et stort antal dataserier, er der ikke fundet plads til en kvalitativ bedømmelse af hver enkelt model. Vi accepterer derfor den usikkerhed, der er forbundet med kravet om endogenitet.

Forudsætningen om, at sammenhængen imellem den afhængige og de uafhængige variable er lineær, må vi godtage, såfremt vi ønsker at benytte modellen. Kravet om fravær af indflydelsesrige observationer synes overholdt. Der er i figur 6.1 således ikke tegn på, at der findes specielt ekstreme observationer. Vi undersøger ikke dataserierne nærmere for dette.

Når det kommer til, om der imellem de uafhængige variable findes stærk multikollinearitet, så er det et grundvilkår, at boligpriserne imellem byerne og regionerne i Danmark i nogen grad følger hinanden, således at der muligvis vil være en parvis korrelation imellem de forklarende variabler.

Dette vi fører til, at t statistikken for de forklarende variable bliver mindre signifikant, da der er flere der kan forklare det samme. Denne problematik har vi dog, som tidlige beskrevet, løst ved at indføre et fejlkorrektionsled (se figur 6,8), så vi mener ikke, at dette er et problem i vores undersøgelse.

Begrebet autokorrelation dækker over, hvorvidt regressionernes fejlled ut er uafhængigt af ut-1 – altså om fejlledet kan forudsiges på baggrund af tidligere fejlled. Er dette tilfældet opstår der en række problemer i forbindelse med modellens forklaringsgrader. R2, t- og F statistikker har således en tendens til at blive overvurderede, hvilket vil være en fejlkilde (Strubager & Sønderskov, 2011).

60

Der findes en række forskellige metoder til at undgå, at regressionerne bliver påvirket af en eventuel autokorrelation. En af metoderne er at anvende dataserier af en højere differens. Da Grangers kausalitetstest jo netop er af en form, hvor vi benytter første differencen imellem boligpriserne, vil problemet formodentligt være begrænset. Men for løbende at kontrollere modellerne, vælger vi at benytte Durbin-Watsons testmodel for autokorrelation (Brooks, 2002). Modellen er af følgende form:

(6.9) ∑ ̂ ̂

̂

Da ∑ ̂ og ∑ ̂ tilnærmelsesvis er lige store – særligt for tilpas store dataserier - må ∑ ̂

̂ være lig 2*∑ ̂ , såfremt at fejlleddene ikke er korrelerede. Heraf følger, at d er lig 2 i dette tilfælde. Er fejlleddene perfekt korrelerede, må det gælde, at ∑ ̂ ̂ = 0, og dermed er d=0. Er dataserierne derimod perfekt negativt korrelerede, må d være lig 4 som en konsekvens af, at ̂ ̂ = 2* ̂ . Det gælder således, at d ≈ 2*(1-p), hvor p er korrelationen. Vi tillægger således værdien af d ved alle Granger kausalitetstests for at undersøge, om autokorrelationen kan have indflydelse på resultatet.

Hvad angår de sidste to krav, normaltfordelte fejlled og homoskedasticitet, antager vi, at dette ikke er et problem for vores model. I den forbindelse kan vi nævne, at det ikke har været et tema for forfatterne, der er præsenteret i litteraturstudiet.

Når det kommer til at bestemme antallet af lagperioder, der skal indgå i modellen, så findes der ikke en generel måde at gøre det på. Optimalt set, så bør det være en vurdering fra model til model, hvor man sammenholder en række forskellige faktorer såsom forklaringsgrader, sund fornuft og forventninger. Undersøger vi således, hvorvidt der kan konstateres en Granger kausal sammenhæng fra Region København imod Region Nordjylland for SKATs halvårlige dataserier med fire lagperioder, får vi følgende output i E-Views:

61

Tabel 6.3: Regressionsoutput fra E-Views til undersøgelse for Granger-kausalietet fra Region Hovedstaden til Region Nordjylland. Gennemsnitspriser for enfamiliehuse, sæsonkorrigeret, 1974-2011.

Kilde: SKATs halvårlige publikationer ”Ejendomssalg”.

Her ses det i første omgang, at udviklingen i de tidligere perioder i boligpriserne for både Region Nordjylland og Region Sjælland blot kan forklare 30 % af variansen i boligprisudviklingen i Region Nordjylland. Endvidere ses det, at den eneste variabel, hvorfra t-statistikken er signifikant ved et 5

% signifikansniveau, er Hovedstaden(-1). Ligeledes bør det også vurderes, om det er rimeligt, at der skulle kunne observeres en forsinket effekt, der strækker sig over to år. I dette tilfælde ville det således være fornuftigt at lave en ny model med en til to lagperioder og herefter undersøge denne for en kausal sammenhæng, da de fleste variabler i den præsenterede model blot optræder som støjkilder.

Da vi imidlertid har mange forskellige datakilder med op til 10 forskellige dataserier, hvor der skal testes for kausale sammenhænge i begge retninger, behøver vi et værktøj, der kan bestemme antallet af lagperioder for os. Da der som nævnt ikke er nogen ”korrekt” statistisk metode, benytter vi Akaikes Final Prediction Error(FPE) (Akaike, 1970). Denne benyttes til at udvælge det korrekte

62

antal lags, da det er blevet vist, at den er effektiv, når det kommer til at bestemme et antal lags, hvorved man opnår signifikante resultater (Thornton & Batten, 1984).

Et væsentligt problem ved at anvende denne kvantitative metode er, at der ikke bliver taget hensyn til den enkelte models forklaringsgrad, realismen i antallet af lagperioder, eller hvorvidt den fundne kausale sammenhæng er positiv. Det kan således tænkes, at der i enkelte af vores mange kausalitetstests kan findes signifikant forklarende negative værdier for de testede variable. Et sådan resultat er således ikke, hvad vi søger, og det har intet med en ripple-effekt at gøre, men det vil stadig indgå som et resultat af undersøgelsen. Vi forventer dog, at det meget sjældent vil være aktuelt i vores undersøgelse. For en gennemgang af Granger-kausalitet i E-Views, se Appendiks 6.3.

63