• Ingen resultater fundet

Prisudviklingen på markedet for ejerlejligheder

N/A
N/A
Info
Hent
Protected

Academic year: 2022

Del "Prisudviklingen på markedet for ejerlejligheder"

Copied!
56
0
0

Indlæser.... (se fuldtekst nu)

Hele teksten

(1)

1

Prisudviklingen på markedet for ejerlejligheder

En analyse af faktorer og deres indflydelse på ejerlejlighedspriserne

Forfatter: Mikkel Helbo

Vejleder: Karsten Poul Jørgensen

Antal normalsider: 53 (fraregnet tabeller, figurer, forside, litteraturliste & bilag)

Afleveringsfrist: 3/5 2021

(2)

2

Indhold

Indledning og problemformulering ... 4

Metode ... 5

Multipel regression ... 5

Residualer & statistiske tests ... 7

Fortolkning af regressionen samt krydsvalidering ... 12

Dataindsamling og videnskabsteori ... 13

Teori og variable ... 15

Finansiel innovation & forventede prisstigninger ... 16

Regler og reguleringer ... 17

Renten ... 18

Netto befolkningsvækst i storbyer ... 21

Disponibel indkomst ... 23

Formue ... 24

Byggeomkostninger ... 26

Inflation & enheder for variable ... 27

Analyse ... 28

Regression med alle variable ... 28

Rente, byggeomkostninger & disponibel indkomst ... 30

Rente og byggeomkostninger ... 31

Byggeomkostninger & disponibel indkomst ... 32

Renten & disponibel indkomst ... 32

Renten, disponibel indkomst & byggeomkostninger i udvalgt periode ... 33

Standardfejl & residualer... 36

Durbin Watson test ... 39

Krydsvalidering ... 42

Diskussion & perspektivering ... 44

Udvalgt periode i endelig regression ... 44

Generelt om datasættet ... 45

Perioder med bobler ... 46

Autokorrelation i fejlleddene - multikollinearitet ... 46

Autokorrelation i fejlleddene – ikke lineære forhold ... 47

(3)

3

Begrænsninger i krydsvalideringen ... 49

Ændring af datasættet ved autokorrelation ... 50

Konklusion ... 52

Litteraturliste ... 54

(4)

4

Indledning og problemformulering

Opgaven ønsker at undersøge hvad der ligger til grund for prisudviklingen på markedet for ejerlejligheder i Danmark. Priserne synes ikke at følge almindelig inflation, og det er derfor interessant at undersøge hvilke faktorer der har en påvirkning. Der er mange artikler om emnet, og især efter finanskrisen i 2008, hvor der var en påvist boble i markedet, er emnet undersøgt og analyseret af mange organisationer; universiteter, OECD og Nationalbanken blandt andre. Boligmarkedet er af kæmpe interesse for befolkningen generelt, da næsten alle før eller siden vil være en del af markedet som boligejere. Derudover har det en politisk interesse, da det for nogle er vigtigt at holde priserne på et punkt, hvor alle kan købe, og det at øge udbuddet ofte kræver ofre i form af grønne områder, som er til stor diskussion. Meget få har ikke en holdning til boligmarkedet, og udviklingen i priserne har en afgørende effekt for nationaløkonomien generelt, som det især kunne ses fra finanskrisen.

Der er mange forskellige modeller til at forklare boligpriserne, og nogle af disse vil gennemgås i opgaven, specielt fravalget af nogle samt opgavens valg af model. De fleste artikler undersøger boligmarkedet generelt, og afgrænser sig derfor ikke fra fx huse. Denne opgave vil derimod kun undersøge markedet for ejerlejligheder. Der er flere årsager til dette, som gennemgås i metodeafsnittet.

Opgaven vil i sidste ende forsøge at lave en model, hvor den enkeltvise påvirkning på ejerlejlighedspriserne, af hvert enkelt element der undersøges, vil fremgå. Denne model vil underbygges ved at sammenligne de historiske priser på ejerlejligheder med den historiske udvikling for hver af faktorerne. Modellen vil findes ved multipel regression, som netop kan påvise effekten af hvert enkelt variabel der inkluderes. De faktorer der inkluderes, vil blive vurderet ud fra den valgte litteratur, og især hvad Nationalbanken & OECD mener er de mest afgørende faktorer.

Forskningsspørgsmål:

• Hvilke faktorer/variable har en effekt på ejerlejlighedspriserne?

• I hvor høj grad kan prisen på ejerlejligheder forklares ud fra de valgte variable?

• I hvilken grad påvirker hver af de undersøgte variable den samlede prisudvikling på markedet for ejerlejligheder?

(5)

5

Metode

I dette kapitel vil opgavens metode og fremgangsmåde beskrives. Først vil der være en kort afgrænsning, og derefter vil valget af model kort forklares, mens denne også diskuteres i senere kapitler i forbindelse med alternative modeller. Derefter vil kapitlet gennemgå hvordan modellen laves og beregnes, og de tests der gøres brug af for at teste for signifikans samt eventuelle faldgruber/fejl der kan være i modellen.

De fleste artikler der undersøger priser på ejerlejligheder, inkluderer hele boligmarkedet. Opgaven

fokuserer udelukkende på ejerlejlighedsmarkedet, og ikke boligmarkedet som helhed. Dette skyldes, at der er forskellige karakteristika ved de forskellige typer af bolig. For eksempel er ejerlejligheder og

andelsboliger ikke prissat ens, og udviklingen i boligpriser har også været meget forskellig fra by til land.

Opgaven afgrænser sig ikke geografisk, eller til byer af en vis størrelse, men dataen vil overvejende være fra netop større byer, som er en afledt effekt af afgrænsningen til ejerlejlighedsmarkedet. Der ligger naturligt flere ejerlejligheder i større byer, da lejligheder ofte vil bygges hvor pladsen er begrænset, og det derfor er effektivt at bygge i højden.

Priserne for ejerlejligheder har større udsving end for boligmarkedet generelt1, og adskiller sig igen her. Det må betyde, at priserne på ejerlejlighedsmarkedet enten er defineret af andre parametre end resten af boligmarkedet, eller at de variable der i almindelighed forklarer boligpriserne, svinger mere for

ejerlejligheder end andre typer af bolig. Derfor vælges der udelukkende at fokusere på ejerlejligheder i opgaven.

Multipel regression

Opgaven vil gøre brug af multipel regression, for at forklare hvor stor en vægt hver faktor som undersøges, skal tillægges. Multipel regression involverer én afhængig variabel, og en eller flere uafhængige

(forklarende) variable.2 Regressionen medfører en formel, der fortæller den proportionale stigning i den afhængige variabel, for hver af de uafhængige variable. Det kan altså herudfra ses, hvor meget de uafhængige variable hver især betyder for den afhængige variabel.

Der vil i det følgende gennemgås hvordan multipel regression laves generelt, det vil sige uden at henvise til de specifikke parametre der er valgt for denne opgave. Disse parametre vil introduceres i teoriafsnittet senere i opgaven. Derefter vil opgaven gennemgå hvordan det måles hvor stor en forklaringsgrad den

1 Betting the House in Denmark, s. 6 & House Prices in Denmark: are they far from equilibrium, s. 4

2 Marketing research, s. 590

(6)

6 resulterende formel har, med andre ord hvor stor en del af den afhængige variabel der kan forklares ud fra de valgte parametre/forklarende variable. Til sidst vil opgaven gennemgå hvordan formlen kan testes for signifikans, med andre ord hvorvidt den kan antages at være pålidelig i mere generelle sammenhænge, end blot det valgte datasæt.

Den afhængige variabel kan ved multipel regression forklares med formlen: f(x) = β0+ β1*X1+…+ βN*XN, hvor N er antallet af parametre.3 Hvert β kaldes for en koefficient, og repræsenterer hver en faktor der har en indflydelse på den afhængige variabel (også kaldet respons variablen). X er de observerede værdier for de koefficienter der estimeres.4

Multipel regression er en udvidelse af lineær regression, hvor der blot findes flere uafhængige variable, som antages at have en påvirkning på den afhængige variabel. I lineær regression bruges Mindste

Kvadraters Metode til at finde den linje, som har mindst gennemsnitlig afstand til de enkelte observerede punkter.5 Denne metode kan bruges til at finde den lineære sammenhæng for samtlige faktorer, og dermed bestemme samtlige regressionskoefficienter. Metoden vil i det følgende gennemgås, men selve analysen vil dog blive lavet i Excel. Udregningerne vil dermed ikke indgå, da vi får Excel til at lave mellemregningerne.

Det er dog samme metode, som der her gennemgås, da det er den mest effektive måde at bestemme koefficienterne.6

Den almindelig forskrift for en ret linje er a*x+b. Afstanden, d1, fra den optimale linje til et givet observeret punkt må være d1 = a*X1+b-y1, da vi kun bevæger os op af y-aksen, og afstanden dermed kun er en forskel i y-værdien.7 Hvis vi har tendenslinjen, skal vi dermed fratrække den observerede y-værdi, for at få

forskellen. Vi kan dernæst hæve d1 til anden potens, for at sikre vi ikke har nogen negative værdier, uanset om de observerede punkter ligger over eller under tendenslinjen.8 Dette gøres for samtlige observerede værdier, og resultaterne lægges sammen, så vi har én ligning, der fortæller os arealet af det samlede kvadrat (eftersom vi hæver afstanden til anden potens, får vi reelt et kvadrat for hver afstand).

For at få dette areal til at være mindst muligt, skal vi differentiere det, og sætte det lig med 0.9 Dette areal bliver et andengradspolynomium, altså en parabel, for både a og b. For at finde den mindste del af

polynomiet, skal vi finde det sted hvor parablen vender. Derfor differentierer man både med hensyn til a og

3 Marketing research, s. 591

4 https://www.webmatematik.dk/lektioner/matematik-a/statistik/multipel-regression/multipel-regression

5 https://www.webmatematik.dk/lektioner/matematik-b/regression/mindste-kvadraters-metode

I Ibid.

7 Ibid.

8 Ibid.

9 Ibid.

(7)

7 b, så vi får to ligninger. Når der differentieres med hensyn til a, vil alle led med b være konstante, og

dermed lig med 0 i en afledt funktion. Det samme gælder for b. Når de to ligninger er sat lig med 0, har vi så to ligninger med to ubekendte, som løses ved at isolere enten a eller b, og sætte det ind i den anden ligning, så vi får én ligning med en ubekendt. Derefter kan vi løse den anden. Dermed kan vi få værdierne for både a og b.10

Residualer & statistiske tests

Når dette er gjort, har vi koefficienter til den rette linje, som bedst passer punkterne. Dette gøres for hver enkelt regressionskoefficient, således vi har alle β værdier. Der vil på dette tidspunkt dog fortsat altid være en residual, da man ikke kan ramme alle punkter perfekt. Hvis man kunne det, ville man nemt blot kunne tegne en lige linje der ramte alle punkterne. Residualen er differencen mellem de punkter, som den resulterende formel fra mindste kvadraters metode giver, og de faktiske observationer. Residualerne diskuteres senere i dette kapitel.

Når man har alle koefficienterne, og dermed formlen for regressionen, er der en række tests der skal til for at vurdere hvorvidt modellen er valid og signifikant, og derudover også hvor følsom modellen er overfor ændringer. For at finde den endelige model, som opgaven vil bruge til analysen, er det afgørende at se på hvordan de øvrige koefficienter ændrer sig, når man fjerner én variabel. Formålet er at finde de variable der er mest afgørende for lejlighedspriserne. Det giver ikke mening at filføje alle variable der potentielt kan have en effekt, af flere årsager, hovedsageligt multikollinearitet og den begrænsede korrelation en variabel kan have med lejlighedspriserne. Sidstnævnte er årsagen til at bruge justeret R2, fremfor R2. Både

multikollinearitet og justeret R2 diskuteres senere i kapitlet.

Man skal altså finde ud af hvilke variable der skal indgå som de forklarende i modellen, og hvilke der skal udelades. I teoriafsnittet vil opgaven komme ind på hvilke variable der er i overvejelserne, så her vil opgaven nøjes med at gennemgå metoden for udvælgelse, blandt de variable som er i betragtning.

Metoden kaldes trinvis regression, og indebærer at udelade de enkelte variable én for én, for at se påvirkningen af de øvrige variable.11 Der er flere måder at lave trinvis regression på, men opgaven vil benytte bagvendt eliminering, der laves ved at modellen oprindeligt indeholder alle variable, og derefter fjerner dem én ad gangen for at se effekten.12 Man fjerner dog kun de variable, som ikke har en signifikant sammenhæng med den afhængige variabel, og starter med den største p-værdi.

10 Https://www.webmatematik.dk/lektioner/matematik-b/regression/mindste-kvadraters-metode

11 Marketing research, s. 599

12 Ibid.

(8)

8 P-værdien udregnes ud fra en t-test, som laves for hver variabel, uafhængigt af de øvrige variable. Den laves altså kun mellem den enkelte, forklarende variabel og den afhængige variabel. Den skal være > 0,05 for at fjernes, da den ellers er signifikant indenfor et 95 % konfidensinterval. Når den første fjernes, kan det påvirke de øvrige variable, hvorefter deres p-værdi også ændres.13 Således fortsætter man, indtil alle forklarende variable i modellen har en p-værdi < 0,05. Hvordan t-værdien udregnes, vil ikke gennemgås i opgaven, da den blot bruges i denne ene sammenhæng. Signifikansen for den endelige model vil beregnes via en F-test, som forklares senere i kapitlet.

Udover at nogle af værdierne sandsynligvis ikke er signifikante, og de tilhørende uafhængige variable derfor må udelades, er der sandsynligvis også nogle af koefficienterne der har det modsatte fortegn af hvad der er forventet. Dette er grundet multikollinearitet, altså sammenhængen mellem de uafhængige variable internt, som diskuteres mere i detaljer senere i kapitlet. Det kan gøre, at regressionen over- eller undergør de enkelte koefficienter, og også at de vendes forkert – fx at der kan være en positiv korrelation mellem rente (som behandles i teoriafsnittet) og boligpriser, som absolut ikke ville være forventet.

For at komme så tæt på de rigtige koefficienter som muligt, vil opgaven lave en korrelationsmatrix, som indeholder alle uafhængige variable og deres indbyrdes korrelation. Hvis regressionen viser sig at have nogle koefficienter, der er meget høje eller lave i forhold til hvad der er forventet, eller det direkte modsatte fortegn af det forventede, vil matrixen kunne bruges til at se hvorvidt de forklarende variable, som har disse koefficienter, har en høj korrelation med en anden uafhængig variabel. Hvis det er tilfældet, kan man overveje at fjerne den variabel der antages at have mindst betydning, og lave en ny regression uden den variabel. Det er på sin vis at gentage den trinvise regression, men blot med fokus på

koefficienterne i stedet for p-værdien.

Undersøgelsen af residualer er én måde at undersøge hvorvidt formlen fra multipel regression er brugbar.

Hvis residualerne har et tydeligt mønster, er det ikke en lineær formel der er korrekt at bruge.14

Residualerne skal dermed være tilfældige (og gerne så små som muligt), hvis multipel regression er den bedste måde at undersøge sammenhængen. Opgaven vil, for at sikre at residualerne følger et tilfældigt mønster, lave et scatter plot. Det vil indeholde de værdier af den afhængige variabel, som

regressionsformlen giver som følge af de observerede forklarende variable, samt de forskelle/residualer der er mellem de observerede værdier og de førnævnte værdier. Der må i dette scatter plot ikke være et tydeligt mønster af nogen slags. Hvis der for eksempel er en stigende forskel mellem observerede og forudsete værdier, som de af regressionsformlen forudsete værdier stiger, har modellen ikke tilstrækkeligt

13 Marketing research, s. 599

14 Marketing research, s. 597

(9)

9 forklaret hvad der definerer den afhængige variabel.15 Der må ligeledes heller ikke være en (stor) overvægt af residualer over eller under 0, og til sidst skal residualerne gerne være centreret omkring 0.16 Denne undersøgelse skal sikre, at der er konstant varians i residualerne, også kaldet fejlleddene. Er der ikke konstant varians, er der et mønster som modellen ikke kan forklare.17

Ligesom der skal være konstant varians, må der heller ikke være sammenhæng mellem residualerne

internt. Derfor testes der også for hvorvidt der er korrelation mellem de enkelte fejlled.18 Man kan igen lave et scatter plot, som viser de enkelte uafhængige variable på den ene akse, og residualerne på den anden.

Der skal heller ikke her være et mønster af nogen slags, og de enkelte punkter bør ligge omkring 0, og ligeligt fordelt > og < 0.19

For at sikre der ikke er korrelation mellem fejlleddene, også kaldet autokorrelation20, vil opgaven lave en Durbin-Watson statistisk test. Denne angiver hvorvidt der er korrelation mellem fejlleddene, og hvorvidt denne i så fald er positiv eller negativ.21 Durbin-Watson vil altid have en værdi mellem 0 & 4.22 Hvis Durbin- watson < 2, vil der være positiv korrelation imellem residualerne, mens der vil være negativ korrelation hvis 2 < Durbin-Watson.23 Hvis værdien af Durbin-Watson testen er præcist 2 betyder det, at der ikke er nogen korrelation.24

Durbin-Watson testen foregår ved, at man først finder residualerne, altså forskellene mellem de

observerede og de af modellen forudsete værdier. Derfra kvadrerer man de enkelte residualer, og lægger dem alle sammen. Vi kalder dette tal summen af kvadrerede fejlled. Derefter finder man differencerne mellem residualerne ved at fratrække den første residual fra den anden, den anden fra den tredje og således indtil man har alle differencerne. De skal herefter kvadreres og lægges sammen.25 Dette tal kaldes summen af kvadrerede differencer.

Værdien af Durbin-Watson er den værdi der fremkommer, når man dividerer summen af kvadrerede fejlled med summen af kvadrerede differencer.26 Denne vil som nævnt have en værdi mellem 0 og 4. For at

15 Marketing research, s. 596

16 Ibid.

17 Ibid.

18 Marketing research, s. 597

19 Ibid.

20 Ibid.

21 https://www.investopedia.com/terms/d/durbin-watson-statistic.asp

22 Ibid.

23 Ibid.

24 Ibid.

25 Ibid.

26 Ibid.

(10)

10 vurdere hvorvidt denne er signifikant, tester man for enten positiv eller negativ autokorrelation. Hvis værdien af Durbin-Watson < 2, testes der for positiv autokorrelation, mens der testes for negativ hvis den er > 2. Hvis vi tester for positiv autokorrelation mellem residualerne, kan vi via en tabel finde øvre og nedre grænse. Hvordan de øvre og nedre grænser fremkommer, vil opgaven ikke redegøre for, men man tester for nulhypotesen ved at se om værdien overskrider værdien i en signifikanstabel ud fra antal observationer, uafhængige variable og konfidensinterval, ligesom med andre lignende, statistiske tests. Opgaven gør brug af et 95-% konfidensinterval.

Hvis værdien af Durbin-Watson > øvre grænse, er der ingen sammenhæng mellem residualerne. Hvis værdien < den nedre grænse, er der derimod positiv autokorrelation mellem residualerne.27 Når vi tester for negativ korrelation, skal man fratrække værdien af Durbin-Watson fra 4. Hvis den værdi der

fremkommer > den øvre grænse, er der ingen sammenhæng mellem residualerne, mens der hvis værdien <

den nedre grænse, er en negativ korrelation mellem fejlleddene.28 I begge tilfælde, test for positiv og negativ autokorrelation, vil det, hvis værdien af Durbin-Watson hhv. 4 - værdien af Durbin-Watson er mellem den øvre og nedre grænse, være tegn på at testen ikke kan konkludere hvorvidt korrelationen er signifikant.29

Derudover har vi et nøgletal i R2, som også giver et billede af hvorvidt formlen er valid. R2 kaldes

determinationskoefficienten, og angiver hvor stor en del af regressionen der forklarer afvigelserne i den afhængige variabel. Den udregnes som variansen for regressionen divideret med variansen for

observationerne.30 R2 ligger mellem 0 & 1, og kan anses ligesom forklaringsgraden for en korrelation, med den tilføjelse at den kan vurdere samtlige estimerede parametre (β) for regressionen. Jo tættere på 1, desto mere kan regressionen forklare den afhængige variabel.31 Hvis de enkelte parametre er uafhængige af hinanden, kan R2 forklare en større del af den afhængige variabel, end hvis de har en indbyrdes

korrelation.32 Dette skyldes, at hvis de uafhængige variable har en stærk sammenhæng, vil der være et vist overlap mellem deres individuelle sammenhæng med den afhængige variabel. Hvis de er totalt uafhængige, vil R2 være den simple sum af deres individuelle R2, det vil sige hvis man blot målte variansen for en

regression med en enkelt uafhængig variabel og dividerede med variansen for observationerne.33 Hvis R2 er

27 https://corporatefinanceinstitute.com/resources/knowledge/other/durbin-watson-statistic/

28 Ibid.

29 Ibid.

30 Marketing research, s. 594

31 Ibid.

32 Ibid.

33 Ibid.

(11)

11 mindre end dette, er det altså et udtryk for, at der er en vis korrelation mellem de enkelte uafhængige variable.34

R2 vil altid give minimum det samme som de enkelte uafhængige variables forklaringsgrad ift. den afhængige variabel35, og oftest mere da det er derfor man tilføjer flere uafhængige variable. Dog er der også et problem i dette, eftersom jo flere man tilføjer, desto større vil R2 blive. Det er ikke ensbetydende med, at det giver mening at tilføje flere variable, da de tilføjede variable kan have en meget begrænset korrelation med den afhængige variabel, og ofte ikke en signifikant sammenhæng. Derfor vil opgaven gøre brug af et justeret R2, som tager højde for antallet af uafhængige variable og observationer, og justere nøgletallet efter dette.36 Dette gøres via formlen: Justeret R2 = R2-(k*(1-R2))/(n-k-1), hvor k = antal uafhængige variable og n = antal observationer.37

R2 (justeret) indikerer hvor stor en del af regressionen der kan forklare variationerne i den afhængige variabel. Dog er det vigtigt, at man også tester hvorvidt regressionen er valid/signifikant. Hvis regressionen er signifikant betyder det, at det vurderes at regressionens resultater ikke er et tilfælde, men at samme resultat ville forekomme i andre, lignende analyser. I opgaven benyttes et signifikansniveau på 95 % (α = 0,05), hvilket betyder at hvis regressionen er signifikant, vil den være sand i mindst 95 % af tilfældene. Sagt på en anden måde er der en sandsynlighed på 5 % for, at et (meget) anderledes resultat ville forekomme hvis testen blev gentaget.

Opgaven gør brug af en F test for at teste for signifikans. Testen vil have en nulhypotese, som ved et

signifikansniveau på 95 % skal forkastes for, at regressionen er signifikant. Nulhypotesen lyder på R2 = 0; det medfører også, at samtlige β = 0.38 Den alternative hypotese er dermed, at R2, og mindst ét β, er > 0, hvilket bekræftes i tilfælde af, at nulhypotesen forkastes. F testen udregnes ved, at man først finder F værdien.

Denne skal overstige den værdi der gives i en distributionstabel med n-k-1 frihedsgrader, givet det signifikansniveau der vælges.39 F værdien findes ved formlen: F = (R2/k)/((1-R2)/(n-k-1)).40

34 Marketing research S. 594-5

35 Marketing research, s. 595

36 Ibid.

37 Ibid.

38 Ibid.

39 Ibid.

40 Ibid.

(12)

12

Fortolkning af regressionen samt krydsvalidering

Modellen der fremkommer som resultat af multipel regression, kan godt være signifikant ud fra det givne datasæt, uden at modellen nødvendigvis er god til at forklare de observerede værdier. At modellen er signifikant betyder blot, at man kan forkaste nulhypotesen. Som nævnt er nulhypotesen i dette tilfælde, at R2 = 0, altså at modellen ikke kan påvise en sammenhæng mellem de uafhængige/forklarende variable, og den afhængige variabel. Selv hvis den kan påvise en vis sammenhæng, og den alternative hypotese dermed accepteres, er det ikke ensbetydende med, at modellen er god til at forklare sammenhængen. Hvorvidt formlen er god til at forudse bevægelserne i den afhængige variabel vil delvist kunne ses ud fra

distributionen af residualer, der viser om der er et mønster der ikke bør være samt hvor store residualerne er. Dertil kommer Durbin-Watson testen, som be-/afkræfter om der er sammenhæng mellem residualerne, og om modellen dermed har en begrænsning.

Dog vil opgaven gøre brug af en yderligere test for at vurdere hvor god modellen er til at forklare udsving i lejlighedspriserne, kaldet krydsvalidering. Denne test er beregnet til at vurdere hvor følsom modellen er overfor det specifikke datasæt der er valgt.41 Testen foregår ved, at det datasæt der er brugt til den

multiple regression inddeles i to, én del kaldet estimatdelen og én del kaldet valideringsdelen. Estimatdelen indeholder mellem 50-90 % af det oprindelige datasæt, hvoraf resten er i valideringsdelen. Derfra laver man en ny regression, på samme måde som gjort oprindeligt, men kun med det datasæt i estimatdelen.

Den nye model sammenlignes med den oprindelige model, der indeholder hele datasættet, og man kan dermed se hvor stor en effekt de enkelte uafhængige variable har i den nye og den oprindelige model. Hvis der er stor forskel på vægten af koefficienterne, er det ikke en god model der oprindeligt er valgt.

Krydsvalideringen er dog ikke færdig her, da modellen fremkommet ud fra estimatdelen af datasættet nu bruges på valideringsdelen. Det betyder, at man ved den nye model estimerer hvad den afhængige variabel vil være ud fra datapunkterne i valideringsdelen. Man laver altså en tabel med de observerede værdier fra valideringsdelen og de estimerede værdier fra estimatdelen, og finder residualerne i disse. Man kan så her udregne R2 for den nye model, og sammenligne med R2 for både estimatdelen og den oprindelige model.42 Hvis R2 er faldet eller steget markant, tyder det på at modellen er meget afhængig af den valgte data.

En stor udfordring ved multipel regression er multikollinearitet. Multikollinearitet opstår hvis de

uafhængige variable har en stærk indbyrdes korrelationskoefficient.43 Det kan medføre, at der kan være

41 Marketing research, s. 602

42 Ibid.

43 Marketing research, s. 601

(13)

13 store afvigelser i estimeringen af de enkelte β værdier, som dermed kan være meget forskellige alt efter datasættet der bruges.44 Det betyder at man ikke kan vurdere den relative betydning af hver uafhængig variabel korrekt, og standardfejlen er dermed også høj. En simpel løsning er, at man blot bruger én af de variable, som har en indbyrdes korrelation, da denne så vil forklare en stor del af variationen i den afhængige variabel alene.45 Det er svært helt at undgå korrelationer mellem de uafhængige variable, men en høj grad af dette er altså et problem. Der er dog flere tegn på dette; den justerede R2 værdi relativt til R2 vil være noget lavere, da tilføjelsen af andre variable ikke vil medføre den store forskel i forudsigelsen af den afhængige variabel, samt en høj standardfejl i de enkelte parametre.46

De forrige afsnit fortæller hvordan man kan udregne parametrene (β) for de enkelte uafhængige variable i multipel regression, samt hvordan man kan forstå og fortolke resultaterne, og sikre at de er valide og signifikante. Microsoft Excel kan dog give os svaret uden vi behøver lave beregninger. Derfor vil der ikke i opgaven indgå udregninger som sådan, da dette vil gøres via Excel. Det er dog vigtigt at forstå hvordan resultaterne fremkommer, hvilket er årsagen til at de forrige afsnit er en del af opgaven. Selve

datagrundlaget er vedlagt i bilag 2-5, samt tabellen med de enkelte nøgletal der indgår i opgaven.

Dataindsamling og videnskabsteori

De uafhængige/forklarende variable der indgår i opgaven, er valgt ud fra diverse artikler om emnet. Der er mange artikler om emnet, og der er hentet meget inspiration og viden fra disse. Dog adskiller opgaven sig fra mange artikler/afhandlinger om emnet, idet der fokuseres på ejerlejligheder, og ikke boligmarkedet som helhed. En afledt effekt af dette er også, at der indirekte vil fokuseres hovedsageligt på storbyer, eftersom det er her den største andel af ejerlejligheder er.

Opgaven vil benytte sig af data fra eksterne kilder, og dermed ikke noget som der er indsamlet til formålet.

Det er blandt andet data fra Danmarks Statistik samt forskellige artikler. Der vil ikke benyttes interviews, spørgeskemaer eller lignende.

Et studie af denne karakter kan ses som havende en positivistisk tilgang til emnet. For det første antages det, at der er en objektiv sandhed47, det vil sige at man kan finde den formel der nøjagtigt beskriver

lejlighedspriserne. Den residual der er fra formel til virkelighed, er antaget som en boble på markedet, eller

44 Marketing research, s. 601

45 Ibid.

46 Ibid.

47 Videnskabsteori, s. 63-4

(14)

14 andre parametre der ikke er inkluderet i opgaven. Det er ikke antaget, at denne opgave vil finde den

nøjagtige formel, men med andre/yderligere parametre, er antagelsen at det kan lade sig gøre.

Økonomi er i almindelighed ikke en eksakt videnskab, hovedsageligt fordi efterspørgsel har så stor en effekt på priserne, og den er meget svær at forudse og matematisk beskrive. Efterspørgslen er ikke altid rationel, og derfor kan den heller ikke skrives som en formel, der med sikkerhed kan forudse variationer. Dog antager opgaven, at mennesker på markedet for lejlighedspriser er rationelle, og at man derfor kan beskrive hvad der driver priserne. Det er ikke i praksis helt korrekt, men det er den tilgang opgaven benytter da en stor del af markedet antages at være rationelt, og den tilgang læner sig op ad positivismen.

Derudover antager opgaven en kausal sammenhæng, også kendt som årsag-virkning, som også er kendt fra positivismen.48 Det kan ses fra brugen af den multiple regression, hvor det antages at ændringen i ét parameter vil føre til en forudsigelig, præcis ændring i den afhængige variabel, i dette tilfælde prisen. Igen er dette ikke i praksis helt korrekt, men den tilgang opgaven benytter.

Opgaven antager altså at der er én objektiv, korrekt pris på et givet tidspunkt, og forskellen fra formlen til den pris skyldes forkerte parametre, en forkert model, en boble på markedet etc. Det kan diskuteres hvorvidt der er én reel, korrekt pris, da denne er afhængig af så mange variable, og nogle af disse (fx efterspørgslen) ikke nødvendigvis er helt rationelle. Dog er det ikke ødelæggende for opgavens konklusion selv hvis denne ikke findes, da det er accepteret at der er en residual fra den forudsete til den faktuelle pris på et givet tidspunkt. Selv med denne residual, kan formlen være brugbar, hvis den kan bruges til at vurdere i hvilken retning og (nogenlunde) hvilket omfang prisen bevæger sig, som følge af ændringer i de forklarende variable. Der vil ikke bruges mere tid på videnskabsteori i opgaven, da det vurderes det ikke er det essentielle i en opgave som denne. Dog er det vigtigt at være opmærksom på de begrænsninger der er, som diskuteret ovenfor.

Opgaven vil gøre brug af kvartalsvise observationer, og gå tilbage til ca. år 2000, afhængigt af hvor nemt data kan findes for de enkelte variable. Over en lang periode på fx 50 år, vil det sandsynligvis ikke være de samme variable som påvirker prisen, eller i hvert fald ikke med samme koefficienter, og dermed kan regressionen ikke bruges til at vurdere fremtidige udsving i den afhængige variabel, som følge af udsving i de forklarende variable. Fx kan lovgivningen have ændret sig meget i den tid, som besværliggør at få den rigtige formel for ejerlejlighedspriserne.

48 Videnskabsteori, s. 64

(15)

15

Teori og variable

Opgaven vil i dette kapitel beskrive de uafhængige variable, som vurderes at være de væsentligste for priserne på ejerlejlighedsmarkedet. Der er mange at vælge imellem, og som isoleret kan have en stærk korrelation med lejlighedspriserne. Dog skal man være opmærksom på, at der ikke bør vælges flere uafhængige variable, som internt har en (stærk) korrelation. Den problematik er beskrevet i

metodeafsnittet. Der er dermed en opgave i at vurdere hvad der er de faktorer med størst indflydelse på priserne, som internt ikke har nogen stærk sammenhæng med hinanden.

Inden de enkelte variable forklares, er der nogle generelle betragtninger opgaven vil gennemgå. Dette drejer sig blandt andet om fravalg af visse variable af forskellige årsager, samt afgrænsningen af boligmarkedet.

Opgaven fokuserer, som nævnt i seneste kapitel, udelukkende på ejerlejlighedsmarkedet, og ikke

boligmarkedet som helhed. Priserne for ejerlejligheder har større udsving end for boligmarkedet generelt49. Det må betyde, at priserne på ejerlejlighedsmarkedet enten er defineret af andre parametre end resten af boligmarkedet, eller at de variable der i almindelighed forklarer boligpriserne, svinger mere for

ejerlejligheder end andre typer af bolig. Det er sandsynligt, at det er grundet den større andel af lejligheder omkring storbyer, og især Storkøbenhavn, som alene har ca. 50 % af markedet.50

Opgaven vurderer at én variabel der har indflydelse på priserne på ejerlejligheder, er specielt stærk for større byer i Danmark, som bliver forklaret senere i kapitlet. De øvrige variable kan dog også være stærkere for storbyer, og er det delvist også, men er dog ikke specifikke for hverken byer eller geografi. Det ses også, at ejerlejlighedsmarkedet har en afgørende effekt på resten af husmarkedet, og til dels kan siges at drive priserne på resten af boligmarkedet.51 Det vurderes, at det er grundet de variable som er gældende for både ejerlejligheder og boligmarkedet generelt, hvor udsvingene er større for ejerlejligheder, og derfor ses en trend hurtigere på dette marked, hvad enten det går op eller ned, som senere også vil ramme det resterende boligmarked.

Opgaven bestræber sig på at kortlægge hvad der driver priserne på ejerlejlighedsmarkedet. De parametre der driver priserne, kan principielt både være rationelle og irrationelle. Nationalbanken skriver, at den eneste variabel der bør definere priserne i et fuldt rationelt marked, er forbrugsomkostningerne ved

49 Betting the House in Denmark, s. 6 & House Prices in Denmark: are they far from equilibrium, s. 4

50 Betting the House in Denmark, s. 8

51 Betting the House in Denmark, s. 6

(16)

16 boligen, da fx afdrag jo er en opsparing i lejligheden.52 Altså bør afdragsfri lån ikke have en effekt på

priserne på ejerlejlighedsmarkedet.

Finansiel innovation & forventede prisstigninger

Mange mener dog, at netop afdragsfri lån har en stor effekt på boligpriserne, og ét studie finder at nye, afdragsfri lån er ca. halvdelen af årsagen til de store prisstigninger frem til 2007.53 Netop denne pointe er vigtig, at det er op til 2007, hvorefter markedet falder kraftigt. Irrationelle variable kan godt have en effekt på boligpriserne på kort sigt, men vurderes til altid at miste effekten på lang sigt. Variable der udelukkende har en effekt i bobler, det vil sige når prisen er uholdbart høj, vil ikke inkluderes i opgaven, da de kun i en vis periode har en påvirkning. Den endelige model der findes kan sandsynligvis ikke forklare alle udsving i ejerlejlighedspriserne, og det er sandsynligt det blandt andet er fordi de variable, der af opgaven anses som irrationelle, er udeladt. Specifikt vil finansiel innovation ikke inkluderes, af samme argument som

Nationalbanken bruger, mens andre dele af forbrugsomkostningerne på en lejlighed vil.

Forventninger om prisstigninger er også af flere studier vurderet til at have en stor effekt på boligpriserne,54 og det samme kan siges om forventninger til renten.55 Dog kan ingen vide med sikkerhed hvad hverken udviklingen i boligpriser eller renter vil være. I aktieverdenen bør forventede kapitalgevinster ikke medregnes i vurderingen af en aktie, blot de tilbagediskonterede værdier af udbytte.56 Det samme argument har opgaven for boligpriser. Der er ingen sikre gevinster ved hverken aktier eller boliger (eller andre aktiver), og principielt kan argumentet med udbytte bruges om forbrugsomkostningerne ved en lejlighed. Man kunne argumentere for, at de tilbagediskonterede besparelser på forbrugsomkostningerne ved eje fremfor leje bør definere prisen på en ejerlejlighed, da prisen dermed er relativ til lejepriserne, altså alternativet til at eje. Flere studier sammenligner ejerpriser med lejepriser, som vil diskuteres senere i dette kapitel. Det skal nævnes, at opgaven ikke mener aktier og boliger kan prissættes ens, da der er flere

forskelle, men blot at køb udelukkende baseret på en forventet prisstigning, som kommer af at priserne det seneste stykke tid også er steget, er irrationelt.

Risiko og gevinster følges ad, og det er derfor irrationelt at forvente en sikker prisstigning, uden risiko, da ingen ville sælge hvis det var sandheden. At købe med forventning om at priser fortsætter med at stige, uanset hvilket punkt de er nået (som det må siges at have været tilfældet med boblen i 2007), leder til et

52 Kvartalsoversigt, Danmarks Nationalbank, s. 12

53 Betting the House, s. 8

54 A Bird’s eye view, s. 24 & Kvartalsoversigt, Nationalbanken, s. 22

55 Boligmarked I flere hastigheder, s. 56

56 Principles Of Corporate Finance, s. 81

(17)

17 overophedet marked og dermed en boble. Af samme årsag vil opgaven dermed ikke inkludere forventede prisstigninger som en variabel i ejerlejlighedspriserne, da det ikke anses som holdbart over en længere periode.

Regler og reguleringer

Mange argumenterer også for, at politiske tiltag har en stor effekt på boligpriserne. Dette anses af opgaven som validt, da politiske tiltag inkluderer fx skattefradrag af renter. Jo større fradraget, jo mindre er renten reelt, og derfor har det en betydning for lejlighedspriserne (rentens effekt på priserne diskuteres senere i kapitlet). Ligeledes er kapitalgevinsten ved salg af en lejlighed skattefrit, hvis man blot selv har boet i den.

Det gør lejligheder mere attraktive, sammenlignet med øvrige aktiver som ikke er skattefrie og med en lignende risikoprofil (selv om det selvfølgelig adskiller sig på det punkt, at man er nødsaget til selv at bo i lejligheden). Som det sidste kan også nævnes huslejeregulering, som diskuteres senere i kapitlet i forbindelse med udbuddet på markedet for ejerlejligheder. Det skal dog også nævnes her, at det har en stor effekt på boligpriserne, at huslejen på lejemarkedet er reguleret, blandt andet fordi det reducerer incitamentet til at eje selv.57

Der er flere regler og reguleringer der har en effekt end ovenstående, men opgaven vil ikke inkludere disse i modellen. Årsagen er, at multipel regression sammenligner to datasæt. Regler og reguleringer har ofte ikke et datasæt som sådan, da det blot er ét datapunkt, altså en regelændring, hvorefter kurven vil ligge fladt – fx indførslen af et huslejeloft. At de ikke inkluderes, betyder ikke, at de ikke har en effekt på

lejlighedspriserne, og det kan dermed også forklare den residual der vil være fra modellen til de observerede priser. Det er et generelt problem ved multipel analyse, at regler og reguleringer ikke medtages58. Man kunne måle effekten af regler og reguleringer ved en test, hvor man sammenlignede gennemsnitlige priser før og efter indførslen af den nye lov, hvor det også er nødvendigt at kontrollere for yderligere faktorer der kunne have en indflydelse. Denne analyse ville dog ikke kunne finde hvad der driver priserne, som opgavens formål er, men blot se hvorvidt en udvalgt variabel havde en signifikant indflydelse eller ej.

En anden løsning på at inkludere regler og reguleringer ville være at bruge formlen for price-to-rent, hvor der sammenlignes priserne for leje og eje. Denne formel udvælger ikke specifikke variable der måles, men ser på forholdet mellem eje og leje, og hvorvidt boligpriserne dermed er overvurderede ift. lejemarkedet.

Dette kan fungere i et frit marked, men udfordringen i et marked som det danske er, at lejepriserne er

57 Fundamental drivers of House prices, s. 12

58 Fundamental drivers of House prices, s. 6

(18)

18 regulerede. Da priserne på lejemarkedet ikke er frie, kan man ikke bruge dem som mål ift.

ejerlejlighedspriserne. Formlen er dermed ikke brugbar i lande med regulerede lejemarkeder.59

Renten

Den første variabel der vurderes til at have en indflydelse, er renten. Denne variabel er inkluderet i langt størstedelen af alle modeller som forsøger at forudsige huspriserne.60 Opgaven ser ikke umiddelbart, at der skulle være nogen forskel på denne variabels indflydelse på boligmarkedet generelt, og lejlighedspriserne.

Der er flere årsager til, at renten har en effekt på lejlighedspriserne. For det første er det billigere at låne penge, og dermed er det billigere at eje en lejlighed når renten er lav. Flere artikler påviser en stærk sammenhæng mellem forbrugsomkostningerne ved en bolig, og priserne på boligmarkedet. Når disse er lave, vil prisen være høj.61 Nationalbanken argumenterer for, at brugerprisen ved en bolig er det eneste der bør bestemme prisen, i et marked hvor ”(…) forbrugerne er fuldt rationelle og ikke oplever bindende kreditrestriktioner(…)”.62 Flere penge kan lånes til samme rentebetaling, når renten er lav fremfor høj, og dermed vil priserne på boliger, heriblandt ejerlejligheder, være højere.

Renter kan anses som værende definerende for lejlighedspriser af en anden årsag udover

forbrugsomkostningerne. Da realkreditrenter og obligationsrenter begge anses som værende tæt på risikofri (dog ikke helt samme risiko), vil renten på de to følges nogenlunde ad. Dog kan der vindes kapitalgevinster på boliger, modsat obligationer, og derfor har der været mere interesse for boliger som investering, fremfor fx obligationer.63 Det skal nævnes, at opgaven ikke mener at stats- og

realkreditobligationer har samme risikoprofil, og de to kan ikke sammenlignes 1:1. Dog vil der ofte ikke være alt for stort et spring, da realkreditobligationer ofte har en lav risiko.

Forbrugsomkostningerne ved en lejlighed har en naturlig effekt på priserne, da det er det en lejlighed koster at eje. Danskerne bruger i gennemsnit ca. 25 % af deres indkomst på omkostninger forbundet med bolig.64 For en billigere rente kan de 25 % dermed købe noget dyrere, og dermed stiger prisen på

lejligheder. Det er dog ikke kun renten der definerer forbrugsomkostninger, da det også er skatter,

59 Fundamental drivers of house prices, s. 6

60 Ledighed og ejerboligpriser, s. 1 & House prices in Denmark: are they far from equilibrium?, s. 8 & Fundamental drivers of house prices (…), s. 2, A Bird’s eye view of OECD Housing markets, s. 19 & Kvartalsoversigt, Danmarks Nationalbank, s. 12, Betting the house in Denmark, s. 9

61 Fundamental drivers of house prices (…), s. 7 & House prices in Denmark: are they far from equilibrium?, s. 7 &

Kvartalsoversigt, Danmarks Nationalbank, s. 12

62 Kvartalsoversigt, Danmarks Nationalbank, s. 12

63 Fundamental drivers of house prices, s. 8

64 Betting the House in Denmark, s. 6

(19)

19 foreningsydelser, afdrag etc. Med de afdragsfri lån kan der dermed også skabes ekstra luft i budgettet til at eje noget dyrere, som driver priserne op.65 Dette menes at have været en større årsag i Danmark end i mange andre lande, til de voldsomme prisstigninger op til 2007.66 Det skal dog også ses som en opsparing i boligen at betale afdrag, så man kan vende tilbage til det argument, at i et rationelt marked bør det ikke anses som en del af forbrugeromkostningen.67 Det er dermed en diskussion om hvorvidt markedet er rationelt eller ej. Hvis man ser på prisudvikling over en længere periode, bør det dog altid være rationelle aspekter, da alt andet må tilskrives bobler, som ikke varer i længere perioder. De afdragsfri lån der nævnes, som har en stærk betydning for prisstigningerne, er netop op til 2007 hvor boblen brister68, og inkluderes som nævnt ikke i opgaven.

Renten har en stærkere betydning for boligmarkedet generelt, herunder ejerlejligheder, i Danmark end i de fleste andre lande i OECD. Der er flere årsager til dette: større investeringer i boliger med variable lån, stor andel af pensionsopsparinger i realkreditobligationer, og den høje andel af vores indkomst der bruges på boligomkostninger.

Danmark er det mest forgældede land i OECD ift. husmarkedet.69 Det betyder med andre ord, at vi har den største andel af gæld indenfor boliger i hele OECD. En stor del af disse lån er med variable renter70, og danske banker har ift. andre lande i OECD tilladt flere lån med variable afdrag.71 Det gør, at det danske boligmarked er sårbart overfor stigende renter72, eftersom disse vil slå direkte igennem på

forbrugsomkostningerne ved en bolig. Nogle vil måske være tvunget til at sælge, da de ikke længere har råd til at eje en bolig med højere omkostninger, mens andre blot vil være tvunget til at bruge færre penge på andre forbrugsgoder, som med forsinket effekt vil ramme økonomien og dermed også boligmarkedet. I et land/marked med stor andel af faste renter, vil man også kunne se en effekt af stigende renter, eftersom nye på markedet ikke vil kunne købe til samme priser. Dog vil det være en mindre effekt, eftersom

eksisterende boligejere ikke vil være ramt, og det er dermed mindre sandsynligt at nogle vil være tvunget til at sælge og dermed skabe et stort, pludseligt udbud.

Udover vi er det mest forgældede land ift. boligmarkedet, investerer vi yderligere i boligmarkedet end andre lande i OECD. Danmark har en høj pensionsopsparing pr. borger, sammenligneligt med de øvrige

65 A Bird’s eye view of OECD Housing Markets, s. 21

66 Betting the House in Denmark, s. 8

67 Kvartalsoversigt, Danmarks Nationalbank, s. 12

68 Betting the House in Denmark, s. 5

69 Ibid.

70 Ibid.

71 Betting the House in Denmark, s. 7

72 A Bird’s eye view of OECD Housing Markets, s. 21

(20)

20 lande i OECD, og 1/3 af vores samlede pensionsopsparing er investeret i realkreditobligationer.73 Den høje gæld vi har som følge af boliger, er der tilsvarende værdifulde aktiver for, netop vores boliger, men derudover er der altså yderligere investeringer i boligmarkedet gennem pensionsopsparinger. I og med vi har så høj en investering i boligmarkedet, er vi dermed også mere eksponerede overfor udsving i priserne, som kan følge af renten. Af denne årsag er det danske boligmarked også mere følsom overfor renten end mange andre lande.

Det sidste argument for, at de danske boligpriser er mere følsomme overfor rentestigninger end øvrige lande i OECD, er vores allerede høje andel af indkomst/budget der bruges på omkostningerne fra bolig.

Som tidligere nævnt bruger danskerne i gennemsnit cirka 25 % af deres indkomst på en bolig, hvilket er meget højt sammenligneligt med andre lande i OECD.74 I og med det ligger højt i forvejen, vil der sandsynligvis være en større andel af boligejere, som ikke vil kunne klare en rentestigning, som vil give direkte udslag i forbrugsomkostningerne ved en bolig, hvis man vel at mærke har en variabel rente. Havde man haft et lavt gennemsnit, samt en lav andel af gæld med variabel rente, ville de fleste nok kunne overkomme en stigning i renten. Opgaven vurderer derfor, at den høje ratio af

forbrugsomkostninger/indkomst gør, at det danske boligmarked er yderligere eksponeret overfor renteudsving.

Der vil til regressionen bruges lange realkreditrenter, dvs. renten på 30-årige realkreditobligationer.

Årsagen er, at der i længere perioder ikke har været større brug af variable renter.75 Selvom der i perioder, især op til 2006 og de seneste år med negativ rente, har været stor brug af lån med variable renter, er trenden igen vendt til fast forrentede lån.76 Derudover kan det ses, at renten på de forskellige lån til dels følges ad.77 Det er altså ikke sandsynligt at renten går den modsatte vej på fastforrentede end variable lån.

Det betyder, at selvom der skulle være overvægt af variable lån, vil regressionen fortsat kunne redegøre for effekten af rentebevægelser på ejerlejlighedspriserne, eftersom renterne går samme vej. Det er naturligvis ikke lige så præcis en estimation af effekten, hvis der vælges lange renter når overvægten er blandt korte, eller omvendt, da udsvingene historisk ikke er præcist de samme. Dog reducerer det den potentielt negative effekt af at vælge de forkerte renter i forhold til opgavens formål, at renterne bevæger sig i nogenlunde samme retning.

73 Betting the House in Denmark, s. 5

74 Betting the House in Denmark, s. 6

75 Ledighed og boligpriser, s. 16-17

76 https://nordeakreditbolignyt.nordea.dk/artikler/201912-folger-du-boligtrenden

77 https://www.xn--lnio-qoa.dk/blog/2018/09/udvikling-i-realkreditlaan

(21)

21 Da renten ikke udelukkende definerer forbrugsomkostningerne, og samtidig også kan influere

lejlighedspriserne udover effekten på forbrugsomkostningerne, kan der argumenteres for både at inkludere renten og forbrugsomkostningerne. En analyse viser, at forbrugsomkostningerne ved at eje en ejerlejlighed består af ca. 50 % renter og boligydelser, mens det resterende blandt andet er skatter, fællesydelser, forsikring, vand og varme.78 Der er naturligvis en korrelation mellem renter og forbrugsomkostninger: mens renten ikke er defineret af forbrugsomkostningerne, men i en vis grad definerer forbrugsomkostningerne ved at eje en lejlighed, har de to en stærk sammenhæng. Dette bør dog kunne ses ud fra opgavens korrelationsmatrix, og fjernes hvis koefficienterne vurderes som urealistiske. Udfordringen her er ikke multikollinearitet, som der også ville kunne forekomme, men manglende data. Der findes kun årlig statistik for forbrugsomkostninger79, og ikke kvartalsvis, og dermed kan det ikke inddrages i analysen. Opgaven vil derfor nøjes med at inkludere renten.

Rentens forhold til lejlighedspriserne er påvirket af to faktorer: inflation og skattefradraget. Hvis inflationen er høj, vil den reelle rente være mindre. Dette skyldes, at inflationen gør, at rentebetalinger bliver mindre værd. Hvis man fx betaler 1.000 kr. i renter (med fast rente), og der er 10 % inflation p.a., vil de 1.000 kr.

kun være 1.000/1,1 = 909,1 kr. værd efter et år. Der betales derfor i reelle termer 90,9 kr. mindre i renter, end året før. Hvis inflationen dermed er høj, er den nominelle rentes påvirkning af boligpriserne mindre.

Derfor vil opgaven bruge realrenten, som er den nominelle rente – inflation.80

Realrenten skal dog yderligere renses for skattefradraget. Der er et fradrag i skat hvis man betaler renter, også kaldet negativ kapitalindkomst. Størrelsen på dette fradrag har også en effekt på den reelle

rentebetaling. Hvis man fx betaler 1.000 kr. i (real)rente, men må trække 60 % af renterne fra i skat, kan man fratrække 600 kr. i sin skattepligtige indkomst. Den reelle rente efter skat er derfor kun 40 % af realrenten før skat. Opgaven vil derfor, når rentens effekt på lejlighedspriserne vurderes, gøre brug af formlen: realrenten*(1-fradrag). Denne formel er vist i bilag 1.

Netto befolkningsvækst i storbyer

Den næste variabel, som vil indgå i regressionen, og som menes at have en stor effekt på

lejlighedsmarkedet, er netto befolkningstilvækst i storbyer. Generel befolkningsvækst vil øge priser på

78 https://www.bolius.dk/prisen-for-at-eje-sin-bolig-16638

79 Ses i statistikbanken, at der ikke er kvartalsvis data: https://www.statistikbanken.dk/10082

80 https://www.ecb.europa.eu/explainers/tell-me/html/nominal_and_real_interest_rates.en.html

(22)

22 boligmarkedet81, og igen antages det ikke at være anderledes for ejerlejligheder end for boligmarkedet generelt. Der har især i Storkøbenhavn været stor nettobefolkningsvækst siden 200982, og flere mennesker må alt andet lige hæve priserne. Eftersom næsten 50 % af ejerlejligheder ligger i Storkøbenhavn83, må effekten på prisen på ejerlejligheder fremfor det generelle boligmarked være stor.

Der er til opgaven udvalgt de fire største kommuner (dog er Frederiksberg kommune i dette tilfælde med under Københavns kommune, da det er en del af Storkøbenhavn), til netto befolkningsvækst. Årsagen er, at det nævnes i flere artikler, at det er her langt de fleste ejerlejligheder bygges, grundet mangel på boliger.84 Det er altså blandt de største kommuner, at det er interessant at se hvor meget befolkningstallet er steget, og hvilken effekt det har haft på prisen på ejerlejligheder generelt set. Næsten 50 % af ejerlejligheder ligger som tidligere nævnt i og omkring København, så ved at tilføje de tre yderligere kommuner, som har næst-, tredje- og fjerde flest ejerlejligheder på landsplan, antages det at tallet for befolkningsvækst i de fire kommuner er brugbart til at sammenligne med prisen på ejerlejligheder for hele landet.

Der er desværre ikke data før 2008 for befolkningstilvækst pr. kommune, og der er derfor kun 51

observationer. Det er ikke optimalt, og det kan gøre regressionen mindre valid. Hvis denne udelades, kan der gøres brug af mere data for de øvrige variable, som der er ført statistik for længere tilbage i tid.

Prisen på ejerlejligheder vil kun stige som følge af befolkningsvækst, hvis udbuddet ikke kan følge med.85 Hvis der kommer flere mennesker, samtidig med flere boliger, bør de to ting udjævne hinanden.

Udfordringen på boligmarkedet generelt er, at manglende elasticitet gør, at priserne stiger.86 Det betyder med andre ord, at udbuddet ikke tilpasser sig efterspørgslen effektivt, og udbuddet halter ofte efter.

Dette er især et problem på lejlighedsmarkedet. De fleste ejerlejligheder ligger i storbyerne, og det er her udbuddet i særdeleshed ikke kan følge med.87 Udbuddet på boligmarkedet i OECD-landene er ofte begrænset grundet manglende plads og reguleringer88, og Danmark er ingen undtagelse. Førstnævnte er naturligt et større problem i storbyer, hvor der sjældent er meget plads at bygge på, og de tilbageværende

81 A Bird’s eye view of OECD Housing Markets, s. 22-3

82 Betting the House in Denmark, s. 8

83 Ibid.

84 https://www.boligsiden.dk/nyheder/2019/06/110-000-flere-boliger-i-de-store-byer-hvad-saa-med-boligmarkedet/, 28/3 15:00 & https://byensejendom.dk/article/boom-i-byggeri-af-ejerlejligheder-i-danmarks-4-storste-byer-33371, 28/3 15:00

85 A Bird’s eye view of OECD Housing Markets, s. 22-3

86 House Prices in Denmark, s. 3 & Fundamental Drivers of House Prices, s. 9

87 https://www.berlingske.dk/privatoekonomi/koebenhavn-mangler-45.000-boliger &

https://aarhus.lokalavisen.dk/aarhus_midt/2018-11-28/-Ekspert-Der-mangler-sm%C3%A5-billige-v%C3%A6relser-og- lejligheder-i-Aarhus-3618915.html

88 A Bird’s eye view of OECD Housing Markets, s. 25

(23)

23 grønne områder ofte er beskyttet af både politikere og lokale interessenter, som fx tilfældet med Amager Fælled.89 På trods af, at dette blev stemt igennem, viser det udfordringen i at bruge de mulige områder til ny bebyggelse, da det var en langvarig debat. Mange mulige områder er derudover fredede for bebyggelse.

Samtidig er der mange reguleringer, som reducerer det frie marked på ejerlejlighedsområdet, og som gør elasticiteten ringere. Blandt andet kan nævnes huslejeloven, som gælder for byggeri fra før 1991.90 Denne bestemmer den maksimale husleje der må tages for at udleje sin ejerlejlighed. Dette medfører, at priserne på ejerlejligheder bliver højere.91 Dette sker hovedsageligt fordi det reducerer incitamentet til at eje selv, at man kan få en særdeles billig husleje som lejer.92 Derudover forhindrer den også den naturlige

priselasticitet, fordi man bliver boende længere end man ellers ville, da det er svært at få en tilsvarende husleje i en ny lejlighed.93 Hvis folk ikke flytter fra mindre lejligheder, som de på et frit marked havde gjort, vil udbuddet dermed ikke tilpasses naturligt.

Disponibel indkomst

Opgaven vil også inkludere disponibel indkomst i regressionen. Disponibel indkomst er det beløb som en husstand har tilbage, når faste udgifter er betalt. Disponibel indkomst inkluderes, ligesom renten, i de fleste modeller for boligpriserne.94 Der er umiddelbart ikke forskel på boligmarkedet generelt og ejerlejligheder i dette tilfælde.

Disponibel indkomst er det beløb en husstand har til rådighed, og jo større dette beløb er, jo flere penge til at købe bolig for. Disponibel indkomst pr. borger er indkomst før skat tillagt lejeværdien af egen bolig (dvs.

hvad man skulle have betalt i husleje som lejer af en ens egen bolig), fratrukket skatter, renter og underholdsbidrag.95

Grunden til der vælges disponibel indkomst, og ikke blot indkomst er, at disponibel indkomst er renset for visse faste udgifter, fx renter på lån, som man ikke selv kan vælge at reducere. Hvad der bruges på fx mad kan en husstand selv ændre, men faste udgifter er ikke mulige at ændre. Hvis øvrige variable ændrer sig, fx renten, kan en husstand måske få råd til at købe noget dyrere fordi de faste omkostninger falder, men det

89 https://www.tv2lorry.dk/koebenhavn/trods-drama-og-stemmeflirt-i-11-time-flertal-vedtager-endeligt-byggeri-paa- laerkesletten-paa-amager-faelled

90 Betting the House in Denmark, s. 7

91 Fundamental drivers of House prices, s. 12 & https://dors.dk/oevrige-publikationer/kronikker-artikler/skaeve- boligmarked

92 Fundamental drivers of House prices, s. 12

93 https://dors.dk/oevrige-publikationer/kronikker-artikler/skaeve-boligmarked

94 A Bird’s eye view, s. 19 & Fundamental drivers of House Prices, s. 7 & House Prices in Denmark, s. 7 & Boligmarked i flere hastigheder, s. 50

95 https://www.statistikbanken.dk/INDKP101

(24)

24 er dermed som resultat af renten og ikke en ændring i den disponible indkomst i sig selv. Sidstnævnte vil kun ændre sig af egen kraft hvis indkomsten stiger, mens de faste udgifter forbliver de samme.

Hvis den gennemsnitlige disponible indkomst pr. borger stiger, vil det naturligt medføre højere priser på ejerlejligheder, ligesom forbrugsgoder og alt vil stige, som følge af den øgede efterspørgsel. Derfor er det også nødvendigt at rense denne for inflation, så man kan se den reelle effekt det har på ejerlejlighedspriser.

Det vurderes at netop ejerlejligheder vil være påvirket af stigning i disponibel indkomst pr. borger, også renset for inflation, da der er stor efterspørgsel generelt. Hvis indkomsten stiger vil det medføre mulighed for større bolig, eller en ejerlejlighed from en lejelejlighed, og det er sandsynligvis det mange husstande vil bruge de ekstra penge på, fremfor almindelige forbrugsgoder. Fx er det af opgaven vurderes som

usandsynligt at prisen i supermarkeder eller biografer stiger mere end inflationen som følge af det ekstra rådighedsbeløb, da dette nok kun i begrænset grad er her folk vil bruge ekstra penge, med mindre man allerede har den størrelse bolig og beliggenhed der ønskes. Hvis man allerede har den bolig der ønskes, er det også ofte blandt den ældre del af befolkningen, hvor den disponible indkomst nok i mindre grad stiger end blandt den yngre del.

Formue

En del artikler inkluderer også finansiel velstand som en isoleret variabel.96 Finansiel velstand, med et andet ord formue, vil sandsynligvis have en sammenhæng med disponibel indkomst, eftersom flere penge hver måned vil lægges til en opsparing/formue. Igen er multikollinearitet sandsynlig ved at inkludere både formue og disponibel indkomst, men opgavens fremgangsmåde med trinvis regression samt

korrelationsmatrixen, bør kunne ekskludere den mindst betydningsfulde af de to, hvis koefficienterne ikke ser troværdige ud. Dog er der her en udfordring i forbindelse med data. Der er ikke lavet formueopgørelser før 201497, og grundet den korte periode, kan det ikke lade sig gøre at inkludere variablen. Et fremtidigt studie bør dermed kunne fastslå, om formue har en effekt på ejerlejlighedspriserne, mens opgaven her vil nøjes med at inkludere disponibel indkomst.

En overvejelse gik på at inkludere formueindtægt i stedet for formue, da der er mere data for førstnævnte, og denne delvist fortæller om størrelsen på formuen. Af flere årsager gøres dette dog ikke: 1) det hænger delvist sammen med disponibel indkomst, eftersom det er et indkomsttal, 2) det er ofte blandt den ældre generation, at tallet er størst, da det er her fx pension er størst, og det er næppe den gruppe der har størst indvirkning på ejerlejlighedspriserne, 3) og til sidst inkluderer tallet ikke besparelser i form af lavere

96 House Prices in Denmark, s. 8 & Fundamental Drivers of House Prices, s. 16

97 Se tabeller, hvor data ikke er før 2014: https://www.statistikbanken.dk/10502

(25)

25 boligomkostninger hvis der er betalt af på gælden til huset, men kun afkast. Eftersom bolig er det største aktiv de fleste danskere har, og dermed hovedbestanddelen af en almindelig danskers formue, og denne ikke tæller med, giver tallet ikke mening at bruge som indikator for størrelsen på formue. Denne variabel udgår desværre derfor.

Det ses, at boligpriserne er ”(…) præget af meget stor cykliskhed med lange perioder, hvor priserne uafbrudt enten stiger eller falder.”98 Selvom argumentet i artiklen er psykologi og forventningen om

prisstigerne der driver prisstigninger99, kan velstand også have en effekt her. Jo mere priserne stiger, fx som følge af faldende renter, desto mere friværdi skabes der også hos boligejerne, som er velstand i sig selv.

Disse penge kan bruges på bolig, ligesom ekstra disponibel indkomst kan. Stigende boligpriser kan dermed drive boligpriserne, fordi der kommer flere penge til boligejerne. Dette vil naturligt stoppe på et tidspunkt, da de øvrige variable ikke vil fortsætte favorabelt for boligpriserne uden ende, men det kan forklare en latenstid mellem fx rentestigninger og boligpriserne.

Samme artikel påpeger korrelationen mellem ledighed og boligpriser. Sammenhængen ses tydeligt i

artiklen, men stigninger og fald i ledigheden skyldes i høj grad de samme faktorer som disponibel indkomst.

Da vi ser på disponibel indkomst pr. borger, vil denne naturligt falde i tider med stor ledighed, og stige i tider med lav ledighed. I dette tilfælde er der altså ikke blot en sammenhæng, men en kausal

sammenhæng, hvorfor ledighed ikke inkluderes i opgaven. I de situationer hvor der ikke er en direkte sammenhæng mellem de to, fx grundet højkonjunkturer hvor indkomsten stiger kraftigt, vil ledigheden også falde kraftigt. Da opgaven vurderer at ledighed og disponibel indkomst er tæt på to ens variable, når det kommer til effekten på prisen på ejerlejligheder, vil kun disponibel indkomst inkluderes.

Ændringen i disponibel indkomst påvirker i høj grad efterspørgslen. På den modsatte side er der også variable der påvirker udbuddet. En af dem er manglen på plads i de større byer, som kan gøre at udbuddet ikke kan imødekomme efterspørgslen. Dog vil denne ikke inkluderes, som nævnt tidligere, da det er svært at kvantificere de regler der er, og især de scenarier som i sidste ende baseres på den offentlige mening. I de tilfælde der ikke er nogle regler/reguleringer som umuliggør nyt byggeri, kan der ofte være modvilje fra både befolkning og politikere mod at bygge nyt, fordi det ødelægger grønne områder, eller fjerner udsigten fra eksisterende byggerier. Det er svært at vurdere hvilken effekt det har på boligpriserne.

98 Ledighed og ejerboligpriser, s. 5

99 Ledighed og ejerboligpriser, s. 5

(26)

26

Byggeomkostninger

En af de variable, som dog kan kvantificeres og som påvirker udbuddet, er byggeomkostninger af nybyggeri.100 Flere artikler nævner udbudssiden af priskurven til at have en afgørende effekt på

lejlighedspriserne, hovedsageligt fordi udbuddet ikke altid kan følge med efterspørgslen.101 Hvis prisen på nybyggeri er høj, er lejlighedspriserne også nødt til at være høje, da det ellers ikke vil kunne betale sig at bygge nyt. Hvis øvrige faktorer gør, at priserne er lave, vil det måske være mindre attraktivt at bygge nye byggerier, fordi det er længere tid om at tjene sig selv hjem. Dermed vil udbuddet forblive det samme, indtil efterspørgslen igen er høj nok til at drive priserne opad, hvorefter der igen vil bygges nyt. En del af omkostningerne er prisen for land, altså selve arealet der bygges på, og denne vil nok også være lav hvis boligpriserne er lave, men den øvrige del af prisen for nybyggeri, materialer, håndværkere etc., vil være den samme.

Det kan lyde som om, at prisen er den uafhængige variabel, mens udbuddet er den afhængige variabel, men det er nok kun i mindre grad tilfældet, end det omvendte. Prisen defineres af udbud og efterspørgsel, og i dette tilfælde er prisen på nybyggeri en del af udbuddet. Hvis prisen på nybyggeri er høj, må priserne på ejerlejligheder ligeledes være høje, før der bygges nyt. I et marked hvor efterspørgslen ofte er større end udbuddet, som det er på markedet for ejerlejligheder (eftersom det er koncentreret omkring større byer), vil der oftest være købere til nybyggeri. Det er derfor antaget, at prisen på nybyggeri vil definere prisen på de lejligheder der sælges, da det skal kunne betale sig, og derudover er efterspørgslen der oftest, uanset prisen (til en vis grænse). Udbuddet tilpasser sig efterspørgslen, og så længe efterspørgslen er der, vil der dermed være interesse i at bygge nyt. Hvis det er dyrt at bygge, er prisen på ejerlejlighederne høje, mens hvis det er billigt at bygge, vil prisen også være lav. Opgaven vil derfor, som den sidste variabel, inkludere byggeomkostninger i regressionen.

Der findes desværre ikke data for denne variabel fra før 2003, hvilket giver 71 observationer. Der er optimalt set data tilbage fra i hvert fald starten af 00’erne, så igen her vil der lægges særligt mærke til, om denne variabel giver mening at have med. Hvis den udelades, kan der bruges et større datasæt for de øvrige variable.

100 The Price responsiveness of Housing Supply in OECD Countries, s. 7

101 House Prices in Denmark, s. 2 & Fundamental drivers of house prices in advanced economies, s. 9

Referencer

RELATEREDE DOKUMENTER

Evaluator har imidlertid af- dækket brugertilfredsheden via telefoniske interview med tidligere beboere af Ca- re House (og Clean Home) og pårørende. • Fokusgruppeinterview

Accordingly, I have used the statistical theoretical methods for calculating beta equity and beta debt in Discounted Cash Flow (DCF) analysis and Weighted Average Cost of

Small-scale female producers of shea butter in Northern Ghana are likely to obtain fair prices for their products, as well as upgrading, by participating in global economic

The strong growth in Norwegian house prices raises therefore questions to whether the price increase can be explained by changes in the underlying fundamental factors,

Kapitalfonde skaber værdi ved at optimere de operationelle og finansielle value drivers. De er ikke i stand til direkte at påvirke de operationelle value drivers, da

35 PSE’s økonomiske situation gør det muligt for dem at opretholde deres position i dansk fodbold samt udvi- de og vedligehold af både Lalandia og FitnessDK..

Both the historical and current housing market in Oslo is examined to assess whether the house prices are supported by fundamental factors or if the

Similar differ- ences are found for the other labels and when we use other types of matching princi- ples; nearest-neighbour and Caliper (0,001), see Table 11 in Appendix B.3.