Vejen til frie Floating Car Data
P e l l e R o s e n b e c k G ø e g
V i d e n s k a b e l i g A s s i s t e n t v e d Tr a f i k f o r s k n i n g s g r u p p e n , A A U
Agenda
Forudsætninger Resultaterne Metoden
Anonymiseringen
Afrunding
Forudsætninger
GDPR
ITSplatform Nord, 3 årigt projekt 2012-14 ~450 biler, 389 inkluderet i dette paper
Backend server Ombord enhed Applikationer:
Kørselslog
Automatisk betaling for parkering Trafikinformationer
Trafikstatistik til vejmyndigheder
Agenda
Forudsætninger for dette arbejde Resultaterne
Metoden
Anonymiseringen
Afrunding
Resultater
Resultater
Agenda
Forudsætninger for dette arbejde Resultaterne
Metoden
Opsamling af data Anonymiseringen
Afrunding
Opsamling af data
ITSplatform Nord, 3 årigt projekt 2012-14
Indsamling af data via en enhed ombord ~ 450 biler
Lagret i en central Postgres/Postgisdatabase
Tilfældige punkter
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
1. Turene laves til ”linestrings zm”, hvor punkt_id gemmes som Z og M er tidsstempel
2. Udtræk endepunkter af turene.
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
4. Klip turene (1.1) med bufferne (5)
5. Fjern de fra klippede punkter fra datasættet.
6. Fjern attributer til indentificering af OBU
1. GPS punkters gruppering
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
2. Udtræk endepunkter af turene.
1. Samles i klynger af afstande ≤ 50m
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
4. Klip turene (1.1) med bufferne (5)
5. Fjern de fra klippede punkter fra datasættet.
6. Fjern attributer til indentificering af OBU
2. Udtræk endepunkter
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
2. Udtræk endepunkter af turene.
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
1. Findes der ikke 50 adresser inden for 800meter, bruges r=2000
2. En tilfældig adresse i (4) bruges som centrum for en ny buffer, med radius fra buffer (4) plus max afstanden fra adressen til bufferen (4)
3. Endepunkterne tilføres nu informationen om deres klynge.
4. Klip turene (1.1) med bufferne (5)
5. Fjern de fra klippede punkter fra datasættet.
6. Fjern attributer til indentificering af OBU
Én klynges minimums omkreds ved AAU
Nyt centrum for buffer ved AAU
Ture ved AAU
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
2. Udtræk endepunkter af turene.
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
4. Klip turene (1.1) med bufferne (5)
1. Fjern de fraklippede punkter fra datasættet.
5. Fjern attributer til indentificering af OBU
4. Klippede ture
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
2. Udtræk endepunkter af turene.
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
4. Klip turene (1.1) med bufferne (5)
5. Fjern attributter til identificering af OBU
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
2. Udtræk endepunkter af turene.
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
4. Klip turene (1.1) med bufferne (5)
5. Fjern attributter til identificering af OBU
1. Reset tidstempel
5. Attributter fjernet
Original data point_id
box_id group_id
Geometry (epsg: 32632) timestamp (YYYY-MM-DD HH:MM.SS)
speed direction
accelerometer
Anonymised point_id
trip_id
geometry (epsg: 32632) timestamp (YYYY-MM-DD HH:MM.SS)
speed direction
5. Reset tidstempel
Tidstemplet modificeres ud fra følgende
1. Turens tid resettes til at starte fra minut 0 i første time af perioden:
1. Myldretid:
1. 7-9 2. 14-17
2. Mellem
1. 9-14
3. Aften
1. 17-22
4. Nat (Freeflow periode)
1. 22-7
2. Dato flyttes til først kommende dag i måneden, opdelt i hverdag og weekend
Algoritmen
1. GPS punkter med under 2 minutters afstand tilknyttes samme tur.
1. Turene laves til ”linestrings zm”, hvor Z er punkt_id og M er tidsstempel 2. Udtræk endepunkter af turene.
1. Samles i klynger af afstande ≤ 50m
3. Klyngernes minimumcirkelomkreds øges pr 10 meter indtil ≥ 50 hustande (adresser) findes.
1. Findes der ikke 50 adresser inden for 800meter, bruges r=2000
2. En tilfældig adresse i (4) bruges som centrum for en ny buffer, med radius fra buffer (4) plus max afstanden fra adressen til bufferen (4)
3. Endepunkterne tilføres nu informationen om deres klynge.
4. Klip turene (1.1) med bufferne (5)
5. Fjern de fra klippede punkter fra datasættet.
6. Fjern attributer til indentificering af OBU
Agenda
Forudsætninger for dette arbejde Resultaterne
Metoden
Indsamling af data Anonymiseringen
Afrunding
Resultater
Openstreetmap sammenligning
Column1 Før Fjernet Efter Beholdt %
motorway 100.405.851 760.985 99.644.866 99,24
trunk 8.623.743 63.105 8.560.638 99,26
primary 38.171.343 1.181.298 36.990.045 96,90
secondary 123.684.443 15.169.195 108.515.248 87,73
tertiary 13.327 6.197 7.130 53,50
residential 21.041 15.297 5.744 27,30
service 2.006 1.027 979 48,80
track 7 0 7 100
unclassified 298.300.404 122.729.895 175.570.509 58,86