Werken met rijke datasets

Drukte in de binnenstad. Op de snelwegen. In de trein. Hoe deze problemen zo effectief mogelijk aan te pakken als we straks weer terugkeren naar normaal? Marko Roos, senior onderzoeker bij het Centraal Bureau voor de Statistiek (CBS), vertelt hoe data hierbij nieuwe inzichten kan opleveren voor beleidsmakers. Het CBS verdiept zich in de forensenmobiliteit en zoekt daarin de samenwerking met onder andere Rijkswaterstaat.

Behoefte aan data

‘Bijna dagelijks worden overheden geconfronteerd met mobiliteitsvraagstukken. Veel van de oplossingen gaan over het stimuleren van het gebruiken van Park and Ride of het meer inzetten van huurfietsen. Maar dan moet je wel weten wáár die fietspaden moeten komen, of wat een slimme plek is voor die Park and Ride. Vergeet niet: dat zijn belangrijke besluiten waar veel geld mee gemoeid is. Om betere beleidsbeslissingen te kunnen nemen, is er vanuit beleidsmakers steeds meer behoefte aan gedetailleerde data’, vertelt Marko.

Werken met rijke datasets

Een algemene schets van bewegingen van forensen biedt hiervoor onvoldoende grip. Want, stelt hij, hoe meer data, des te scherper het beeld van de situatie én de mogelijke oplossingen. Op het gebied van de forensenmobiliteit onderzoekt hij of dat beeld scherper kan. Marko is als dataspecialist blij dat hij bij het CBS werkt. De organisatie mag als enige organisatie in Nederland, bij wet geregeld,  allerlei bijzondere databronnen gebruiken en combineren voor het maken van officiële statistieken. Van officiële overheidsadministraties, zoals bedrijvenregisters, bevolkingsregister, loon- en pensioengegevens, tot kentekenregistraties. Dat levert bijzondere en rijke datasets op.

Privacy essentieel

‘Als het gaat om forensenmobiliteit dan kun je databronnen gebruiken waarin je bewegingen van personen kan schatten. Denk aan databronnen waarin geregistreerd staat bij welke bedrijven personen werken. Die kunnen helpen meer zicht te krijgen op de vraag hoeveel mensen zich verplaatsen van A naar B. Het fijne is dat deze data bij het CBS voor handen is. Dat gebeurt natuurlijk wel op een zo veilig mogelijk manier: de privacy van personen wordt áltijd gewaarborgd. Alle persoonskenmerken worden direct aan de voorkant verwijderen. Vervolgens verwerken we data van personen per groep. Ook maken we met de beheerder van de databron afspraken over hoe we op een zorgvuldige manier deze groepen kunnen maken. En vlak voor publicatie doen we ook nog eens een extra strenge check om onthulling te voorkomen.’

Hoe groot is de overlast

Hoe je op basis van nieuwe datasets met relevante informatie kan komen die echt kan bijdragen aan datagedreven werken: in die vraag zet Marko graag zijn tanden. ‘Een voorbeeld. Stel dat er op een belangrijke verkeersader bouwwerkzaamheden gepland staan. De overheid wil graag weten wie daar last van gaan krijgen. En wie dus geholpen moeten worden met andere verkeersoplossingen’, vertelt Marko. ‘We kunnen op basis van data dus schatten wat de proportie woon-werkverkeer is en uit welke gemeentes dit verkeer komt. Het liefst willen we dit tot op het niveau van een woonwijk kunnen belichten. Daarvoor proberen we technieken te ontwikkelen, zodat we op grote schaal berekeningen kunnen uitvoeren voor alle mogelijke routes.’

Grote aantallen routes berekenen

Bij het CBS staat niet alleen het werken met enorme hoeveelheden data centraal. Ook de medewerkers daarin faciliteren is een prioriteit. ‘Vaak hebben we te maken met ontzettend veel combinaties van data. De huidige software kan dat soms nauwelijks verwerken. Daarom zijn we nu bezig met het bedenken van een open source gebaseerde schaalbare oplossing, voor het berekenen van grote aantallen routes. Daar hebben we slimme mensen voor nodig.’

Check, check, double check

Na de berekening volgt de toetsing ervan. ‘Deze stap is heel interessant, maar ook lastig’, vertelt hij enthousiast. ‘We kunnen big data bronnen gebruiken om te controleren of de berekening klopt. Met OV-chipdata, data van camera’s of mobiele telefoons willen we gaan toetsen of de administratieve databronnen zinvol gebruikt kunnen worden voor bijvoorbeeld het in beeld brengen van forensenmobiliteit. Daarin sturen we ook op samenwerking met andere partijen, zoals Rijkswaterstaat.'

Haarscherp beeld

Uiteindelijk wil je in staat zijn een haarscherp beeld te presenteren over forensenmobiliteit. Dat bijvoorbeeld blijkt dat een groot deel van het verkeer op de A4 uit het centrum van een Den Haag komt. En dat bij wegwerkzaamheden op de snelweg het verkeer in de stad alvast op een andere route kan worden gewezen. Marko: ‘Door het combineren van zoveel mogelijk databronnen schets je een beeld dat zoveel mogelijk klopt met de werkelijkheid. Ik word heel enthousiast als ik zoveel mogelijk alle puzzelstukjes mag verbinden om uiteindelijk die magnifieke puzzel helemaal te kunnen leggen. En dan te zien dat het bijdraagt aan nieuw mobiliteitsbeleid.’

Down icon Links icon Rechts icon Up icon Facebook icon Instagram icon Linkedin icon Linkedin icon Magnet.me icon Menu icon Search icon