Speuren door terabytes aan data

Bij een huiszoeking neemt de politie steeds meer apparaten in beslag: van mobiele telefoons en laptops tot smart-tv’s en iPads. Dat zijn terabytes aan informatie, waar een technisch rechercheur handmatig onmogelijk doorheen komt. Software engineer Marja van Aken ontwerpt bij het Nederlands Forensisch Instituut (NFI) applicaties die data herkennen, interpreteren en doorzoekbaar maken. Zo helpt zij de recherche bij onderzoek naar digitale sporen.

Politiewerk ondersteunen

Marja: ‘Het onderzoeksgebied wordt steeds complexer, want fileformaten veranderen bij elke update en er komen fileformaten bij. Dat betekent dat onze applicaties nooit klaar zijn.’ Daarom ontwikkelde het NFI recent de domeinspecifieke taal Metal, waarmee Marja en haar collega’s de structuur van een fileformaat beter kunnen parsen en interpreteren. Dit levert een enorme tijdsbesparing op in onderhoud. Zo blijft er tijd over voor de ontwikkeling van nieuwe applicaties die het onderzoekswerk van de politie ondersteunen.

Benieuwd hoe Marja’s dag eruitziet tussen de bits en bytes? Bekijk de video.

FSE is Forensische Software Engineering. Het is een groep die zich bezig houdt met het maken van applicaties voor bijvoorbeeld de politie en de belastingdienst zodat zij hun onderzoek kunnen doen. Op grote schaal of op kleine schaal, afhankelijk van hun onderzoek. FSE houdt zich eigenlijk bezig met twee aspecten. Enerzijds natuurlijk het maken van de software die moet natuurlijk doen wat het moet doen. En aan de andere kant houden we ons ook bezig met;"Hoe maken we die software zo, dat het ook over zoveel tijd nog steeds goed bruikbaar is en goed onderhoudbaar is?”. En daarnaast hebben we nog het achterliggende doel om het werk van de politie zo makkelijk mogelijk te maken. Wanneer de politie een huiszoeking doet hebben ze eigenlijk heel veel data. En wat wij dan doen is dat we het mogelijk maken om al die verschillende apparaten tegelijkertijd te doorzoeken. Dat kan echt heel simpel zijn door te zeggen: "Geef mij alles met een bepaalde tekst erin" Maar dat kan ook heel specifiek als ze bijvoorbeeld weten: "Ik ben vooral geïnteresseerd in een bepaalde tijd range”.”Ik weet dat er iets toen is gebeurd”. Dat halen we allemaal uit die data en dat ze op die datums en alles kunnen zoeken. Een voorbeeld van een R&D project is "Metal" Dat is een domain specific language die wij maken. En die is eigenlijk gemaakt om het diepste wat we doen, dus met file-formaten en file-systemen twee concerns te splitsen. Enerzijds hebben we het parsen van data en anderzijds de interpretatie van data. We merken bij de ontwikkeling van het extracten van forensische data dat die twee concepten eigenlijk heel erg werden gecombineerd en dat maakte de code heel moeilijk leesbaar. Daarom hebben we daar een taal voor ontwikkeld die zich vooral specificeert op het parsen van data en daarna het ook makkelijker maakt om het vervolgens te interpreteren. Dat is een heel leuk project om in bezig te zijn omdat je dan ook echt met de diepste bits en bites betrokken bent. We hebben allemaal de zelfde motivatie. We willen gewoon Nederland net een stukje veiliger maken. Dat doet iedereen op z'n eigen manier. De één is gewoon heel goed in software schrijven en de ander doet het in het laboratorium maar gezamenlijk hebben we gewoon hetzelfde doel. Het zit allemaal in één gebouw Dat vindt ik juist heel erg prettig werken. In een omgeving waar het eigenlijk allemaal niet draait om geld zo is het helemaal niet. Je doet het echt samen. En je deelt ook echt je informatie met elkaar.

Down icon Links icon Rechts icon Up icon Facebook icon Instagram icon Linkedin icon Linkedin icon Magnet.me icon Menu icon Search icon