In 2014 stelde het Regionaal Archief Tilburg haar
genealogische data beschikbaar als open data. Doordat iedereen deze data vrijelijk mag gebruiken, hoopt het archief dat er nieuwe toepassingen voor de data worden gevonden. Een van deze toepassingen is, mijns inziens, wetenschappelijk onderzoek. Mede omdat de data tot stand is gekomen door vele vrijwilligers, lijkt het me goed te vertellen wat ik juist door deze data kon doen.
Laat ik mezelf eerst eens introduceren: ik ben Willem R. J. Vermeulen, een derdejaars bachelorstudent informatica aan de Universiteit van Amsterdam. Tijdens mijn scriptieperiode heb ik onder begeleiding van dr. Rick Quax onderzoek gedaan naar migratie in de regio Tilburg en Rotterdam tussen 1815 en 1900. Zelf vind ik namelijk niet alleen computers, maar ook alles wat met geschiedenis te maken heeft fantastisch, wat heeft geleid tot deze scriptie in wat men noemt 'Computational History'.
In dit onderzoek heb ik gebruik gemaakt van de genealogische open data uit het werkgebied van het Regionaal Archief Tilburg en Stadsarchief Rotterdam, gelimiteerd tot de akten tussen 1815 en 1900. Deze data heb ik vervolgens gecombineerd tot een grote stamboom van 1.6 miljoen personen. Deze personen staan natuurlijk niet als uniek persoon aangeduid in de akten, maar worden door mijn algoritmen als uniek gezien op basis van de eigen namen en de combinatie van deze naam met de namen van beide ouders. Deze combinaties kon ik eenvoudiger maken, doordat de data in een formaat wordt aangeboden dat makkelijk te 'lezen' is door computers, bij de originele afbeeldingen is dat eigenlijk nu nog onmogelijk.
Door voor elk van deze personen een reeks levensgebeurtenissen (geboorte, geboorte broers / zussen, huwelijk, geboorte kinderen, etc.) samen te stellen, kunnen migratiebewegingen worden waargenomen: de akteplaats verandert namelijk. Voornamelijk in het midden van de onderzochte periode kunnen we dan kijken naar de migratiegegevens, daarbuiten missen er documenten die anders wel gekoppeld hadden kunnen worden in de stamboom en dan ook migratiegevens hadden opgeleverd. Momenteel hebben we al het een en ander gevonden, zo lijken er bijvoorbeeld meer mannen dan vrouwen te zijn die migreren, maar ook lijkt het belang van de stad Rotterdam voor de regio toe te nemen. Een aantal van de bevindingen zullen we uiteindelijk ook publiceren.
Dit alles betekent overigens niet dat het onderzoek afgerond is: ik wil uit nog meer gebieden en over een nog grotere tijdspanne (alle data na 1815) genealogische data tot een stamboom combineren. Voor heel Nederland? Misschien, ooit, als de laatste paar gebieden ook eindelijk hun data zullen vrijgeven. Maar meer dan dat hoop ik dat deze nieuwe manier van 'kwantitatief' historisch onderzoek nieuw licht kan bieden op bepaalde zaken en eventueel bestaand 'kwalitatief' onderzoek aan kan vullen. Door open data.
Naschrift
Als archiefdienst zijn we blij dat er meer met het werk van onze vrijwilligers en onze meewerkers wordt gedaan zoals hiervoor door Willem beschreven. Natuurlijk bedienen we graag onze stamboom onderzoekende gebruikers! Maar die prachtige dataset kan nog zoveel meer, hele andersoortige onderzoeksvragen beantwoorden.
Hopelijk bieden dit onderzoek en deze blogpost inspiratie voor andere onderzoekers.
Voor geïnteresseerden is het
abstract van deze scriptie online in te zien.
De bachelorscriptie "
Domestic migration in the Tilburg region and Rotterdam between 1815 and 1900: a data-driven analysis" is opgenomen in onze bibliotheek en kan in de studiezaal geraadpleegd worden.