Overslaan en naar de inhoud gaan

Data Science: niet óf, maar wanneer!

Gepubliceerd op 15 maart 2018

Data science is een innovatieve manier om informatie in het sociaal domein te vergaren. Voor de meeste gemeenten is het nog een ver-van-mijn-bedshow. Maar niet voor Den Bosch.

Data science is een innovatieve manier om informatie in het sociaal domein te vergaren. Voor de meeste gemeenten is het nog een ver-van-mijn-bedshow. Maar niet voor Den Bosch.

“Het is niet de vraag óf gemeenten data science gaan gebruiken, maar wanneer. Vroeg of laat zal je iets met deze nieuwe benadering moeten doen.” Dat zegt Karin Akkers, hoofd van de afdeling Onderzoek en Statistiek van de gemeente ’s-Hertogenbosch.

Bij haar afdeling werken dertien mensen. Volgens Akkers is het bijzonder dat de gemeente zo’n groot team voor onderzoek in huis heeft. “We bedienen de hele gemeente en soms ook de regio. We doen erg veel onderzoek in het sociaal domein. Omdat wij weten wat de lokale context is, kunnen we maatwerk leveren.”

TIPS

  • Verdiep je in de mogelijkheden van data science voor het sociaal domein
  • Kijk naar de kwaliteit van administratieve data en hoe bruikbaar deze zijn voor beleidsdoelen
  • Zorg ervoor dat de onderzoeksvraag vanuit het sociaal domein zelf komt
  • Let erop dat er voldoende domeinkennis aanwezig is bij de toepassing van data science
  • Denk vooraf na over de resultaten die je wil bereiken en stuur het onderzoek hierop
  • Leer van de kennis en ervaringen van andere (semi-)overheden op het gebied van data science
  • Deel je kennis en ervaringen met andere gemeenten

Administratieve gegevens gebruiken voor beleid

In 2016 is een project georganiseerd om na te gaan of gegevens die voor administratieve doeleinden zijn verzameld, ook gebruikt kunnen worden voor beleidsdoeleinden. De vraag kwam van Weener XL, het werk-ontwikkelbedrijf van de gemeente ’s-Hertogenbosch. “Het was het eerste project met data science”, vertelt Akkers. “We wilden weten wat dit ons kan brengen. Omdat in mijn team hiervoor niet de vaardigheden aanwezig waren, hebben we het adviesbureau Ynformed ingeschakeld.”

Data scientist Ruben Peters van Ynformed heeft het onderzoek uitgevoerd. Peters omschrijft data science als een brede discipline. “Het is een combinatie van ICT, statistiek en wiskunde. Hierbij speelt ‘machine learning’ een grote rol, zeg maar lerende computermodellen. Data science bestaat uit twee onderdelen: verzamelen, opschonen en koppelen van grote aantallen gegevens én het uitvoeren van meer geavanceerde analyses. Je zoekt naar patronen en uitschieters. Enige domeinkennis is wel belangrijk, anders is het lastig om goede conclusies te trekken.”

Twee vragen over uitstroom centraal

Bij het project stonden twee vragen centraal: wat is de invloed van kenmerken van cliënten op uitstroom? En: wat is het verband tussen kenmerken van cliënten en voorzieningen die de gemeente voor uitstroom aanbiedt? Peters heeft gekeken naar zo’n negenduizend administratieve data van cliënten na 2011, die van Weener XL afkomstig waren. “Daaraan moest nog veel gebeuren. Zo waren zachte kenmerken vrij slecht ingevuld. Tachtig procent van mijn tijd is gaan zitten in het opschonen en koppelen van de data. Dat leverde een redelijk complete dataset op.” Akkers voegt eraan toe: “Ik durf de quote wel aan dat data verzameld voor administratieve doeleinden per definitie van slechte kwaliteit zijn voor hergebruik in data science projecten. Daarvoor zijn de data niet verzameld en dus moet je ze bewerken.”

Vervolgens nam Peters de informatie onder de loep. Hij gebruikte een aantal methoden, zoals de clusteranalyse en de survivalanalyse. Het doel van de clusteranalyse was om groepen cliënten te vinden die sterk op elkaar lijken. Daarmee kunnen doelgroepen voor communicatie en productontwikkeling worden bepaald. Met de survivalanalyse ging Peters de tijd tot uitstroom na bij verschillende doelgroepen en voorzieningen. Dit leverde een indicatie op van de effectiviteit van voorzieningen.

Herkenning én nieuwe inzichten

De analyse zorgde voor zowel herkenning als nieuwe inzichten. Peters geeft een voorbeeld. “Er was nog niet veel bekend over de invloed van het hebben van kinderen op de uitstroom. Die invloed bleek behoorlijk groot te zijn.” Met name vrouwen ervaren het hebben van kinderen als belemmering om te werken. Hij heeft een model gemaakt waarmee aan de hand van historische data de uitstroom van nieuwe cliënten voorspeld kan worden. “Deze tool maakt het mogelijk om beslissingen van consulenten te ondersteunen. Het model is nog niet definitief, maar wordt doorontwikkeld.”

Akkers toont zich tevreden over de resultaten van het project. “Wij hebben er erg veel van geleerd, vooral als het gaat om de technische kant. Maar ook inhoudelijk heeft het project het nodige opgeleverd. Zo sprong eruit dat alleenstaande mensen tot 27 jaar vrij snel aan een baan komen, mede door voorzieningen vanuit de gemeente. Op zich geen nieuw inzicht, maar het is wel voor het eerst zo duidelijk in onze gemeente bevestigd.”

Kennis met elkaar delen

Het enige minpuntje is volgens Karin Akkers dat de resultaten van het project niet direct toepasbaar zijn. “Wij zijn samen met Weener XL aan het kijken naar onderwerpen om nader te onderzoeken. Ook willen we het model verder ontwikkelen, zodat de uitvoering die kan gebruiken.”

Ruben Peters wijst erop dat het niet altijd eenvoudig is om de resultaten van het onderzoek te gebruiken. “Hier liggen een paar uitdagingen voor de gemeente. Het is bijvoorbeeld politiek en maatschappelijk amper te verkopen om sommige mensen niets aan te bieden, omdat een voorziening voor hen niet effectief zou zijn.”

Akkers raadt aan om eerst goed rond te vragen naar de ervaringen en kennis van andere gemeenten en semioverheidsorganisaties, alvorens zelf het data science-wiel uit te vinden. Het is belangrijk dat gemeenten kennis en ervaringen met elkaar delen, zegt ze. “Ik nodig iedereen uit om kennis bij ons te komen halen. Wij willen graag ons model aan andere gemeenten beschikbaar stellen. Dat helpt om te bewijzen wat wel en niet werkt. We zijn naar dit soort samenwerking op zoek.”