Data Engineer Chelsea Disseldorp legt uit waarom alle voetballers tegenwoordig een bh dragen

Voor velen zijn het de spannendste weken van het jaar: het EK. Honderden voetballers strijden voor hun land, en dat doen zij met hart en ziel, net zoals voor hun clubs thuis. Wat velen misschien niet zo een, twee, drie beseffen, is dat het hart tegenwoordig, net zoals heel veel andere waarden van het topvoetballerslijf, volledig wordt doorgemeten. Hier wordt heel veel waardevolle data uit gegenereerd. Hoewel waardevol? Die data wordt pas echt goud wanneer mensen zoals Chelsea Disseldorp er met hun kennis en vaardigheden mee aan de slag gaan. Na jaren ervaring in Business Development en Data & Analytics opdrachten in de sportsector, maakte Chelsea de overstap naar Feyenoord als (Senior) Data-analist. Vervolgens richtte ze Chelsea Data Consultancy op, waarmee ze voor meerdere Eredivisieclubs en voetbaldataproviders werkt.

Kun je in het kort vertellen hoe je in dit vakgebied bent terechtgekomen?

Chelsea Disseldorp: Mijn eerste introductie met het vakgebied was in 2018 door Paul Adriani. Ik werkte destijds bij KPMG en Paul organiseerde een Sports Analytics Conference en was de lead van de Sports Analytics Propositie. Ik kreeg de kans om te helpen bij de organisatie van de conferentie en om daarna gezamenlijk de propositie verder vorm te geven. Na een paar jaren Business Development werkzaamheden en verschillende datagerelateerde opdrachten in de sportsector heb ik de transfer gemaakt naar ‘de andere kant’ en ben ik bij Feyenoord gaan werken als (Senior) Data-analist. Na een kleine 3 jaar bij Feyenoord gewerkt te hebben, heb ik Chelsea Data Consultancy opgericht, waarmee ik o.a. voor meerdere Eredivisieclubs en voetbaldataproviders werkzaamheden heb uitgevoerd.

Welke rol speelt IT binnen jouw vakgebied?

Chelsea Disseldorp: Net als in andere sectoren speelt IT een steeds grotere rol in de sportsector. Dat geldt niet alleen voor Data & Analytics, maar ook voor privacy (de AVG i.r.t. data van sporters), security, systeemimplementaties (o.a. Athlete Management Systems (AMS) en hardware (o.a. camera’s).

Met hoeveel en welke collega’s werk je samen om de data-analyse te realiseren? Wat zijn hun specifieke rollen?

Chelsea Disseldorp: De grootte van het datateam hangt af van de grootte van de organisatie/club. Ik heb eerder nagenoeg in mijn eentje alles omtrent Data & Analytics opgepakt binnen de gehele organisatie, maar ook gewerkt in een team met 5 tot 10 andere dataspecialisten. De rollen in de grotere datateams zijn vaak Data-analist/BI Specialist, Data Engineer, Data Scientist en eventueel nog een Business Analist en/of Product Owner. Een data-team kan ook onderdeel zijn van een (grote) IT-afdeling, waar o.a. de volgende rollen ook ingevuld kunnen zijn: IT Architect, Developer, Applicatie-/Functioneel beheerder, DevOps Engineer, Tester, Informatiemanager en CIO. Er zijn ook nog voetbalspecifieke rollen, waarbij data een rol speelt: Data Scout/Recruitment Analyst, Opponent Analyst, Match Analyst en Set Pieces Analyst.

Welke specifieke data wordt gemeten bij de spelers? Is deze data voor alle spelers hetzelfde, of zijn er verschillen per positie of individu?

Chelsea Disseldorp: Twee hoofdcategorieën qua data zijn fysieke tracking data en tactische event data. Fysieke tracking data wordt verzameld m.b.v. camera’s en wearables in de bustehouders (bh) en omvat o.a. hartslag, snelheid, sprintmeters en acceleraties. Event data beschrijft de acties die (met de bal) worden uitgevoerd, zoals passes, dribbels, tackles en onderscheppingen. Daarnaast wordt nog meer data verzameld zoals medische data (blessures), testresultaten en financiële data (marktwaardes). De data wordt voor alle spelers verzameld, maar de daadwerkelijke data verschilt uiteraard tussen spelers. Voor een keeper zijn er bijvoorbeeld andere metrics bij de event data.

Hoe wordt de verzamelde data opgeslagen en hoe wordt deze beveiligd?

Chelsea Disseldorp: Afhankelijk van de structuur en grootte van de data kan data opgeslagen worden in een database, Data Lake of Lakehouse. Voor kleinere en gestructureerde datasets voldoet een database, voor ongestructureerde data is een Data Lake geschikter en een Lakehouse is een combinatie van beide.

De opslaglocatie kan fysiek (on premise) zijn of in de cloud. Voor de beveiliging spelen authenticatie en autorisatie een rol. Authenticatie betreft de eerste stap en daarbij wordt gekeken wie de gebruiker is d.m.v. multi-factor authenticatie (MFA). Autorisatie is de tweede stap en daarbij wordt de daadwerkelijke toegang tot data verzorgd. Daarbij kan gewerkt worden met rechten en rollen, denk daarbij aan zogenaamde Row Level Security (RLS), waarbij wordt ingesteld dat een trainer alleen data van spelers uit het team waar hij trainer van is, mag zien.

Wat vind jij persoonlijk de meest waardevolle of interessante ‘datapoints’? Kun je daar wat meer over vertellen?

Chelsea Disseldorp: Er zijn heel veel interessante datapunten, maar het wordt het meest interessant als er verscheidene bronnen worden gecombineerd om tot een compleet overzicht te komen (voor bijvoorbeeld een spelerrapport), zoals wedstrijddata, performance/testdata, scoutingrapporten en marktwaardes.

Persoonlijk vind ik xT (Expected Threat) ook een interessante. xG (Expected Goal) kennen de meeste voetbalkijkers waarschijnlijk inmiddels wel, aangezien dat een metric is die tegenwoordig bijna gemeengoed is en ook tijdens live-uitzendingen getoond wordt. Met xT kan de algehele dreiging van een team aangegeven worden en wordt duidelijk welke speler (in)direct het meeste gevaar creëert. Het betreft de verandering in de waarschijnlijkheid dat er gescoord gaat worden in een volgend aantal acties. Het aantal is arbitrair, maar moet niet te klein en niet te groot zijn, bijvoorbeeld 5, 8 of 10. De xT wordt berekend door te kijken naar de waarschijnlijkheid in de zone waar de speler met bal begint en dat te vergelijken met de waarschijnlijkheid in de zone waarin de bal eindigt na een pass of dribbel.

Zijn er concrete resultaten of verbeteringen in de prestaties van een team die direct toe te schrijven zijn aan de data-analyse? Of dient de data-analyse voornamelijk ter ondersteuning?

Chelsea Disseldorp: Over het algemeen is data niet de enige bron die leidt tot een bepaald resultaat. Om scouting als voorbeeld te nemen. Daarbij heb je data-scouting, video-scouting en live scouting, die in die volgorde plaatsvinden. Door het gebruik van data is het mogelijk om een veel grotere lijst aan spelers in kaart te brengen. Het is namelijk niet mogelijk om duizenden spelers live te bekijken of van al die spelers uren aan videobeelden te bekijken. Het is wel mogelijk om van die duizenden spelers data te verzamelen. M.b.v. data kan zo een eerste selectie worden gemaakt (een long list of short list), die verder terug wordt gebracht door het bekijken van videobeelden. Voordat een speler daadwerkelijk wordt gescout is deze ook live (meerdere keren) bekeken. Een gescoute speler kan bijdragen aan een verbetering in de prestatie van een team, evenals een goede tegenstander-analyse, waarbij data ook een rol speelt.

Je bent Data Engineer maar ook Data-analist. Wat is het verschil?

Chelsea Disseldorp: Kortgezegd zorgt een Data Engineer ervoor dat een Data-analist aan het werk kan. De Data Engineer verzorgt de data pipelines waarbij de data wordt ontsloten en getransformeerd naar een formaat/structuur waar de Data-analist mee kan werken. De Data-analist analyseert en visualiseert de data, waarbij waardevolle inzichten worden gepresenteerd die gebruikt worden bij het nemen van beslissingen. Door mijn ervaring met end-to-end werkzaamheden (van bron tot dashboard) kan ik zowel als Data Engineer en als Data-analist werken, of de werkzaamheden combineren.

Welke tips zou je geven aan IT-professionals die een carrière als voetbal engineer ambiëren? Welke stappen kunnen zij het beste volgen om in dit vakgebied succesvol te worden?

Chelsea Disseldorp: Het is een competitieve wereld waar veel mensen in willen werken. Allereerst is het belangrijk dat je goed bent in je vakgebied en daarin een verschil maakt t.o.v. veel van je ‘concurrenten’. Daarnaast kan het je ook een voorsprong geven als je kennis hebt van de voetbal(data)terminologie en (data)systemen die gebruikt worden. Passie en doorzettingsvermogen zijn ook belangrijk. Door het beperkte aanbod van rollen (wat overigens wel steeds meer wordt) is de kans groot dat er eerst vele afwijzingen/teleurstellingen volgen. Het is ook goed om je kennis en netwerk omtrent Football Analytics te vergroten door het bekijken van webinars, lezen van artikelen en bezoeken van conferenties.

Profdesk © 2024 | gerealiseerd door De Digitale Marketing Specialist | Privacybeleid