Achtergrond bachelor en

Vakkenpakket Data Science

Jaar 1

In het eerste jaar ontwikkel je een sterke wiskundige basis, waar je de rest van je studie op voortbouwt. Daarnaast maak je kennis met verschillende perspectieven op Data Science en doe je een eerste Data Challenge.

In het tweede blok volg je het vak Applied Physical Sciences óf Understanding the Information Society. Dit is afhankelijk van waar je je hebt inschreven. Is je hoofdinschrijving bij Tilburg University, dan volg je Understanding the Information Society. Is je hoofdinschrijving bij de TU/e, dan volg je Applied Physical Sciences. Dit is het enige inhoudelijke verschil dat voorkomt uit je inschrijving (overstappen van het ene naar het andere vak is mogelijk middels een onderbouwd verzoek aan de Examencommissie). Afgezien hiervan volgen alle studenten gezamenlijk dezelfde opleiding.

We lichten graag enkele vakken voor je uit, zodat je een beeld krijgt bij wat je kunt verwachten in het eerste jaar.

Data Statistics

Wiskunde is van groot belang voor de opleiding Data Science. Een van de vakken waarbij je dat direct tegenkomt, is Data Statistics. Daarnaast krijg je al in het eerste blok van het eerste jaar het vak Calculus. Later in de opleiding komt de wiskunde terug in vele andere vakken, zoals Data Engineering, Data Mining, Statistical Computing, Business Analytics, en natuurlijk de Data Challenges. Vandaar dat het belangrijk is dat je een goede basis in wiskunde hebt, al voor je aan de opleiding begint.

Beschrijvende en verklarende statistiek

In deze cursus leer je hoe je moderne statistieksoftware gebruikt om data te analyseren en er nuttige informatie uit te halen. In grote lijnen kent statistiek twee deelgebieden:

  • Beschrijvende statistiek, waarbij je de geobserveerde data samenvat en visualiseert. Dit deel van de statistiek is meestal niet het meest ingewikkeld, maar is wel essentieel in het rapporteren over (wetenschappelijke) data.
  • Verklarende statistiek, waarbij geprobeerd wordt om conclusies te trekken uit data die opgaan voor een deel of de gehele groep waarvan de data verzameld is.

Statistiek in de praktijk

Statistiek wordt veel gebruikt in de medische wereld. Bij het testen van medicatie verdelen onderzoekers de patiënten dan in twee groepen: de ene groep krijgt het nieuwe medicijn toegediend en de andere groep, ook wel de controlegroep genoemd, krijgt een nepmedicijn. Een specifieke vraag die dan bijvoorbeeld onderzocht wordt, is of het nieuwe medicijn beter is dan het nepmedicijn. Een andere vraag kan zijn of de twee behandelingen (klinisch) gelijk zijn, dus of de twee medicijnen gelijke resultaten boeken. Dan gaat het er niet om of het nieuwe medicijn beter is dan het oude, maar dat het goedkoper is, of sneller resultaat levert. In dat geval moet de nieuwe behandeling in ieder geval niet slechter zijn dan die van de controlegroep.

Deze vragen worden veelal vertaald naar statistische grootheden zoals het gemiddelde, de mediaan en de verhoudingen van de onderzoeksgroep. Met de uitkomsten daarvan proberen de onderzoekers antwoord te geven op de twee vragen en het beste medicijn voor patiënten te vinden.

Een tweede voorbeeld komt uit de productiewereld. Wanneer een productieproces in een fabriek wordt vervangen of verbeterd, zou dat bijvoorbeeld een consistentere kwaliteit of een snellere productie moeten opleveren. Statistische berekeningen op de data over het productieproces kunnen van groot belang zijn bij het nemen van de juiste beslissingen in het vervangen of verbeteren van de processen. De aanname, of hypothese, is dat het nieuwe proces beter is. De data-analyse kan die aanname bevestigen of ontkrachten en daarmee van invloed zijn op het besluit de verandering al dan niet door te zetten.

Afrondende opdracht

Als onderdeel van dit vak krijg je de opdracht om data te analyseren uit een film waarin een nationale ramp plaatsvindt. Als data scientist moet je de juiste conclusie trekken uit de data om beslissingen te nemen die over leven en dood gaan! Ga jij de uitdaging aan?

Data Ethics

Wat onze gezamenlijke bacheloropleiding uniek maakt, is dat we de technische expertise die je nodig hebt om met big data om te gaan, combineren met perspectieven vanuit recht, ethiek, economie, geesteswetenschappen en andere sociale wetenschapen. Als je een echte all-round data scientist wil worden, is een veelzijdig begrip van ethiek en recht cruciaal.

Als je tegenwoordig wordt opgeleid als data scientist kan je terechtkomen bij grote commerciële bedrijven, maar ook bij de overheid of andere non-profitorganisaties. Je kunt je vaardigheden toepassen op bedrijfsanalyses of op data over humanitaire rampen. Je kunt betrokken zijn in de journalistiek of in het openbaar bestuur, je kunt helpen bij het opzetten va n ‘smart urban environments’ of uitdagingen aangaan in uiteenlopende vakgebieden van kankeronderzoek tot de ruimtevaart. En zelfs als je exclusief voor een commercieel bedrijf komt te werken, kan het werk dat je als data scientist doet verstrekkende gevolgen hebben voor onze samenleving en ons collectieve welzijn.

De relatie tussen ethiek en data science

Het is daarom van groot belang te begrijpen hoe ethiek en data science zich tot elkaar verhouden. Het gaat daarbij zowel om het maken van doordachte beslissingen over welke data te gebruiken en welke onderzoeksmethodes toe te passen, als om het succesvol creëren van oplossingen voor echte problemen uit onze samenleving. Bijvoorbeeld, eerder hebben data scientisten per ongeluk applicaties ontwikkeld om misdaad te voorspellen, die zeer bevooroordeeld waren tegen etnische minderheden. Ook waren er data scientisten betrokken bij grootschalige surveillance op een manier die gevaarlijk is voor democratische processen, omdat ze een applicatie hadden ontwikkeld die middels gezichtsherkenning en biometrische systemen de neiging hadden om de armste en meest kwetsbare bevolkingsgroepen te discrimineren.

Net zoals bij studenten medicijnen de ethiek een basisonderdeel van hun opleiding uitmaakt, is het voor studenten data science noodzakelijk om te begrijpen wat de gevolgen zijn van hun werk op individuen en de samenleving.

Google en ethiek

Om één commercieel voorbeeld te geven, bij de zoekresultaten van Google blijken recentelijk berichten met ‘fake news’ prioriteit te krijgen. Dit zijn fictieve berichten, die misleidend zijn of een bevooroordeeld beeld geven, en die van invloed zijn op de gebruikers van Google bij het maken van geïnformeerde keuzes. Uit onderzoek blijkt nu dat het mogelijk is om het zoekalgoritme van Google zo te beïnvloeden dat het vertekende resultaten levert. Zo bleek ook dat een zoekopdracht naar ‘Heeft de holocaust plaatgevonden?’ een pagina genereerde die verwees naar websites die door zeer extremistische partijen werden onderhouden en waarop beweerd werd dat de holocaust niet had plaatsgevonden. In een ander zelflerend programma van Google zat een fout, omdat de fotoapplicatie zwarte mensen automatisch tagde als gorilla’s.

Big data weerspiegelen de vooroordelen van de massa

Om goed te kunnen werken als data scientist is het van essentieel belang een begrip te hebben van hoe het fout kan gaan. Grote datasets die bestaan uit de observaties of handelingen van grote groepen mensen, laten dus ook de vooroordelen van die groepen zien. Als we applicaties laten draaien op die datasets, zal de uitkomst daarvan een weerspiegeling van die vooroordelen in zich hebben. Hier is dus een sterk begrip van ethiek en recht nodig, om te voorkomen dat data science toepassingen ongelijkheid en onrecht in de hand werken.

Het vak Data Science Ethics

Bij het vak Data Science Ethics onderzoeken we elke ethische kaders er nodig zijn voor data scientisten bij de ontwikkeling van innovatieve, rendabele en nuttige applicaties. We vragen ons af wat het inhoudt om een verantwoordelijke data scientist te zijn aan de hand van recente praktijkcases waar bij data science waarden in het geding komen.

De nadruk in deze cursus ligt op multidisciplinariteit, verantwoordelijkheid naar stakeholders en op het creëren van sociale waarde. Behandelde onderwerpen kunnen zijn:

  • De gevolgen van het gebruik van persoonlijke data van individuen voor zowel startup als gevestigde organisaties.
  • Wat wel en niet kan in het gebruik van gehackte of gelekte dataHet recht en onrecht op het gebruik van gehackte en gelekte data.
  • Technieken om identificatie te verhullen en de kaders voor besluitvorming om dergelijke technieken te beperken.
  • Ethische en juridische uitdagingen rondom de ‘living laboratories’ in slimme stedelijke omgevingen en de gevolgen van de uitkomsten van dergelijke levende laboratoria voor individuen en op groepsniveau.
  • De uitdagingen van het reguleren van datagebruik conform onze maatschappelijke waarden.

Data Challenge

De Data Challenge komt als vak op verschillende momenten in je opleiding terug. Dat begint met een Challenge aan het einde van je eerste jaar. In het tweede jaar zitten twee Challenges en in het derde jaar nog eentje. Tot slot zal je afsluitende bachelorproject de grootste Challenge zijn waar je voor komt te staan bij deze opleiding Data Science.

Bij iedere Data Challenge wordt je uitgedaagd om de kennis die je hebt opgedaan in eerdere vakken te combineren en toe te passen. De theorie en toepassingen van vakken als Data Mining, Data Statistics en Data Science Ethics breng je in praktijk. Iedere Data Challenge bouwt voort op de vakken die je tot dan toe gehad hebt, dus iedere Challenge wordt uitdagender, omdat je verder gevorderd bent in je opleiding.

Een belangrijk onderdeel van de Data Challenge is dat je kunt omgaan met datasets die zijn opgeslagen in allerhande formats, zoals bestanden, relationele databases, object databases enzovoorts.

Echte klanten en echte data

Het doel van dit vak is om je te leren zelf analyses uit te voeren op grootschalige datasets. Daarbij lijkt de eerste Data Challenge bedrieglijk eenvoudig: je moet een aantal vragen van een ‘klant’ beantwoorden, gebruikmakend van een bestaande database. Dit is zo reëel mogelijk; we gaan aan de slag met echte data van een echte klant. De klant is een bedrijf of organisatie waar we vanuit de opleiding mee samenwerken. Deze wordt vertegenwoordigd door twee medewerkers, met allebei een eigen achtergrond en met eigen belangen. Je zal hen hem je uiteindelijke advies allebei moeten overtuigen.

Dit betekent dus dat je aan de slag gaat met echte problemen; hoe gaan we om met grote datasets? Hoe weet je of de data valide is? Hoe is de data verzameld? Wat is het werkelijke doel van de klant?

Na de Data Challenges

Na het doorlopen van de Data Challenges ben je in staat om:

  • zelfstandig gevestigde onderzoeksmethoden toe te passen en te volgen voor een voorgelegd probleem met bijbehorende dataset,
  • grote, complexe datasets beschikbaar te maken, te bewerken en ze te begrijpen, onafhankelijk van het format waarin ze zijn aangeleverd,
  • zelfstandig te zoeken naar en je bekend te maken met programmeertalen, bibliotheken, programma’s en software.


Blok 1

  • Calculus
  • Perspectives on Data Science
  • Programming

Totaal 15 ECTS

Blok 2

  • Applied Physicsal Sciences / Understanding the Information Society
  • Foundations of Computing
  • Data Statistics

Totaal 15 ECTS

Blok 3

  • Data Engineering    
  • Creative Thinking
  • Data Mining

Totaal 15 ECTS

Blok 4

  • Data Science Ethics
  • Data Challenge
  • Statistical Computing

Totaal 15 ECTS

Jaar 2

In het tweede jaar verdiep je je verder in de juridische, economische, wiskundige en technische aspecten van dataonderzoek. Je vult een deel van je pakket zelf in met keuzevakken en je past alle opgedane kennis en vaardigheden toe in twee Data Challenges.

Blok 1

  • Engineering Design
  • Law and Data Science
  • Elective

Totaal 15 ECTS

Blok 2

  • Data Science Research Methods
  • Data Challenge
  • Business Analytics

Totaal 15 ECTS

Blok 3

  • Process Mining
  • Data Challenge
  • Elective

Totaal 15 ECTS

Blok 4

  • Innovation and Regulation
  • Visualization
  • Elective

Totaal 15 ECTS

Jaar 3

In het derde jaar krijgt ondernemerschap een grotere rol met vakken als Start-ups en Business Insights. De keuzeruimte wordt nog groter, zodat je met behulp van keuzevakken de ideale aansluiting op de door jou gewenste master kunt vormgeven. Je sluit de opleiding af door het schrijven van een bachelorthesis.

Blok 1

  • Business Insights
  • Data Challenge
  • Elective

Totaal 15 ECTS

  • Cognitive Science
  • Start-ups
  • Elective

Totaal 15 ECTS


Blok 3

  • Elective
  • Elective
  • Elective

Totaal 15 ECTS

Blok 4

  • Final Bachelor Project
  • Elective

Totaal 15 ECTS

Alle bacheloropleidingen

Informatie voor scholen

Inschrijven en aanmelden

Contact