Campus Tilburg University hoogleraren

Promotie S. Yuan

Datum: Tijd: 13:30 Locatie: Aula

Novel Clustering Methods For Complex Cluster Structures In Behavioral Sciences

  • Locatie: Cobbenhagen building, Aula
  • Promotor: prof. dr. J.K. Vermunt
  • Copromotores: dr. K. Van Deun, dr. K. De Roover

Wij bieden voor onze ceremonies nog steeds een livestream aan. 

Livestream

Publiekssamenvatting

Grootschalige datasets met een groot aantal variabelen komen steeds meer beschikbaar in gedragsonderzoek. Ze omvatten een breed scala aan metingen en indicatoren en bieden gedragswetenschappers ongekende mogelijkheden om verschillende stukken informatie te samenvoegen, zodat nieuwe - en soms subtiele - subgroepen (ook wel clusters genoemd) van populaties kunnen worden geïdentificeerd. De succesvolle detectie van clusters is van groot praktisch belang voor een breed scala van sociale en gedragswetenschappelijke onderzoeksonderwerpen. Bij de behandeling van depressieve patiënten bijvoorbeeld is de eerste stap in het genereren van gepersonaliseerde aanbevelingen het nauwkeurig koppelen van de patiënten aan de vele subtypes van depressie. In de organisatiecontext is het niet erg aannemelijk dat alle leiders dezelfde ontwikkelingspaden volgen. In feite is het afstemmen van trainingsprogramma's op de unieke sterke punten van verschillende subgroepen altijd effectiever dan algemene ontwikkelingsprogramma's. Denk aan de bescheiden, nuchtere leiders versus de overdreven charismatische leiders. Ook wanneer men probeert het cognitieve proces te begrijpen dat ten grondslag ligt aan iemands stemgedrag, zal een one-size-fits-all benadering waarschijnlijk verkeerde beschrijvingen opleveren. De brede sociale context en de omgeving waarin iemand opgroeit levert waarschijnlijk clusters van kiezers op. Alleen degenen die tot hetzelfde cluster behoren delen een vergelijkbaar besluitvormingsproces voor het stemmen. 

Om gedragswetenschappers het beste gereedschap te bieden voor het nauwkeurig terugvinden van de clusters die verborgen zitten in grote, complexe datasets, werden in dit proefschrift nieuwe statistische modellen en rekenhulpmiddelen ontwikkeld en geïmplementeerd in publiek toegankelijke software. In het algemeen gaan de hier ontwikkelde nieuwe methoden verder dan eerdere benaderingen door de volgende drie grote uitdagingen aan te gaan. Ten eerste, aangezien ruis alomtegenwoordig is in psychologische metingen, kan een aanzienlijk aantal verzamelde variabelen volledig irrelevant zijn voor de verborgen clusters. Deze irrelevante variabelen moeten tijdens de gegevensanalyse volledig en automatisch worden uitgefilterd. Ten tweede is het bij de integratie van variabelen uit verschillende gegevensbronnen (bijvoorbeeld vragenlijsten en genetische informatie, GPS-coördinaten, voetafdrukken van sociale media, enz.) wenselijk om zowel de unieke kenmerken van elke gegevensbron als de gedeelde of samenhangende kenmerken van de vele gegevensbronnen vast te leggen. Ten derde, bij het vertalen van de resultaten van gegevensanalyse in inhoudelijke conclusies om cruciale beslissingen te onderbouwen (bv. medische beslissingen, personeelsselectie, enz.) is doeltreffende en nauwkeurige communicatie van vitaal belang, maar niet altijd gemakkelijk te realiseren. De twee belangrijkste moeilijkheden zijn het communiceren van het vertrouwen en de (on)zekerheid in de teruggevonden clusters en het visualiseren van de resultaten via zeer toegankelijke grafieken. 

Met een verscheidenheid aan computersimulaties en empirische gedragsgegevens over onderwerpen in de klinische, sociale, persoonlijkheids- en organisatiepsychologie, konden wij concluderen dat de verschillende in het proefschrift ontwikkelde methoden veelzijdiger, effectiever en nauwkeuriger zijn in het identificeren van subtiele clusters in complexe datasets, rijke en unieke inzichten bieden in het interpreteren van deze clusters, en dankzij de ontwikkeling van veel software gemakkelijk toegankelijk zijn zonder veel technische belemmeringen. Deze methoden zijn daarom nuttig voor gedragsonderzoekers om te navigeren in een steeds meer gedigitaliseerde wereld en om structuren te herkennen uit massale informatie.