Students Tilburg University

SPSS: Z-scores

De meest bekende statistische manier van standaardiseren is het berekenen van z-scores. Een z-score wordt berekend aan de hand van de ruwe score (x) op een variabele van een onderzoekseenheid en het gemiddelde (xgem) en de standaarddeviatie (s) (van alle onderzoekseenheden) op die variabele.

z = x-xgem / s

Dit kan dan ook alleen met variabelen van minimaal interval-niveau (zie meetniveaus). Een z-score is het aantal standaarddeviaties dat een score van het gemiddelde af ligt. Hiermee verwijder je absolute verschillen tussen onderzoekseenheden (of groepen onderzoekseenheden) en hou je alleen relatieve verschillen over. Wanneer je een 6 haalt voor een tentamen is dat absoluut gezien maar net voldoende. Hebben de andere studenten voor hetzelfde tentamen een vijf of lager gehaald, dan is de 6 een relatief hoge score bij vergelijking. Dit is uit te drukken door middel van een z-score.

Uitvoering

Je kunt een z-score door SPSS laten berekenen door middel van <Analyze>, <Descriptive Statistics>, <Descriptives>, selecteer de variabelen en klik op het vakje "Save standardized values as variables". Je krijgt nu output met beschrijvende maten (gemiddelde en dergelijke), maar SPSS heeft ook nieuwe variabelen aangemaakt met de z-scores per persoon. SPSS geeft deze variabelen automatisch een naam, beginnend met de letter "z" en in principe gevolgd door de eerste 7 tekens van de originele variabele. Bijvoorbeeld "zlft" is de variabele met de z-scores van de originele variabele "lft".

In een enkel geval leidt deze vorm van naamgeving tot identieke namen, bijvoorbeeld bij "item0001" en "item0002". Beide z-scores zouden de naam zitem000 krijgen. SPSS gaat dan over op een andere naamgeving: de z-score van item0001 wordt zsc001 en de z-score van item00002 wordt zsc002, enz.. SPSS kent ook automatisch variable labels toe aan deze variabelen, namelijk: "zscore(var)label" gevolgd door de eerste 31 tekens van de beschrijving van de originele variabele. De variabele "lft" die als label "leeftijd" heeft, krijgt het label "zscore(lft)leeftijd". Je kunt eventueel zelf de namen en labels van de z-scores veranderen.

De nieuwe variabele met de z-scores heeft altijd een rekenkundig gemiddelde van 0 en een standaarddeviatie van 1. Z-scores van verschillende variabelen zijn dan ook direct met elkaar vergelijkbaar.