Persoonlijk contact
Flexibele oplossingen
5 sterren op Google
Data-analyse is een belangrijk onderdeel van onderzoek dat ons helpt om inzichten te verkrijgen in grote hoeveelheden informatie. In dit artikel worden de meest gebruikte data-analyses toegelicht.
De dataverzamelingsperiode is voorbij en je hebt je data opgeschoond. Voordat je de data kunt rapporteren, ga je wellicht nog enkele data-analyses doen.
Met een data-analyse analyseer je letterlijke de data die je hebt verzameld. Dit kan bijvoorbeeld het samenvatten zijn van alle gegeven antwoorden in tabellen, het berekenen van een gemiddelde op een bepaalde vraag, of een volledige regressie-analyse. Het doel van de data-analyse is dat de data overzichtelijker wordt en daarmee idealiter tot inzichten leidt.
Hoe je data-analyse eruit ziet, hangt af van het type onderzoek dat je doet. Voor een kwantitatief onderzoek ziet de data-analyse er anders uit dan voor kwalitatief onderzoek.
Met kwantitatief onderzoek verzamel en analyseer je numerieke data. Afhankelijk van het type vraag dat je stelt maar ook het doel waarmee je deze vraag hebt gesteld, kun je verschillende analyses toepassen. Hieronder noemen we vijf veelvoorkomende analyses.
Als voorbeeld nemen we telkens de volgende, fictieve, dataset met één vraag:
1. Frequentieverdeling
Met een frequentieverdeling toon je letterlijke de frequentie, oftewel hoeveelheid, dat een antwoord voorkomt. Dit kun je tonen in een tabel en/of in een grafiek. In bovenstaand voorbeeld zou je kunnen tonen dat iedere antwoordoptie 1x is gekozen. Als je ook een kolom met de percentages toevoegt, is ieder antwoord door 20% (1 van de 5) van de respondenten gekozen.
2. Gemiddelde
Het gemiddelde geeft aan wat het ‘gemiddelde’ antwoord is. Dit kun je alleen berekenen op het moment dat je over een ‘interval schaal’ of ‘ratio schaal’ beschikt: dat wil zeggen, je data bestaat uit numerieke waarden die te ordenen zijn van laag naar hoog (waarbij een ‘ratio schaal’ over een absoluut nulpunt beschikt, bijvoorbeeld leeftijd).
In het geval van bovenstaande fictieve dataset is het dus nog nodig dat we de antwoorden omzetten naar cijfers: ‘Heel ontevreden’ krijgt het cijfer 1, ‘Een beetje ontevreden’ een 2, etc. Het gemiddelde bereken je vervolgens door alle getallen op te tellen en te delen door het aantal antwoorden. In bovenstaand voorbeeld dus: (5+3+1+2+4) / 5 antwoorden = 15/5 = 3.
3. Mediaan
Codeer je data met minimaal twee personen, die dit onafhankelijk van elkaar doen. Zodra beide personen klaar zijn gaan deze met elkaar in gesprek om te kijken waar overlap zit en waar verschillen zitten, en waarom die verschillen er dan zijn.
We raden aan om nooit alleen naar het gemiddelde te kijken, maar altijd ook de frequentieverdeling of de mediaan mee te nemen.
De mediaan is de waarde die zich precies in het midden van je reeks aan antwoorden bevindt, op het moment dat je deze opvolgorde van klein naar groot zou zetten.
Als we dit doen voor de dataset uit het voorbeeld wordt dit dus: 1, 2, 3, 4, 5. De mediaan is het middelste getal, in dit geval een 3. Wanneer je twee middelste getallen zou hebben, dan bereken je de mediaan door deze twee getallen op te tellen en door 2 te delen.
Soms zijn de mediaan en het gemiddelde hetzelfde, maar soms kunnen deze ook verschillen. Door ze allebei te berekenen krijg je inzicht in hoe ‘scheef’ je data is: een gemiddelde kan enorm beïnvloed worden door een extreme ‘uitschieter’ aan de boven- of onderkant, terwijl de mediaan hier geen invloed van zal ondervinden.
4. Modus
De modus is de waarde die het vaakst voorkomt. In het geval van bovenstaand voorbeeld komt ieder getal even vaak voor en is er dus meer dan één modus. Stel dat de dataset ‘1, 2, 2, 3, 4, 5’ zou zijn, dan zou de modus ‘2’ zijn.
5. Standaarddeviatie of standaardafwijking
Dit is de gemiddelde hoeveelheid ‘variabiliteit’ in je dataset. Dit zegt iets over hoe ver iedere score gemiddeld genomen van het gemiddelde verwijderd is. Des te groter de standaarddeviatie, des te groter de spreiding in je dataset is. Programma’s als Excel en SPSS kunnen de standaarddeviatie eenvoudig voor je berekenen.
Bij kwalitatief onderzoek heb je te maken met niet-numerieke (en ook niet numeriek te maken) data. Dit kan zijn omdat je een diepte-interview hebt gehouden, of bijvoorbeeld omdat je een open vraag hebt gesteld in je online vragenlijst.
Gezamenlijk komen ze tot één lijst. Op die manier creëer je een minder subjectieve lijst. Zodra je het coderen hebt afgerond, ga je de labels (of codes) categoriseren.
Soms is het niet nodig om kwalitatief onderzoek te analyseren. Het kan voldoende zijn om enkel een lijst met antwoorden te tonen. Op die manier zorg je ervoor dat de lezer altijd een volledig beeld krijgt van de resultaten en daar zelf uit kan halen wat voor hem of haar belangrijk is.
Desondanks bestaat er regelmatig de behoefte om een hele lijst aan tekstuele antwoorden overzichtelijker te tonen. De methode om dit te doen is door de antwoorden te coderen, en vervolgens te categoriseren.
Coderen
Coderen betekent dat je de open antwoorden een ‘label’ geeft, een bepaalde code dus. Eén open antwoord kan meerdere labels krijgen, bijvoorbeeld wanneer het antwoord over meerdere onderwerpen gaat. Coderen wordt vaak in twee stappen gedaan:
Tip: Codeer je data met minimaal twee personen, die dit onafhankelijk van elkaar doen. Zodra beide personen klaar zijn gaan deze met elkaar in gesprek om te kijken waar overlap zit en waar verschillen zitten, en waarom die verschillen er dan zijn. Gezamenlijk komen ze tot één lijst. Op die manier creëer je een minder subjectieve lijst. Zodra je het coderen hebt afgerond, ga je de labels (of codes) categoriseren.
Categoriseren houdt in feite in dat je een frequentieverdeling (zie ook de uitleg hierover eerder in dit artikel) maakt van hoe vaak codes voorkomen. In een tabel kun je bijvoorbeeld tonen hoe vaak labels voorkomen, waarmee je een goed beeld schept van wat er in de open antwoorden wordt gezegd. Je hebt hiermee dus eigenlijk je kwalitatieve data alsnog een soort van kwantitatief gemaakt!
Ben je op zoek naar een krachtige en eenvoudige onderzoekstool voor jouw onderzoek? Of wil je jouw onderzoek graag (deels) laten uitvoeren door specialisten? Wij helpen je graag!