Selecteer een pagina

Mediaan betekenis

De mediaan is in de statistiek het middelste getal van een verdeling of dataset. Dit betekent dat de mediaan vaak wordt gebruikt als een centrummaat, waarmee de verdeling van gegevens inzichtelijk wordt gemaakt. De dataset kan zowel een volledige populatie als een steekproef omvatten.



Om de mediaan te bepalen, rangschik je alle waarden van klein naar groot. Bij een oneven aantal gegevens is de mediaan de middelste waarde. Bij een even aantal is het het gemiddelde van de twee middelste waarden. De mediaan verdeelt de dataset in twee gelijke helften: 50% van de waarden ligt erboven en 50% eronder.

Wanneer kies je voor de mediaan?

De mediaan is vooral nuttig als centrummaat bij datasets die niet normaal verdeeld zijn. Dit betekent dat de data scheef verdeeld kan zijn of dat er uitschieters (extreem hoge of lage waarden) in voorkomen. In deze situaties geeft de mediaan vaak een beter beeld van het centrale punt dan het gemiddelde, omdat deze minder gevoelig is voor extreme waarden.



betekenis mediaan

Gebruik van de mediaan bij scheve verdelingen

Bij een rechtsscheve verdeling liggen de meeste waarden relatief laag, terwijl er een lange staart naar rechts is met enkele hoge uitschieters. Een klassiek voorbeeld hiervan is de inkomensverdeling: een paar mensen verdienen extreem veel, terwijl de meeste mensen een bescheidener salaris hebben. Als je hier het gemiddelde zou berekenen, wordt het kunstmatig verhoogd door de extreme waarden, waardoor het geen realistisch beeld geeft van het ’typische’ inkomen. Bij een linksscheve verdeling is het tegenovergestelde het geval: de meeste waarden liggen relatief hoog, terwijl er enkele lage uitschieters zijn. Dit kan bijvoorbeeld voorkomen bij de leeftijd waarop mensen met pensioen gaan. De meeste mensen gaan rond een bepaalde leeftijd met pensioen, maar er zijn enkele uitzonderingen die veel eerder stoppen, bijvoorbeeld door medische redenen. In deze gevallen biedt de mediaan een betere weergave van de centrale tendens. Omdat de mediaan minder wordt beïnvloed door uitschieters, wordt deze vaak gekozen als een betrouwbaardere maat voor het midden van de data in plaats van het rekenkundig gemiddelde.



Aspect Beschrijving Voorbeeld
Definitie De mediaan is de middelste waarde in een geordende reeks getallen. Als het aantal waarden even is, is de mediaan het gemiddelde van de twee middelste waarden. N.v.t.
Toepassing Wordt vaak gebruikt in statistiek en economie om de centrale tendens van een dataset te bepalen zonder beïnvloed te worden door extreme waarden. Inkomen, woningprijzen
Verschil met gemiddelde Het gemiddelde wordt berekend door alle waarden op te tellen en te delen door het aantal waarden. De mediaan is de middelste waarde en wordt niet beïnvloed door uitschieters. Bij inkomensstatistieken kan het gemiddelde worden vertekend door extreem hoge salarissen, terwijl de mediaan een representatiever beeld geeft.
Berekening (oneven aantal) Rangschik de waarden van klein naar groot en neem de middelste waarde. Dataset: 3, 5, 7, 9, 11 → Mediaan = 7
Berekening (even aantal) Rangschik de waarden van klein naar groot en neem het gemiddelde van de twee middelste waarden. Dataset: 2, 4, 6, 8 → Mediaan = (4+6)/2 = 5



Mediaan berekenen bij een oneven aantal getallen

Wanneer een dataset uit een oneven aantal waarden bestaat, is er altijd één getal dat precies in het midden ligt. Dit getal wordt de mediaan genoemd.

Stappenplan

Laten we een voorbeeld nemen met de volgende getallen: 350, 800, 220, 500 en 130. Stap 1: sorteer de getallen in oplopende volgorde130, 220, 350, 500, 800. Stap 2: bepaal de positie van de mediaan. De mediaan bevindt zich op de positie die wordt berekend met de formule: waarbij het totale aantal getallen in de dataset is.


Toegepast op ons voorbeeld:

Stap 3: Bepaal de mediaan. Het getal op de derde positie in de gesorteerde reeks is 350. Dit is de mediaan van deze dataset.

Mediaan berekenen bij een even aantal getallen

Bij een dataset met een even aantal waarden is er geen exact middenpunt. In plaats daarvan neem je het gemiddelde van de twee middelste getallen.

Stappenplan

Neem de volgende dataset als voorbeeld: 350, 800, 220, 500, 130 en 1150. Stap 1: sorteer de getallen in oplopende volgorde130, 220, 350, 500, 800, 1150. Stap 2: bepaal de middelste positiesOmdat er zes getallen zijn, bevinden de middelste waarden zich op de posities die berekend worden met de formules:

Toegepast op dit voorbeeld:

Dit betekent dat de derde en vierde waarden de middelste getallen zijn: 350 en 500. Stap 3: Bereken de mediaan. Nu we de twee middelste getallen hebben bepaald, nemen we het gemiddelde van deze waarden om de mediaan te vinden. De mediaan van deze dataset is dus 425.

Mediaan berekenen bij ordinale data

De mediaan wordt meestal gebruikt bij numerieke data, maar soms moet je deze ook bepalen bij ordinale data – oftewel categorieën met een rangorde. Dit komt bijvoorbeeld voor bij beoordelingen, klanttevredenheidsscores of taalniveaus.

Stappenplan

Neem als voorbeeld een dataset waarin taalvaardigheid wordt gemeten met de volgende niveaus:

  • Beginner;
  • Gemiddeld;
  • Gevorderd.

Omdat de waarden al een vaste volgorde hebben, is de mediaan eenvoudig te bepalen. Maar wat als er meer categorieën zijn? Stel dat we een dataset hebben met zeven beoordelingen van reactietijden:

  • Erg langzaam;
  • Langzaam;
  • Gemiddeld;
  • Een beetje snel;
  • Behoorlijk snel;
  • Sneller dan gemiddeld;
  • Ontzettend snel.

Stap 1: Bepaal de positie van de mediaanOmdat er 7 waarden zijn, pas je dezelfde formule toe:

Toegepast op deze dataset:

Stap 2: Bepaal de mediaanDe waarde op de vierde positie is “een beetje snel”. Bij ordinale data is het belangrijk dat de categorieën een logische volgorde hebben, anders heeft de mediaan geen betekenis.


Conclusie

De mediaan is een handige statistische maat die het midden van een dataset aangeeft, ongeacht of de data numeriek of ordinaal is. Bij een oneven aantal waarden is de mediaan het middelste getal. Bij een even aantal waarden is de mediaan het gemiddelde van de twee middelste getallen. Bij ordinale data is de mediaan de categorie die in het midden van de gesorteerde lijst valt. Omdat de mediaan niet beïnvloed wordt door extreme waarden, wordt deze vaak gebruikt als alternatief voor het gemiddelde bij scheve verdelingen of datasets met uitschieters.