Zoek termen en concepten in onze toolbox

De wondere wereld van de statistiek heeft soms ook z'n eigen taalgebruik. Woorden die een specifieke definitie hebben, zodat iedereen weet wat ze betekenen. We leggen ons woordenboek hier nog even uit in deze toolbox, zodat je meer inzicht krijgt in hoe je zelf ook die woorden kan gebruiken en interpreteren.

Modus, mediaan en gemiddelde zijn zogenaamde positionele parameters die een idee geven van de grootteorde van een reeks waarnemingen. Ze geven geen idee van de spreiding van de waarnemingen.

Daarvoor moeten spreidingsparameters, zoals de amplitude, worden gebruikt.

De amplitude is het verschil tussen de kleinste en de grootste waargenomen waarde. De amplitude toont hoe uitgebreid de waarde van de waargenomen reeks is.

Hoe groter de amplitude, hoe verder de waargenomen waarden uit elkaar liggen. Hoe kleiner de amplitude, hoe dichter de waargenomen waarden bij elkaar liggen.

Laten we 2 klassen van elk 14 leerlingen nemen. Leerlingen kregen voor een taak een cijfer op 10.

Dit zijn de resultaten van de twee klassen:

De punten van klas nr. 2 zijn dus veel meer gespreid dan de punten van klas nr. 1.

De cumulatieve frequentie is de som van alle frequenties tot een bepaalde waarde van de gegevensreeks in kwestie. 

Om een cumulatieve frequentie te berekenen, moet de statistische reeks geordend zijn, d.w.z. de waarnemingen moeten in oplopende volgorde gerangschikt zijn.

De absolute frequenties kunnen worden opgeteld, net als de relatieve frequenties. 

We nemen een kijkje naar de cijfers op 10 van een toets die werd afgenomen bij 24 leerlingen in een klas, in de vorm van een frequentieverdeling.

Punten op 10012
3
4
5
6
7
8
9
10
Totaal
Aantal leerlingen die dit resultaat behaald hebben
1
2
1
0
1
2
5
5
4
2
1
24


In deze tabel zijn de cijfers van de leerlingen al in oplopende volgorde gerangschikt.

Het aantal leerlingen met een cijfer van 5/10 of lager is 1+2+1+0+1+2=7
Het aantal leerlingen met een cijfer boven de 5/10 is gelijk aan
5+5+4+2+1=17

Als je meer wilt weten over cumulatieve frequenties, kun je dat nalezen in het thema 'Bevolking'.

Gegevens zijn essentieel voor elke statistische studie.

Een statisticus verzamelt de gegevens die nodig zijn om de gestelde vraag te beantwoorden.

Voorbeelden

  • Hoeveel tijd besteden kinderen van jouw leeftijd aan televisie kijken?

  • Wat is de leeftijd van de Belgische bevolking?

  • Welke van twee verschillende aardappelsoorten heeft de hoogste opbrengst?

  • Hoe groot zijn de oren van Afrikaanse olifanten?

Waar komen de gegevens vandaan?

Er bestaan verschillende gegevensbronnen:

  • experimentele gegevens: deze gegevens worden verkregen door wetenschappers die experimentele plannen opstellen om een hele reeks hypotheses te testen over bijvoorbeeld de doeltreffendheid van een medicijn of de resistentie van bepaalde plantenvariëteiten tegen ziekten, enz

  • administratieve gegevens: dat zijn gegevens die door een andere overheid of administratie zijn verzameld. Deze gegevens bestaan al. Het is dus niet nodig om burgers of bedrijven opnieuw om informatie te vragen. Dat bespaart tijd en geld en voorkomt vooral dat mensen onnodig worden lastiggevallen.

  • enquêtegegevens: als de gegevens niet beschikbaar zijn, is er geen andere keuze dan ze via enquêtes te verzamelen. Een enquête is een formulier met vragen, waar mensen worden gevraagd om op te antwoorden. Wist je dat Statbel een van de enige instanties in België is die verplichte enquêtes mag opleggen aan burgers, bedrijven en organisaties?

Om je een paar voorbeelden te geven: de statistieken die worden voorgesteld in de thema's bevolking, bevolkingstrends en nationaliteiten zijn gebaseerd op gegevens uit het nationale register, dat uit administratieve gegevens bestaat. Landbouwstatistieken zijn gedeeltelijk gebaseerd op enquêtegegevens.

Als de variabelen evenredig zijn en je kent 3 waarden, dan kan je de regel van 3 gebruiken om de 4e waarde te vinden.

9 ananassen kosten €36. Hoeveel kosten 11 ananassen?

Om dit probleem op te lossen, zoek je eerst de prijs van 1 ananas en vermenigvuldig je vervolgens die prijs met 11.

    • €36 : 9 = €4 voor 1 ananas
    • €4 x 11 = €44 voor 11 ananassen

11 ananassen kosten dus €44.

Evenredigheid is een begrip dat betrekking heeft op variabelen die met elkaar verbonden zijn door eenzelfde getal.


Als we de waarden van de ene variabele vermenigvuldigen met een getal dat niet nul is, en we bekomen de waarden van de andere variabele, dan zeggen we dat deze variabelen evenredig zijn.

Het getal waarmee de waarde van de eerste variabele moet worden vermenigvuldigd om de waarde van de tweede variabele te vinden, wordt de evenredigheidsfactor genoemd.
Evenredigheidscoëfficiënt


Evenredige variabelen kunnen worden weergegeven in een evenredigheidstabel.

Aantal verbruikte liters benzine2,54610
Aantal gereden kilometers5080120200

Zijn het aantal verbruikte liters benzine en het aantal gereden kilometers twee evenredige variabelen? Met andere woorden: met welk getal zou je de eerste regel van de tabel moeten vermenigvuldigen om de tweede regel te vinden?

*20Aantal verbruikte liters benzine2,54610
Aantal gereden kilometers5080120200


20 is de evenredigheidsfactor. Dat getal vertegenwoordigt het aantal kilometers dat per liter benzine wordt afgelegd. De twee variabelen zijn dus evenredig.

Je zal merken dat:

2,5 * 1,5 = 4In een evenredigheidstabel kunnen de waarden in de ene kolom vermenigvuldigd worden met een getal om de waarden in een andere kolom te vinden
50 * 1,5 = 80
2,5 * 4 = 10
50 * 4 = 200
4 + 6 = 10In een evenredigheidstabel kunnen de waarden van 2 kolommen samengeteld worden met een getal om de waarden in een andere kolom te vinden
80 + 120 = 200


Het aantal of de absolute frequentie is het aantal keren dat een waarde wordt waargenomen in een statistische reeks.

Het totale aantal is het totale aantal waarnemingen.

Dit zijn de cijfers op 10 van een toets die werd afgenomen bij 24 leerlingen in een klas, voorgesteld in de vorm van een frequentieverdeling..

Punten op 10012345678910
Aantal leerlingen die dit resultaat behaald hebben12101255421
  • 2 leerlingen behaalden een cijfer van 1/10 2 is het aantal of de absolute frequentie van het cijfer 1/10 
  • 4 leerlingen behaalden een cijfer van 8/10 4 is het aantal of de absolute frequentie van het cijfer 8/10 
  • Het aantal of de absolute frequentie van het cijfer 4/10 is 1. 

Het totale aantal kan worden verkregen door de aantallen van alle waarnemingen bij elkaar op te tellen (samenvoegen): 

1+2+1+0+1+2+5+5+4+2+1=24 

24 staat voor het totale aantal waarnemingen: dat is ook het aantal leerlingen in de klas.

Het (rekenkundig) gemiddelde is een positionele parameter die kan worden gebruikt om de informatie in een soms zeer grote verzameling gegevens samen te vatten.

Om het gemiddelde te berekenen, moeten alle waarnemingen bij elkaar worden opgeteld en wordt het totaal gedeeld door het aantal waarnemingen.

Gemiddelde

Bijvoorbeeld:

Jules ontving 5 muffins, Alice ontving er 3, Samuel ontving er 1, Yana ontving er 10 en Lucile ontving er 6.

Gemiddelde muffin grafiek 1

.Laten we alle muffins optellen.

Gemiddelde muffin grafiek 2

Er zijn in totaal 25 muffins.
Laten we vervolgens de muffins gelijk verdelen over elk kind.

Gemiddelde muffin grafiek 3

Elk kind krijgt 5 muffins. Het gemiddelde is dus 5 muffins.

Het gemiddelde kan geïnterpreteerd worden als het aantal muffins dat elk kind zou krijgen als alle muffins gelijk verdeeld zouden worden over de kinderen.


Als je meer wilt weten, bespreken we het gemiddelde in de thema’s 'Bevolking’ en ‘Landbouw’.

Een grafiek is een visuele weergave van gegevens.

Een grafiek moet volgende gegevens bevatten:

  • een titel, zodat je weet welke informatie het bevat
  • een legende om je wegwijs te maken
  • gegevens
  • de bron van de gegevens

Grafieken zijn er in verschillende vormen: curven, staafdiagrammen, histogrammen, taartdiagrammen, ... .

Sommige grafieken hebben assen. Deze grafieken tonen de relatie aan tussen een afhankelijke en een onafhankelijke variabele. 

De horizontale as wordt de x-as genoemd. Die heeft betrekking op de onafhankelijke variabele (vaak x genoemd). 

De verticale as wordt de y-as genoemd en heeft betrekking op de afhankelijke variabele (vaak y genoemd). 

Een staafdiagram wordt gebruikt om waarnemingen weer te geven volgens hun frequentie. Hoe hoger het staafje, hoe groter de frequentie van de waarneming.

De curven laten over het algemeen een evolutie zien.

Een taartdiagram toont het aandeel van verschillende elementen in een totaal.

Om een taartdiagram in een staafdiagram om te vormen, moet je de totale frequentie kennen. Dat wil zeggen: het totale aantal waarnemingen. Het is daarbij voldoende om elk percentage toe te passen op dit totaal om de frequentie van elk item te kennen.

Grafieken vind je terug in elk thema.

Het gemiddelde en de mediaan zijn beiden positionele parameters.

Een positionele parameter geeft een typische waarde aan waarrond de waarnemingen zijn verdeeld.

Die typische waarde is een soort samenvatting van de hele reeks waarnemingen.

Als je het gemiddelde en de mediaan van een reeks waarnemingen berekent, bereken je dus 2 typische waarden van je reeks, die soms erg van elkaar kunnen verschillen.

Hoe kies je welke waarde het meest zinvol is?

Stel je dit eens voor. We gaan het deze keer over fruit hebben, 14 kersen en een watermeloen. De kersen zijn licht en wegen slechts 10 gram per stuk. De watermeloen daarentegen is enorm en weegt 5 kilo, oftewel 5.000 gram!

Nu willen we berekenen hoeveel elk stuk fruit gemiddeld weegt. Om dat te doen, tellen we het gewicht van alle kersen en de watermeloen bij elkaar op en delen die som vervolgens door het totale aantal stukken fruit, 15.

(14x10) +5000
          15

Nadat we de berekening hebben gemaakt, blijkt dat het gemiddelde 333,33 gram per vrucht is, wat ongeveer 0,33 kilo is. Maar dat is veel te zwaar voor een kers, zelfs voor een grote!

Laten we nu proberen de mediaan te berekenen, het mediane gewicht van ons fruit: 10, 10, 10, 10, 10, ... 5.000, met een mediaan van 10 gram. Veel representatiever voor onze verzameling fruit, niet?

Gemiddelde of mediaan

Dit voorbeeld laat zien dat als je reeks waarnemingen enkele heel grote waarden bevat of net enkele heel kleine waarden, het gemiddelde van je reeks berekenen niet noodzakelijkerwijs zinvol is. Het is daarom beter om de mediaan te gebruiken als de 'typische' waarde voor je reeks.


De kenmerken die van belang zijn in een statistische studie worden variabelen genoemd. Variabel omdat de waarde van deze kenmerken in de studie van individu tot individu kan variëren.

Sommige variabelen kunnen worden uitgedrukt:

  • door een getal: lengte, gewicht, salaris,... Dat zijn kwantitatieve variabelen
  • door eigenschappen: oogkleur, geslacht, ... Dat zijn kwalitatieve variabelen

De variabelen die je tegenkomt als je de thema’s van Statbel Junior overloopt, zijn kwantitatieve variabelen.

De mediaan is een positionele parameter die kan worden gebruikt om de informatie in een soms heel grote verzameling gegevens samen te vatten.

De mediaan is een al dan niet waargenomen waarde die de statistische reeks in twee verdeelt, zodat de helft van de waargenomen waarden lager is en de andere helft van de waargenomen waarden hoger is.

De mediaan is de centrale waarde van de reeks waarnemingen.

Om de mediaan te bepalen, moet de reeks waarnemingen eerst in oplopende volgorde worden gerangschikt.

Stel je voor dat we geïnteresseerd zijn in de lengte van de leerlingen van een klas, gemeten in cm.

Dit zijn de geregistreerde lengtes voor de 15 leerlingen in de klas.
Yana 135 cm, Alice 130 cm, Jules 132 cm, Samuel 150 cm, Fabio 133 cm, Lucile 138 cm, Emma 129 cm, Louis 133 cm, Ilan 134 cm, Selena 128 cm, Adriano 136 cm, Aisha 133 cm, Sofiane 135 cm, Aaron 140 cm en Noémie 139 cm.

Als eerste stap ordenen we reeks waarnemingen van klein naar groot. Dus vragen we de leerlingen om zichzelf te rangschikken in volgorde van toenemende grootte. Dit is wat we dan krijgen:

Selena128 cm
Emma129 cm
Alice130 cm
Jules132 cm
Emilie133 cm
Fabio133 cm
Louis133 cm
Ilan134 cm
Paul135 cm
Michèle135 cm
Nicolas136 cm
Lucile138 cm
Noémie139 cm
Patrick140 cm
Samuel150 cm

Vervolgens moet je het midden van de reeks vinden.

Selena128 cm













7 waarnemingen zijn kleiner dan 134 cm
Emma129 cm
Alice130 cm
Jules132 cm
Emilie133 cm
Fabio133 cm
Louis133 cm
Ilan134 cm134 cm is de waarde die de reeks in 2 knipt, 134 cm is de mediaan
Paul135 cm7 waarnemingen zijn groter dan 134 cm

Michèle135 cm
Nicolas136 cm
Lucile138 cm
Noémie139 cm
Patrick140 cm
Samuel150 cm
  • Als het aantal waarnemingen oneven is, is de mediaan een waargenomen waarde van de statistische reeks.
  • Als het aantal waarnemingen even is, is de mediaan geen waargenomen waarde in de statistische reeks.

Laten we ons voorstellen dat Fabio van school is veranderd. Dit betekent dat er nu nog maar 14 leerlingen in de klas zitten. De reeks geordende waarnemingen kan als volgt worden weergegeven:

Selena128 cm













7 waarnemingen zijn kleiner dan 134,5 cm
Emma129 cm
Alice130 cm
Jules132 cm
Emilie133 cm
Louis133 cm
Ilan134 cm
134,5 cm is de waarde die de reeks in 2 knipt, 134,5 cm is de mediaan
Paul135 cm7 waarnemingen zijn groter dan 134,5 cm

Michèle135 cm
Nicolas136 cm
Lucile138 cm
Noémie139 cm
Patrick140 cm
Samuel150 cm

In dat geval is de mediaan geen waargenomen waarde in de statistische reeks.

Als je meer wilt weten, bespreken we de mediaan in het thema 'Bevolking'.

De modus is de waarneming met het hoogste aantal (of frequentie).

Het is het gegeven dat het vaakst voorkomt of het vaakst wordt waargenomen. 

De modus is een positieparameter.

Dit is de frequentieverdeling van de leeftijden van de spelers in een voetbalploeg.

LeeftijdAantal spelers
191
20
1
21
1
23
1
24
2
25
3
26
1
28
2
30
1
32
1
35
1

Totaal

15

Wat is de meest voorkomende leeftijd in deze ploeg? Wat is de meest voorkomende waarneming? Om op deze vragen te antwoorden, moet je de hoogste frequentie vinden.


LeeftijdAantal spelers
19
1
20
1
21
1
23
1
24
2
25
3
26
1
28
2
30
1
32
1
35
1

Totaal

15

3 is de hoogste frequentie en komt overeen met de leeftijd van 25 jaar.
25 is de leeftijd die het vaakst wordt waargenomen in de ploeg, het is de meest voorkomende waarneming.
25 jaar is de modus van de reeks.

Als je meer wilt weten, bespreken we de modus in het thema 'Bevolking' en ook in het thema 'Verkeersongevallen'.

Een percentage vertegenwoordigt een deel van een geheel en wordt uitgedrukt op 100. Een percentage is een fractie op 100. Het symbool % wordt daarvoor gebruikt.

20% betekent 20 van de 100 delen of 20/100.

Een percentage dat nergens betrekking op heeft, is betekenisloos.

20% van wat?

Voorbeeld 1

Stel je een vierkant voor, opgebouwd uit 100 vierkantjes. Van deze 100 vierkantjes zijn er 20 geel gekleurd, 10 blauw, 25 oranje, 1 rood en 44 zijn helemaal niet gekleurd.

vierkant

De verhouding van gele vierkantjes ten opzichte van het geheel is dus 20/100 of 20%; de verhouding van blauwe vierkantjes is 10/100 of 10%; de verhouding van oranje vierkantjes is 25/100 of 25% en de verhouding van rode vierkantjes is 1/100 of 1% en de verhouding van ongekleurde vierkantjes is 44/100 of 44%.

Voorbeeld 2

Er zitten 4 meisjes en 16 jongens in een klas.

Wat is het percentage meisjes in de klas?

Het aandeel meisjes in de klas (4 meisjes op een totaal van 20) kan worden geschreven als 4/20. Om het percentage te berekenen, moet deze breuk worden uitgedrukt ten opzichte van 100.

Om het antwoord te vinden moet je de noemer en dus ook de teller met 5 vermenigvuldigen.

Dat betekent dat er 20% meisjes in de klas zitten.

Het thema ‘Nationaliteiten’ zit vol met percentages.

De relatieve frequentie van een waarneming wordt verkregen door het aantal waarnemingen te delen door het totale aantal in de statistische reeks. 

Relatieve frequentie

De relatieve frequentie ligt altijd tussen 0 en 1. Ze kan worden uitgedrukt als een percentage.

De som van alle relatieve frequenties is altijd gelijk aan 1.

We nemen een kijkje naar de cijfers op 10 van een toets die werd afgenomen bij 24 leerlingen in een klas, voorgesteld in de vorm van een frequentieverdeling.

Punten op 10012
3
4
5
6
7
8
9
10
Totaal
Aantal leerlingen die dit resultaat behaald hebben
1
2
1
0
1
2
5
5
4
2
1
24
  • De absolute frequentie van het cijfer 7/10 is 5. Het totale aantal is 24.
  • Als we 5 delen door 24, krijgen we 0,208.
  • 0,208 is de relatieve frequentie van het cijfer 7/10.

Dat betekent dat 20,8% van de leerlingen in de klas een 7/10 scoorde op de toets.

Je kunt dit doen voor alle cijfers van 0 tot 10.

Om ervoor te zorgen dat er geen fouten gemaakt worden bij de conclusies van het onderzoek, is het essentieel dat de steekproef representatief is. Dat wil zeggen: de steekproef moet dezelfde kenmerken hebben als het universum waaruit hij is getrokken.

Stel je een klas voor met 24 kinderen, met 6 meisjes en 18 jongens.

Stel je voor dat je geïnteresseerd bent in hoe tevreden de klas is over een schoolreis.

Stel je voor dat je niet de hele klas kunt interviewen en je beslist om een steekproef van 6 kinderen te interviewen.

Je kiest ervoor om 5 meisjes en 1 jongen te interviewen over hun tevredenheid.

De 5 meisjes zijn ontevreden. De jongen is tevreden.

Uit dit voorbeeld kun je concluderen dat de meerderheid van de klas niet tevreden is over de schoolreis.

Is dat de realiteit? Nee. Want de steekproef is niet representatief. De meisjes in je steekproef zijn oververtegenwoordigd, terwijl de jongens ondervertegenwoordigd zijn. En in de realiteit van deze klas hebben de meisjes niet dezelfde mening als de jongens.

De resultaten die je zou hebben verkregen als je alle leerlingen in de klas had ondervraagd, konden helemaal anders zijn.

Statistiek is de wetenschap van gegevens. Het is het geheel van methodes die worden gebruikt om gegevens te verzamelen en te analyseren. 

De doelstellingen van de statistiek zijn:

  • gegevens verzamelen over een kenmerk, onderwerp, thema of fenomeen van een populatie of deel van die populatie. Dat noemen we gegevens verzamelen.

  • informatie uit gegevens halen. Dat is de rol van de beschrijvende statistiek: met behulp van parameters, grafieken en tabellen informatie uit gegevens samenvatten.

  • conclusies van een deel van de bevolking veralgemenen naar het geheel van die bevolking: dat is inferentiële statistiek

Alle statistieken op deze website zijn geproduceerd door Statbel, het Belgische statistiekbureau. Statbel is een Algemene Directie van de Federale Overheidsdienst Economie.

Een waarneming is een waargenomen waarde voor een bepaalde variabele. Die kan kwalitatief of kwantitatief zijn. 

Laten we een voorbeeld nemen: als onderdeel van een onderzoek naar de leeftijden van spelers in een voetbalteam, werd elke speler naar zijn leeftijd gevraagd.

In dit geval is de bestudeerde variabele of het bestudeerde kenmerk de leeftijd van de spelers.

Dit zijn de resultaten:

24, 25, 30, 24, 25, 23, 28, 32, 20, 19, 35, 26, 28, 21, 25 

Alle waarnemingen samen vormen een reeks.

Deze reeks kan worden geordend door de waarden van de waarnemingen te rangschikken van klein naar groot:

19, 20, 21, 23, 24, 24, 25, 25, 25, 26, 28, 28, 30, 32, 35 

Deze reeks kan ook worden omgezet in een tabel die een een frequentieverdeling genoemd wordt.


LeeftijdAantal spelers
191
20
1
21
1
23
1
24
2
25
3
26
1
28
2
30
1
32
1
35
1

Totaal

15

De steekproef vertegenwoordigt een onderdeel van het universum (de populatie) waarop de statistische studie gebaseerd is.

Waarom een steekproef bestuderen in plaats van het hele universum?

Simpelweg omwille van de middelen.

Alle eenheden in het universum ondervragen is erg duur en tijdrovend.

Maar opgelet, de steekproef moet representatief zijn voor de populatie.

Het universum of de populatie is het geheel aan eenheden (ook individuen genoemd) waarop een statistische studie gebaseerd is. 

  • Belgische bevolking: alle inwoners van België (eenheid = één inwoner van België)
  • Belgisch wagenpark: alle auto's die geregistreerd zijn in België (eenheid = één auto)
  • Alle bomen in een bos (eenheid = één boom)
  • Afrikaanse olifanten (eenheid = één olifant)
  • Leerlingen in een school (eenheid = één leerling)
  • ... 

Statbel

North Gate

Koning Albert II-Laan 16

1000 Brussel

statbel@economie.fgov.be

0800 120 33

Volg ons op

Made byBits of Love

FOD Economie, K.M.O., Middenstand en Energie / ©2024 Statbel