Datahantering behels die insamel, organisering, voorstelling en ontleding van data. 1

Data is inligting wat ons vir verskeie redes insamel. 1 Ons kan data insamel om byvoorbeeld te kyk wat in die verlede gebeur het sodat ons voorspellings kan maak, of dit gebruik om beplanning vir die toekoms te doen. Wanneer ons met data werk, moet die data deur ʼn siklus gaan. Hierdie siklus word die datasiklus genoem.

Die datasiklus bestaan uit die volgende stappe:

  • Samel data in;
  • Organiseer die data;
  • Stel die data grafies voor;
  • Ontleed die data; en
  • Maak afleidings of voorspellings.

Wat is ‘n populasie en ‘n steekproef?

Ons kan data op verskeie plekke kry. Soms kom die data uit die natuur, byvoorbeeld wanneer jy wil weet hoeveel van elke soort blom daar in die tuin is, en soms moet jy data van mense af kry, byvoorbeeld wanneer jy wil weet in watter vak die leerders in jou skool die beste presteer. Om hierdie data in te samel moet jy eers besluit uit watter populasiegroep jou data gaan kom.

Die populasie is die hele groep waaroor jy data wil insamel. 2 Dit sal byvoorbeeld al jou skool se leerders wees. ʼn Steekproef is ʼn groep mense wat die hele populasie verteenwoordig, en dit word gewoonlik gebruik wanneer die populasie baie groot is. 2

Jy kan byvoorbeeld besluit om slegs data van een klas uit elke graad in te samel. Hierdie leerders is dan jou steekproef, en hulle sal die hele skool verteenwoordig.

Dit is belangrik om te onthou dat jou steekproef regverdig gekies moet word. Jy kan byvoorbeeld nie slegs meisies kies om deel van jou steekproef te wees wanneer daar ook seuns in die skool is nie, tensy jy slegs wil vasstel hoe meisies of seuns spesifiek vaar. Die leerders wat deel van die steekproef is, moet dus die hele skool regverdig en gelyk verteenwoordig. Dit sal ook afhang waaroor jy data insamel. As jy byvoorbeeld wil weet wat die gemiddelde punt vir Wiskunde in die skool is, kan jou steekproef nie slegs uit graad 7-leerders bestaan nie. Dit is ook nie altyd nodig om ʼn steekproef te gebruik nie. Indien jou populasiegroep klein genoeg is, kan jy almal in jou populasie se data gebruik.

Samel data in

Die eerste stap van die datasiklus is om data in te samel, oftewel data-insameling.

Ons kan data op verskeie maniere insamel, onder meer deur die volgende metodes te gebruik:

  • Deel vraelyste uit: Hierdie vraelyste bevat vrae wat jou help om die data wat jy nodig het, te kry.
  • Observeer: Tydens observasie samel jy die data in deur aantekeninge te maak terwyl jy ʼn situasie waarneem. Jy kan byvoorbeeld tel hoeveel van elke soort toebroodjie tydens pouse verkoop word deur af te merk elke keer wanneer ʼn sekere soort broodjie verkoop word.
  • Vra en teken aan: Hierdie manier werk baie soos observasie, maar pleks daarvan dat jy observeer, vra jy vir mense vrae en maak aantekeninge van hul antwoorde. Jy kan byvoorbeeld vir jou klasmaats vra wat hul gunstelingtoebroodjie is.

Die metode wat jy sal gebruik, gaan afhang van die tipe data wat jy wil insamel. As jy byvoorbeeld wil weet hoeveel reën daar in ʼn week geval het, sal observasie die beste metode van data-insameling wees. Indien jy wil weet watter troeteldiere jou klasmaats by die huis het, sal jy eerder die vra-en-aantekenmetode gebruik. Wanneer jy data by ʼn groot groep mense wil verkry, is dit beter om vraelyste uit te deel en later rustig hierdie vraelyste te organiseer. Besluit dus eers watter soort data jy gaan insamel en hoe groot jou populasie of steekproef is, voordat jy op ʼn data-insamelingsmetode besluit.

Organiseer die data

Noudat ons data ingesamel het, moet ons die data organiseer. Dit is belangrik om data te organiseer voordat jy dit voorstel om seker te maak dat jy nie enige data mis nie. Wanneer data ongeorganiseer is, is dit te moeilik om dit voor te stel sonder om ʼn fout te maak. 1 Daarom gebruik ons frekwensietabelle (soms noem ons dit tellingtabelle) om ons te help om hierdie data te organiseer. 2

Frekwensietabelle bestaan uit drie kolomme: In die eerste kolom skryf jy waaroor jy data oor ingesamel het neer; in die tweede kolom maak jy tellingstrepies; en in die derde kolom skryf jy die frekwensie van jou tellingstrepies neer. Frekwensie verwys na die “totaal” of hoe gereeld iets voorkom. Hieronder is ʼn voorbeeld van ʼn frekwensietabel.

Graad 6-leerders se gunstelingkleur

Kleur Telling Frekwensie
Groen III 3
Blou IIII IIII II 12
Rooi IIII 5
Geel IIII IIII IIII 15
Pienk IIII IIII IIII 14
Pers II 2
Totaal 51

Ons gebruik tellingstrepies om ons te help tel hoeveel stemme elke kleur ontvang het. Elke keer wat jy ʼn stem vir ʼn spesifieke kleur kry, trek jy daardie stem dood, en jy maak ʼn vertikale strepie in die tellingkolom by daardie spesifieke kleur. Wanneer daar vyf stemme is, trek jy ʼn horisontale strepie oor die vorige vier strepies om vyf soos volg aan te dui: IIII. Ons doen dit sodat ons in vywe kan tel wanneer ons die frekwensies moet neerskryf. Dit maak die proses vinniger en akkurater.

Ons kan nou die frekwensiekolom optel. Die totaal moet dieselfde wees as die aantal leerders in jou steekproefgroep. Indien dit nie dieselfde is nie, weet jy dat jy ʼn fout gemaak het. In hierdie voorbeeld kan ons sien dat daar 51 Graad 6-leerders aan die opname deelgeneem het.

Stel die data grafies voor

Noudat ons die data georganiseer het, kan ons die data voorstel. Dit is belangrik om die data grafies voor te stel sodat die data maklik en vinnig gelees kan word om sodoende afleidings en voorspellings te kan maak.

Daar is verskeie grafieke wat gebruik kan word om data voor te stel, onder meer:

  • Piktogramme;
  • Staafgrafieke;
  • Dubbele staafgrafieke;
  • Histogramme; en
  • Sirkelgrafieke.

Die tipe data sal bepaal watter grafiek jy sal gebruik om die data voor te stel.

Piktogramme

Piktogramme maak gebruik van prentjies of simbole om die data voor te stel. 3 Piktogramme word merendeels gebruik wanneer die steekproef/populasie ʼn kleiner groep is. Piktogramme maak ook gebruik van ʼn sleutel. Die sleutel dui aan hoeveel mense/voorwerpe voorgestel word deur elke prent/simbool. 3 In die voorbeeld hieronder is daar ʼn 1:6-sleutel (gelees een tot ses) gebruik. Dit beteken dat een prentjie op die piktogram ses leerders voorstel.

Graad 7-leerders se gunstelingtroeteldier

Hond ☺☺☺☺☺☺☺☺☺☺
Kat ☺☺☺☺☺☺☺
Perd ☺☺☺
Slang
Skilpad ☺☺☺☺☺
Haas ☺☺

Sleutel – 1:6

Dit is nou moontlik om te bepaal hoeveel leerders ʼn perd as hul gunstelingtroeteldier gekies het deur die aantal simbole (gesiggies) te maal met 6: 3 x 6 = 18. Ons kan ook bepaal hoe groot ons steekproef was deur die aantal simbole (gesiggies) in totaal te maal met 6: (10 + 7 + 3 + 1 + 5 + 2) x 6 = 28 x 6 = 168 leerders.

Staafgrafieke

ʼn Staafgrafiek is ʼn baie vinnige en maklike manier om data voor te stel. 3 Dit is ook ʼn beter manier om groot hoeveelhede data voor te stel. ʼn Staafgrafiek het ʼn horisontale as (x-as) en ʼn vertikale as (y-as). Die afhanklike veranderlike word altyd op die vertikale as geplaas, terwyl die onafhanklike veranderlike op die horisontale as geplaas word. Jou afhanklike veranderlike is afhanklik van jou onafhanklike veranderlike.

In die voorbeeld hier onder is ʼn groep graad 4-leerders gevra om hul gunstelingskoolvak te kies. Die onafhanklike veranderlike is die skoolvak, aangesien die leerders nie kan kies watter vakke daar aangebied word nie. Die afhanklike veranderlike is die aantal leerders wat die vak as hul gunsteling kies, aangesien ons nie kan beheer hoeveel leerders van die verskeie vakke sal hou nie. Nog ʼn belangrike eienskap van ʼn staafgrafiek is die spasies tussen die stawe. Indien daar nie spasies tussen die stawe is nie, noem ons dit ʼn histogram en nie meer ʼn staafgrafiek nie.

In hierdie grafiek vermeerder die getal op die vertikale as in inkremente van twee. Die inkremente word deur jou data bepaal, so indien jou steekproef groter is, sal jou inkremente waarskynlik groter wees. Dit is nou baie maklik om met die eerste oogopslag te sien dat Wiskunde hierdie graad 4-groep se gunstelingskoolvak is.

Wanneer ʼn mens wil weet hoeveel leerders daardie vak gekies het, gaan kyk ʼn mens tot waar die staaf opgaan en volg dan daardie horisontale lyn tot by die vertikale as. Die aantal leerders word dan van die vertikale as afgelees. Dit is nie altyd nodig om die stawe verskillende kleure te maak nie, maar elke staaf moet benoem word sodat die skoolvakke deur middel van die stawe onderskei kan word. Indien jy nie die stawe benoem nie, moet jy ʼn sleutel byvoeg wat vir die leser vertel watter kleur staaf watter skoolvak voorstel.

Dubbele staafgrafieke

Soms wil ons die data wat ons ingesamel het, verder verdeel. As ons kyk na die data in die staafgrafiek hierbo, sien ons slegs hoeveel leerders ʼn spesifieke vak as hul gunsteling gekies het. Ons weet egter nie hoeveel van hierdie leerders was seuns en hoeveel was meisies nie. Daarvoor kan ons ʼn dubbele staafgrafiek gebruik. In die voorbeeld hieronder het ons die data wat op die staafgrafiek voorkom gebruik en verder verdeel in seuns en meisies. Let mooi op die sleutel wat nou gebruik is om aan te dui watter staaf die seuns en watter staaf die meisies se data is.

By ʼn dubbele staafgrafiek is dit nodig om twee verskillende kleure te gebruik. Jy moet ook ʼn sleutel insit om te verduidelik watter kleur staaf stel watter data voor. In hierdie voorbeeld kan ons duidelik sien dat die blou stawe die seuns voorstel, en die pienk stawe stel die meisies voor.

Histogramme

Histogramme word gebruik om data wat in groepe voorkom, voor te stel. 2 In die voorbeeld hieronder word leerders se Wiskunde-toetspunte voorgestel. Daar word van hakies gebruik gemaak om aan te dui tussen watter punte die data lê. Ronde hakkies () beteken die getal is uitgesluit. Blok hakkies [] beteken die getal is ingesluit.

As ons dus na die tweede staaf kyk, kan ons sien dat sewe leerders ʼn punt tussen 5 en 8 behaal het, aangesien die staaf gemerk is met (4; 8] wat beteken dat die punte wat in hierdie staaf aangedui is, strek van 4 tot 8, maar 4 is uitgesluit en 8 is ingesluit. Dus sluit dit slegs leerders in wat ʼn punt van 5; 6; 7 of 8 uit 20 behaal het.

Hierdie tipe grafiek het steeds ʼn horisontale en vertikale as. Die afhanklike veranderlike kom steeds op die vertikale as en die onafhanklike veranderlike kom steeds op die horisontale as. Dit is belangrik dat die intervalle van die horisontale as dieselfde is by elke staaf. In hierdie geval word daar by elke staaf vier punte uit 20 ingesluit. Hierdie tipe grafiek kan egter nie vir ons spesifieke data gee nie.

Indien ons dus wil weet hoeveel leerders ʼn punt van 11 uit 20 behaal het, sal ons dit nie op hierdie grafiek kan sien nie. In daardie geval sou ons eerder van ʼn staafgrafiek gebruik gemaak het. Hierdie tipe grafiek gee wel vir ons ʼn goeie oorsig van die klas as geheel se prestasie.

Sirkelgrafieke

Sirkelgrafieke maak van persentasies gebruik om data in ʼn sirkel voor te stel. 4 Die grootte van elke sirkelsegment word bepaal deur die persentasie van daardie data om te sit in ʼn punt uit 360. Die rede hoekom ons 360 gebruik, is omdat die hoekgrootte van ʼn omwenteling 360° is. Al die segmente se binnehoeke moet dus optel na 360°. In die voorbeeld hieronder is ʼn groep leerders gevra watter bron van vervoer hul gebruik om elke dag by die skool te kom.

Die uitslae was soos volg:

Bus: 30 leerders

Motor: 90 leerders

Fiets: 50 leerders

Taxi: 10 leerders

Stap: 20 leerders

Volgende moet ons elk van hierdie as ʼn persentasie gaan skryf:

Bus: 54%  (30 over 200 cross times100)

Motor: 45% (90 over 200cross times100)

Fiets: 25% (25 over 200cross times100)

Taxi: 5% (5 over 200cross times100)

Stap: 10% (10 over 200cross times100)

Volgende werk ons uit wat daardie persentasie van 360 is:

Bus: 54° (360 cross times15 over 100)

Motor: 162° (360 cross times 45 over 100)

Fiets: 90° (360 cross times25 over 100 )

Taxi: 18° (360 cross times5 over 100)

Stap: 36°  (360 cross times10 over 100)

Ons weet nou hoe groot die binnehoek van elke segment moet wees en kan dus nou ons sirkelgrafiek teken, soos in die voorbeeld hier onder.

Dit is belangrik om ʼn sleutel by jou grafiek te voeg sodat die leser weet watter kleur segment stel watter data voor. Ons gebruik ʼn liniaal en gradeboog om die hoekgrootte van die segmente te meet en akkuraat te teken. ʼn Voorbeeld hiervan kan gesien word in die geel segment wat die getal leerders wat met ʼn motor vervoer word (90), voorstel. Hierdie grafiek is weer eens lekker om te gebruik indien jy met groot hoeveelhede data werk.

Dit is ook ʼn goeie grafiek om te gebruik wanneer jy baie verskillende afdelings het, aangesien jy soveel segmente by jou sirkel kan voeg soos jy wil sonder om die grootte van omtrek te verander. Jy kan dus baie data in ʼn klein spasie voorstel.

Verslagdoening

Nadat die data voorgestel is, moet ons ʼn verslag oor die data skryf. Ons het die data vir ʼn spesifieke rede ingesamel en wil dus die data kan ontleed om sekere vrae te kan beantwoord of voorspellings te maak. ʼn Belangrike aspek wat in jou verslag gedek moet word, is die opsomming en sentraleneigingstatistiek.

Ons kyk hier na vier aspekte, naamlik:

  • Modus;
  • Mediaan;
  • Gemiddeld; en
  • Variasiewydte (omvang).

Hierdie vier aspekte dui aan wat die algemene neiging van die data is. Ons kan dit ook gebruik om voorspellings te maak of om algemene tendense te bepaal. Om ons daarmee te help, gaan ons die volgende data gebruik. ʼn Graad 6-groep het ʼn Wiskunde-eksamen afgelê en die onderstaande punte behaal. (Die punte vertoon is punte uit 20.)

14 1 8 15 8 14 3 10 5 11
5 6 6 19 3 8 3 12 5 12
8 3 19 11 7 11 7 17 3 13
20 8 20 10 11 10 19 19 7 15
9 10 4 5 19 9 3 20 18 12
10 6 0 8 17 20 18 2 11 13
11 15 12 9 16 8 17 2 12 16
8 18 16 2 12 5 14 7 13 11

 

Modus

Die modus van die datastel is die data wat die meeste voorkom. 5 Om dit te kan bepaal, moet die data eers georganiseer word. Gelukkig het ons in hierdie geval reeds ʼn staafgrafiek gekry en kan ons maklik sien dat die meeste leerders ʼn punt van 8 uit 20 behaal het. Die modus is dus 8. Indien ons nie die data in ʼn grafiek kry nie, sal ons dit eers in stygende orde moet rangskik.

Mediaan

Die mediaan van die data is die data wat in die middel van die datastel voorkom. 3

Hiervoor moet ons die data in stygende orde gaan neerskryf:

0; 1; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 5; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 7; 8; 8; 8; 8; 8; 8; 8; 8; 9; 9; 9; 10; 10; 10; 10; 10; 11; 11; 11; 11; 11; 11; 11; 12; 12; 12; 12; 12; 12; 13; 13; 13; 14; 14; 14; 15; 15; 15; 16; 16; 16; 17; 17; 17; 18; 18; 18; 19; 19; 19; 19; 19; 20; 20; 20; 20.

Ons moet nou bepaal watter waarde presies in die middel lê. Ons doen dit deur die aantal punte te deel deur 2: 80 ÷ 2 = 40. So, ons het 40 punte bo en 40 punte onder die middel. Dus sal ons na punt 40 en 41 moet kyk, want daar is nie ʼn punt wat presies in die middel lê nie.

Punt 40 = 10                                      Punt 41 = 11

Wat lê presies in die middel van 10 en 11? (10 + 11) ÷ 2 = 21 ÷ 2 = 10,5.

Die mediaan van hierdie datastel is dus 10,5.

Gemiddelde

Wanneer ons die gemiddelde uitwerk, tel ons al die datapunte bymekaar en deel dit deur die aantal datapunte. 4 Dit gee dus vir ons die gemiddelde van al die punte wat daar in die datastel voorkom.

14 1 8 15 8 14 3 10 5 11
5 6 6 19 3 8 3 12 5 12

Bostaande tabel stel 20 leerders se punte vir ʼn Wiskunde-toets voor.

Indien ons die gemiddelde punt wil bepaal, tel ons al die punte bymekaar en deel dit dan deur 20:

14 + 1 + 8 + 15 + 8 + 14 + 3 + 10 + 5 + 11 + 5 + 6 + 6 + 19 + 3 + 8 + 3 + 12 + 5 + 12 = 168

168 ÷ 20 = 8,4

Die gemiddelde punt wat leerders vir hierdie toets behaal het, is dus 8,4.

Variasiewydte (omvang)

Die variasiewydte of omvang van die data sê vir ons hoe wyd ons data versprei is. 4 Hoe kleiner die variasiewydte is, hoe nader is die data aan mekaar, en kan ons aanneem daar is min uitskieters (punte wat ver van die gemiddelde af is). Wanneer die variasiewydte baie groot is, beteken dit dat daar uitskieters is. Dit is soms moontlik om hierdie uitskieters te identifiseer en hul uit te sluit by jou data sodat jou statistiek meer geldig en van waarde is.

Kom ons kyk na ʼn voorbeeld:

20 8 20 10 11 10 19 19 7 15
9 10 4 5 19 9 3 20 18 12

In hierdie tabel verskyn 20 leerders se punte vir ʼn Wiskunde-toets. Die hoogste punt is 20 uit 20, terwyl die laagste punt 3 uit 20 is.

Die variasiewydte is dus: 20 – 3 = 17. Aangesien die punte uit 20 is, is dit duidelik ʼn baie groot variasiewydte.

19 11 19 11 18 11 13 17 10 13
18 10 10 10 11 10 19 19 12 15

In hierdie tabel verskyn ʼn ander groep van 20 leerders se punte vir ʼn Wiskunde-toets. Die hoogste punt is nou 19, en die laagste punt is 10.

Die variasiewydte is nou: 19 – 10 = 9. Hierdie variasiewydte is baie klein, wat beteken dat daar min of geen uitskieters is nie en dat die data baie naby aan mekaar lê.

Maak afleidings of voorspellings

Dit is nou nodig dat ons hierdie data gebruik om afleidings of voorspellings te maak. Vrae soos: “Het die klas goed gevaar in hul klastoets?” kan beantwoord word deur te kyk na die klas se gemiddeld. Indien die gemiddeld hoog is, het die klas as geheel goed gevaar, ongeag wat die laagste punt was. Indien die klas se gemiddeld laag is, het die klas as geheel swak gevaar, al is daar ʼn leerder wat volpunte behaal het. Ons kan ook data gebruik om voorspellings te maak. Indien ons vir drie jaar in ʼn ry vasgestel het dat daar baie reënval in Februarie is, kan ons voorspel dat daardie tendens in die volgende jaar gaan voortgaan.

Onthou: Voorspellings is nie noodwendig feite nie. Ons maak voorspellings gebaseer op tendense wat in die verlede gebeur het, maar ons kan nooit verseker wees dat die verlede homself sal herhaal nie. Dus noem ons dit slegs ʼn voorspelling.

Woordbank

afhanklike veranderlike Word bepaal deur die data wat jy insamel en word altyd op die vertikale as van ʼn staafgrafiek aangedui. 2
datapunte ʼn Punt of waarde op ʼn grafiek of tabel wat spesifieke of individuele inligting gee.
gemiddelde Die gemiddelde waarde van die data word bepaal deur al die datapunte bymekaar te tel en dit dan deur die totale aantal datapunte te deel.
mediaan Die getal wat in die middel van ʼn geordende datastel voorkom. 3
modus Die getal of item wat die meeste in die datastel voorkom. 5
onafhanklike veranderlike Dit word bepaal wanneer jy jou vrae opstel voordat jy jou data insamel; dit word altyd op die horisontale as van ʼn staafgrafiek aangedui. 2
populasie Die groot groep wat ondersoek of bestudeer word. 2
sentraleneigingstatistiek Getalle wat beskryf wat gemiddeld, of tipies is binne ʼn verspreiding van data. Die drie hoofmaatreëls wat gebruik word is gemiddelde, modus en mediaan. 4
sleutel Sleutels word gebruik om te verduidelik wat ʼn simbool of kleur op ʼn grafiek beteken of voorstel. 3
steekproef ʼn Kleiner groep wat uit die populasie gekies word om die hele populasie te verteenwoordig. 2
tellingstrepies Strepies wat op ʼn frekwensietabel voorkom om die telproses te vergemaklik tydens die data-organiseringsproses, byvoorbeeld IIII wat gebruik word om vyf aan te dui. 2
variasiewydte Die grootste waarde minus die kleinste waarde in jou datastel is gelyk aan die variasiewydte. ʼn Groot variasiewydte dui op data wat wyd versprei is, teenoor ʼn klein variasiewydte wat dui op data wat naby aan mekaar lê. 4

Raadpleeg dié bronne om meer te leer

  • Microsoft Excel is ʼn fantastiese hulpmiddel om grafieke akkuraat te trek.
  • Waardevolle handboeke om te raadpleeg:
    • Platinum Wiskunde-reeks (2012) vir graad 4- tot graad 7-leerders, uitgegee deur Maskew Miller Longman.
    • Oxford Suksesvolle Wiskunde-reeks (2006-2013) vir graad 4- tot graad 7-leerders, uitgegee deur Oxford University Press.
    • PracMaths-reeks (2012) vir graad 4- tot graad 7-leerders, uitgegee deur JNM Publishers.

Kyk hierdie video’s nog meer te leer

Hoe om ʼn staafgrafiek in Excel te teken

Hoe om ʼn dubbele staafgrafiek in Excel te teken

Hoe om ʼn histogram in Excel te teken

Hoe om ʼn sirkelgrafiek in Excel te teken

Gepubliseer op: 25 April 2022 | Bygewerk op 19 Maart 2024