Categorische gegevens versus numerieke gegevens
Gegevens zijn de feiten of informatie die zijn verzameld met het oog op referentie of analyse. Vaak worden deze gegevens verzameld als een attribuut van het betreffende onderwerp. Dit attribuut kan van het een tot het ander verschillen, vandaar dat dit variërende attribuut als een variabele kan worden beschouwd. De variabelen kunnen verschillende vormen van waarden aannemen en deze zijn intrinsiek in de verzamelde gegevens.
Variabelen kunnen zowel kwalitatief als kwantitatief zijn; d.w.z. als de variabele kwantitatief is, zijn de antwoorden getallen en kan de grootte van het gemeten attribuut met een zekere nauwkeurigheid worden vermeld. Het andere type, de kwalitatieve variabelen, meten de kwalitatieve attributen en de waarden die door de variabelen worden aangenomen, kunnen niet worden gegeven in termen van grootte of grootte. De variabelen zelf staan bekend als categorische variabelen en de gegevens die door middel van een categorische variabele worden verzameld, zijn categorische gegevens.
Meer over numerieke gegevens
Numerieke gegevens zijn in feite de kwantitatieve gegevens die zijn verkregen uit een variabele, en de waarde heeft een gevoel van grootte/magnitude. De verkregen numerieke gegevens zijn verder onderverdeeld in nog drie categorieën op basis van de theorie die is ontwikkeld door Stanley Smith Stevens. Numerieke gegevens kunnen ordinaal, interval of ratio zijn. Het type gegevens wordt bepaald door de meetmethode van de waarden, en de typen staan bekend als meetniveaus.
Het gewicht van een persoon, de afstand tussen twee punten, temperatuur en de prijs van een aandeel zijn voorbeelden van numerieke gegevens.
In de statistiek zijn de meeste methoden afgeleid voor de analyse van numerieke gegevens. Basis beschrijvende statistiek en regressie en andere inferentiële methoden worden voornamelijk gebruikt voor de analyse van numerieke gegevens.
Meer over categorische gegevens
Categorische gegevens zijn waarden voor een kwalitatieve variabele, vaak een getal, een woord of een symbool. Ze brengen het feit naar voren dat de variabele in het beschouwde geval tot een van de verschillende beschikbare keuzes behoort. Daarom behoren ze tot een van de categorieën; vandaar de naam categorisch.
De politieke overtuiging van een persoon, de nationaliteit van een persoon, de favoriete kleur van een persoon en de bloedgroep van een patiënt zijn kwalitatieve kenmerken. Soms kan een getal worden verkregen als een categorische waarde, maar het getal zelf vertegenwoordigt niet de grootte van het gemeten attribuut. Postcode is een voorbeeld.
Ook behoren alle categorische waarden tot het nominale gegevenstype, wat een ander type is op basis van de meetniveaus. De methoden die worden gebruikt voor het analyseren van categorische gegevens verschillen van die van numerieke gegevens, maar het onderliggende principe kan hetzelfde zijn.
Wat is het verschil tussen categorische en numerieke gegevens?
• Numerieke gegevens zijn waarden die zijn verkregen voor een kwantitatieve variabele en hebben een gevoel van grootte gerelateerd aan de context van de variabele (daarom zijn het altijd getallen of symbolen met een numerieke waarde). Categorische gegevens zijn waarden die zijn verkregen voor een kwalitatieve variabele; categorische gegevensaantallen dragen geen gevoel van grootte met zich mee.
• Numerieke gegevens behoren altijd tot het ordinale, ratio- of interv altype, terwijl categorische gegevens tot het nominale type behoren.
• Methoden die worden gebruikt om kwantitatieve gegevens te analyseren, verschillen van de methoden die worden gebruikt voor categorische gegevens, zelfs als de principes hetzelfde zijn, heeft de toepassing in ieder geval significante verschillen.
• Numerieke gegevens worden geanalyseerd met behulp van statistische methoden in beschrijvende statistieken, regressie, tijdreeksen en nog veel meer.
• Voor categorische gegevens worden meestal beschrijvende methoden en grafische methoden gebruikt. Sommige niet-parametrische tests worden ook gebruikt.