Verschil tussen classificatie en regressie

Verschil tussen classificatie en regressie
Verschil tussen classificatie en regressie
Anonim

Het belangrijkste verschil tussen classificatie en regressieboom is dat bij classificatie de afhankelijke variabelen categorisch en ongeordend zijn, terwijl bij regressie de afhankelijke variabelen continue of geordende hele waarden zijn.

Classificatie en regressie zijn leertechnieken om voorspellingsmodellen te maken op basis van verzamelde gegevens. Beide technieken worden grafisch weergegeven als classificatie- en regressiebomen, of liever stroomdiagrammen met gegevensverdelingen na elke stap, of beter gezegd, "tak" in de boom. Dit proces wordt recursieve partitionering genoemd. Velden zoals Mijnbouw maken gebruik van deze classificatie- en regressieleertechnieken. Dit artikel richt zich op de classificatiestructuur en de regressiestructuur.

Verschil tussen classificatie en regressie - vergelijkingssamenvatting
Verschil tussen classificatie en regressie - vergelijkingssamenvatting

Wat is classificatie?

Classificatie is een techniek die wordt gebruikt om tot een schema te komen dat de organisatie van gegevens laat zien, beginnend met een voorlopervariabele. De afhankelijke variabelen classificeren de gegevens.

Verschil tussen classificatie en regressie
Verschil tussen classificatie en regressie

Figuur 01: Datamining

De classificatieboom begint met de onafhankelijke variabele, die zich vertakt in twee groepen zoals bepaald door de bestaande afhankelijke variabelen. Het is bedoeld om de antwoorden te verduidelijken in de vorm van categorisering die wordt veroorzaakt door de afhankelijke variabelen.

Wat is regressie

Regressie is een voorspellingsmethode die is gebaseerd op een veronderstelde of bekende numerieke uitvoerwaarde. Deze uitvoerwaarde is het resultaat van een reeks recursieve partitionering, waarbij elke stap één numerieke waarde heeft en een andere groep afhankelijke variabelen die vertakken naar een ander paar zoals dit.

De regressieboom begint met een of meer voorlopervariabelen en eindigt met een laatste uitvoervariabele. De afhankelijke variabelen zijn ofwel continue ofwel discrete numerieke variabelen.

Wat is het verschil tussen classificatie en regressie?

Classificatie versus regressie

Een boommodel waarbij de doelvariabele een discrete reeks waarden kan aannemen. Een boommodel waarbij de doelvariabele continue waarden kan aannemen, meestal reële getallen.
Afhankelijke variabele
Voor de classificatiestructuur zijn de afhankelijke variabelen categorisch. Voor de regressieboom zijn de afhankelijke variabelen numeriek.
Waarden
Heeft een vast aantal ongeordende waarden. Heeft discrete maar geordende waarden of indiscrete waarden.
Doel van de constructie
Het doel van het construeren van de regressieboom is om een regressiesysteem op elke bepalende tak te passen op een manier dat de verwachte outputwaarde omhoog komt. Een classificatieboom vertakt zich zoals bepaald door een afhankelijke variabele die is afgeleid van het vorige knooppunt.

Samenvatting – Classificatie versus regressie

Regressie- en classificatiebomen zijn nuttige technieken om het proces in kaart te brengen dat verwijst naar een bestudeerd resultaat, of het nu gaat om classificatie of een enkele numerieke waarde. Het verschil tussen de classificatieboom en de regressieboom is hun afhankelijke variabele. Classificatiebomen hebben afhankelijke variabelen die categorisch en ongeordend zijn. Regressiebomen hebben afhankelijke variabelen die continue waarden zijn of geordende hele waarden.