Verschil tussen gecontroleerd en niet-gesuperviseerd machine learning

Inhoudsopgave:

Verschil tussen gecontroleerd en niet-gesuperviseerd machine learning
Verschil tussen gecontroleerd en niet-gesuperviseerd machine learning

Video: Verschil tussen gecontroleerd en niet-gesuperviseerd machine learning

Video: Verschil tussen gecontroleerd en niet-gesuperviseerd machine learning
Video: Supervised vs. Unsupervised Learning 2024, November
Anonim

Belangrijk verschil - begeleid versus niet-gesuperviseerd machinaal leren

Supervised learning en unsupervised learning zijn twee kernconcepten van machine learning. Supervised Learning is een Machine Learning-taak voor het leren van een functie die een invoer toewijst aan een uitvoer op basis van de voorbeeldinvoer-uitvoerparen. Unsupervised Learning is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens. Het belangrijkste verschil tussen gesuperviseerd en niet-gesuperviseerd machine learning is dat bij leren onder toezicht gelabelde gegevens worden gebruikt, terwijl bij leren zonder toezicht niet-gelabelde gegevens worden gebruikt.

Machine Learning is een vakgebied in de informatica dat een computersysteem de mogelijkheid biedt om van gegevens te leren zonder expliciet geprogrammeerd te zijn. Het maakt het mogelijk om de gegevens te analyseren en patronen erin te voorspellen. Er zijn veel toepassingen van machine learning. Sommigen van hen zijn gezichtsherkenning, gebarenherkenning en spraakherkenning. Er zijn verschillende algoritmen die te maken hebben met machine learning. Sommigen van hen zijn regressie, classificatie en clustering. De meest voorkomende programmeertalen voor het ontwikkelen van op machine learning gebaseerde applicaties zijn R en Python. Andere talen zoals Java, C++ en Matlab kunnen ook worden gebruikt.

Wat is begeleid leren?

In op machine learning gebaseerde systemen werkt het model volgens een algoritme. Bij gesuperviseerd leren wordt het model gesuperviseerd. Ten eerste is het nodig om het model te trainen. Met de opgedane kennis kan het antwoorden voor de toekomstige instanties voorspellen. Het model wordt getraind met behulp van een gelabelde dataset. Wanneer een out of sample data aan het systeem wordt gegeven, kan het het resultaat voorspellen. Hieronder volgt een klein uittreksel uit de populaire IRIS-dataset.

Verschil tussen begeleid en niet-gesuperviseerd leren_Figuur 02
Verschil tussen begeleid en niet-gesuperviseerd leren_Figuur 02

Volgens de bovenstaande tabel worden Kelklengte, Kelkbreedte, Patellengte, Patelbreedte en Soort de attributen genoemd. De kolommen staan bekend als features. Eén rij bevat gegevens voor alle attributen. Daarom wordt één rij een waarneming genoemd. De gegevens kunnen numeriek of categorisch zijn. Het model krijgt de waarnemingen met de bijbehorende soortnaam als invoer. Wanneer een nieuwe waarneming wordt gegeven, moet het model voorspellen tot welk soort soort het behoort.

Bij begeleid leren zijn er algoritmen voor classificatie en regressie. Classificatie is het classificeren van de gelabelde gegevens. Het model creëerde grenzen die de gegevenscategorieën van elkaar scheidden. Wanneer nieuwe gegevens aan het model worden verstrekt, kan het worden gecategoriseerd op basis van waar het punt bestaat. De K-Nearest Neighbours (KNN) is een classificatiemodel. Afhankelijk van de k-waarde wordt de categorie bepaald. Als k bijvoorbeeld 5 is en een bepaald gegevenspunt in de buurt van acht gegevenspunten in categorie A en zes gegevenspunten in categorie B ligt, wordt het gegevenspunt geclassificeerd als A.

De regressie is het proces van het voorspellen van de trend van de vorige gegevens om de uitkomst van de nieuwe gegevens te voorspellen. In regressie kan de output bestaan uit een of meer continue variabelen. Voorspelling wordt gedaan met behulp van een lijn die de meeste gegevenspunten bedekt. Het eenvoudigste regressiemodel is een lineaire regressie. Het is snel en vereist geen afstemmingsparameters zoals in KNN. Als de gegevens een parabolische trend vertonen, is het lineaire regressiemodel niet geschikt.

Verschil tussen begeleid en niet-gesuperviseerd leren
Verschil tussen begeleid en niet-gesuperviseerd leren

Dit zijn enkele voorbeelden van begeleide leeralgoritmen. Over het algemeen zijn de resultaten die worden gegenereerd met leermethoden onder toezicht nauwkeuriger en betrouwbaarder omdat de invoergegevens goed bekend en gelabeld zijn. Daarom hoeft de machine alleen de verborgen patronen te analyseren.

Wat is leren zonder toezicht?

Bij leren zonder toezicht wordt het model niet begeleid. Het model werkt op zichzelf om de uitkomsten te voorspellen. Het gebruikt machine learning-algoritmen om conclusies te trekken over niet-gelabelde gegevens. Over het algemeen zijn de niet-gesuperviseerde leeralgoritmen moeilijker dan de gesuperviseerde leeralgoritmen omdat er weinig informatie is. Clustering is een vorm van leren zonder toezicht. Het kan worden gebruikt om de onbekende gegevens te groeperen met behulp van algoritmen. De k-mean en op dichtheid gebaseerde clustering zijn twee clusteringalgoritmen.

k-mean-algoritme, plaatst k-zwaartepunt willekeurig voor elk cluster. Vervolgens wordt elk datapunt toegewezen aan het dichtstbijzijnde zwaartepunt. Euclidische afstand wordt gebruikt om de afstand van het gegevenspunt tot het zwaartepunt te berekenen. De datapunten zijn ingedeeld in groepen. De posities voor k zwaartepunten worden opnieuw berekend. De nieuwe zwaartepuntpositie wordt bepaald door het gemiddelde van alle punten in de groep. Opnieuw wordt elk datapunt toegewezen aan het dichtstbijzijnde zwaartepunt. Dit proces herha alt zich totdat de zwaartepunten niet meer veranderen. k-mean is een snel clusteringalgoritme, maar er is geen gespecificeerde initialisatie van clusteringpunten. Er is ook een grote variatie aan clustermodellen op basis van initialisatie van clusterpunten.

Een ander clusteringalgoritme is op dichtheid gebaseerde clustering. Het is ook bekend als Density Based Spatial Clustering Applications met ruis. Het werkt door een cluster te definiëren als de maximale set van met dichtheid verbonden punten. Het zijn twee parameters die worden gebruikt voor op dichtheid gebaseerde clustering. Ze zijn Ɛ (epsilon) en minimum punten. De Ɛ is de maximale straal van de buurt. De minimum punten zijn het minimum aantal punten in de Ɛ buurt om een cluster te definiëren. Dit zijn enkele voorbeelden van clustering die vallen onder niet-gesuperviseerd leren.

Over het algemeen zijn de resultaten die worden gegenereerd door leeralgoritmen zonder toezicht niet erg nauwkeurig en betrouwbaar, omdat de machine de invoergegevens moet definiëren en labelen voordat de verborgen patronen en functies worden bepaald.

Wat is de overeenkomst tussen gesuperviseerd en niet-gesuperviseerd machinaal leren?

Zowel gesuperviseerd als niet-gesuperviseerd leren zijn vormen van machinaal leren

Wat is het verschil tussen gesuperviseerd en niet-gesuperviseerd machinaal leren?

Onder toezicht versus onbewaakt machine learning

Supervised Learning is de Machine Learning-taak van het leren van een functie die een invoer toewijst aan een uitvoer op basis van voorbeelden van invoer-uitvoerparen. Onbewaakt leren is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens.
Hoofdfunctionaliteit
Bij begeleid leren voorspelt het model de uitkomst op basis van de gelabelde invoergegevens. Bij leren zonder toezicht voorspelt het model de uitkomst zonder gelabelde gegevens door de patronen zelf te identificeren.
Nauwkeurigheid van de resultaten
De resultaten die worden gegenereerd met leermethoden onder toezicht zijn nauwkeuriger en betrouwbaarder. De resultaten die worden gegenereerd door leermethoden zonder toezicht zijn niet erg nauwkeurig en betrouwbaar.
Hoofdalgoritmen
Er zijn algoritmen voor regressie en classificatie in begeleid leren. Er zijn algoritmen voor clustering bij leren zonder toezicht.

Samenvatting - Onder toezicht versus niet-gesuperviseerd machinaal leren

Supervised Learning en Unsupervised Learning zijn twee soorten machine learning. Supervised Learning is de Machine Learning-taak van het leren van een functie die een invoer toewijst aan een uitvoer op basis van voorbeelden van invoer-uitvoerparen. Unsupervised Learning is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens. Het verschil tussen gesuperviseerd en niet-gesuperviseerd machine learning is dat gesuperviseerd leren gelabelde gegevens gebruikt, terwijl onbeheerd leren gebruik maakt van niet-gelabelde gegevens.

Aanbevolen: