Mediaan versus gemiddelde (gemiddelde)
Mediaan en gemiddelde zijn maten van centrale tendens in beschrijvende statistieken. Vaak wordt rekenkundig gemiddelde beschouwd als het gemiddelde van een reeks waarnemingen. Daarom wordt hier het gemiddelde als het gemiddelde beschouwd. Het gemiddelde is echter niet altijd het rekenkundig gemiddelde.
Gemiddeld
Het rekenkundig gemiddelde is de som van de gegevenswaarden gedeeld door het aantal gegevenswaarden, d.w.z.
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Als de gegevens uit een steekproefruimte komen, wordt dit een steekproefgemiddelde ([latex]\bar{x} [/latex]) genoemd, wat een beschrijvende statistiek van de steekproef is. Hoewel het de meest gebruikte beschrijvende maatstaf voor een steekproef is, is het geen robuuste statistiek. Het is erg gevoelig voor uitbijters en oscillaties.
Beschouw bijvoorbeeld het gemiddelde inkomen van de inwoners van een bepaalde stad. Omdat alle gegevenswaarden worden opgeteld en vervolgens worden gedeeld, beïnvloedt het inkomen van een extreem vermogende persoon het gemiddelde aanzienlijk. Daarom zijn de gemiddelde waarden niet altijd een goede weergave van de gegevens.
In het geval van een wisselsignaal varieert de stroom die door een element gaat periodiek van de positieve richting naar de negatieve richting en vice versa. Als we de gemiddelde stroom nemen die door het element in een enkele periode gaat, geeft dit een 0, wat betekent dat er geen stroom door het element is gegaan, wat duidelijk niet waar is. Daarom is ook in dit geval het rekenkundig gemiddelde geen goede maatstaf.
Het rekenkundig gemiddelde is een goede indicator wanneer de gegevens gelijkmatig zijn verdeeld. Voor een normale verdeling is het gemiddelde gelijk aan de modus en de mediaan. Het heeft ook de laagste residuen bij het beschouwen van de root mean squared error; daarom de beste beschrijvende maatstaf wanneer het nodig is om een dataset door een enkel getal weer te geven.
Mediaan
De waarden van het middelste gegevenspunt nadat alle gegevenswaarden in oplopende volgorde zijn gerangschikt, worden gedefinieerd als de mediaan van de gegevensset.
• Als het aantal waarnemingen (datapunten) oneven is, dan is de mediaan de waarneming precies in het midden van de geordende lijst.
• Als het aantal waarnemingen (gegevenspunten) even is, dan is de mediaan het gemiddelde van de twee middelste waarnemingen in de geordende lijst.
Mediaan verdeelt de waarneming in twee groepen; d.w.z. een groep (50%) waarden hoger en een groep (50%) waarden lager dan de mediaan. Medianen worden specifiek gebruikt in scheve verdelingen en vertegenwoordigen gegevens redelijk beter dan het rekenkundig gemiddelde.
Mediaan versus gemiddeld (gemiddeld)
• Zowel gemiddelde als mediaan zijn maten van centrale tendens en vatten de gegevens samen. Het gemiddelde is onafhankelijk van de positie van de gegevenspunten, maar de mediaan wordt berekend met behulp van de positie.
• Het gemiddelde wordt sterk beïnvloed door uitschieters, terwijl de mediaan niet wordt beïnvloed.
• Daarom is de mediaan een betere maatstaf dan het gemiddelde in het geval van sterk scheve verdelingen.
• In de standaard, normale verdelingen zijn het gemiddelde en de mediaan hetzelfde.