Hallo
Ik zit met een probleem omtrent de volgende uitspraak: "Wanneer gegevens uit een linksscheve verdeling komen, dan worden in een boxplot van deze dataset vele observaties als uitschieter aangeduid."
Is dit juist of fout/onvolledig?
Een linksscheve verdeling zegt mij dat er veel 'grote' waarden zijn en weinig 'kleine', als we die verdeling zouden bekijken via een histogram, zien we traag de gegevens "op gang komen" om 'maximaal' te gaan bij de grote waarden... Ik zou dus geneigd zijn om te zeggen dat er veel grote waarden zijn en maar weinig kleine waarden dus dat die kleine waarden 'negatieve uitschieters' gaan geven... Maar er wordt gezegd "vele observaties als uitschieter" dus ik zou zeggen fout... Met als verklaring: het is realistisch dat er uitschieters zullen zijn, maar het zullen er niet veel zijn.
Klopt dit of waar ga ik de mist in?
Alvast bedankt