Hoe te liegen met statistieken
Zoals elke goede waarnemer weet, kunnen statistieken erg verwarrend zijn als je geen voorkennis hebt voor hun interpretatie. Lees de volgende stappen om te leren hoe misleidende en ingewikkelde statistieken te begrijpen en gebruik die kennis als een voordeel.
Inhoud
stappen
Methode 1
Liggen met gemiddelden
1
Begrijp de terminologie. Het woord "gemiddelde" het wordt veel gebruikt bij het bespreken van statistische gegevens. Op het eerste gezicht klinkt de term vrij eenvoudig: het gemiddelde is het bedrag dat min of meer in het midden valt. Er zijn echter verschillende soorten gemiddelden, die allemaal tot fouten kunnen leiden als ze niet goed worden begrepen.de mediaan is het getal in een gegevensverzameling die tussen het laagste en het hoogste aantal ligt. Met dezelfde gegevens als hiervoor (3, 3, 5, 4 en 7) is de mediaan 4, aangezien 2 van de getallen kleiner zijn en 2 groter. de mode het is een weergave van het meest voorkomende nummer in de set. Met hetzelfde voorbeeld is de mode 3, omdat deze twee keer voorkomt.
- de rekenkundig gemiddelde het wordt bereikt door de som van alle getallen in een gegevensverzameling en de verdeling tussen het aantal elementen daarin. Met andere woorden, als je de nummers 3, 3, 5, 4 en 7, het rekenkundig gemiddelde kan worden verkregen door ze (22) en de som te delen door 5 (er zijn 5 getallen in de reeks).
- In dit voorbeeld is het rekenkundig gemiddelde 4,4.
2
Liggen met rekenkousen. Het rekenkundig gemiddelde lijkt misschien het meest onfeilbare van alle hierboven beschreven methoden, maar dat is niet echt het geval. Dit komt omdat abnormaal hoge of lage cijfers in de dataset aanzienlijk kunnen afwijken van het gemiddelde. Om te liggen met een rekenkundig gemiddelde verzamel je perifere data en gebruik je het in de vergelijking.
3
Liggend met medianen De mediaan is in feite het moeilijkste cijfer om te "liegen", omdat het nooit te hoog of te laag kan zijn in vergelijking met de meeste datasets. Het moet noodzakelijkerwijs centraal staan. U kunt de mediaan echter gebruiken om een zeer groot of klein aantal te verbergen. Als de elementen van de set bijvoorbeeld 1, 1, 2, 3, 4, 5, 3000 zijn, is het gemiddelde 3.
4
Liggend met de mode. In bepaalde gevallen is het bijna onmogelijk om met mode te liegen. Het gemiddelde aantal gekochte tickets per persoon voor een balspel zal bijna altijd nauwkeurig worden weergegeven door de mode. Modes kunnen echter ook belangrijke gegevens uitsluiten, vooral in kleinere sets.
5
Liggend met representatieve cijfers. Als u gegevens gedefinieerd door abstracte getallen, in plaats van specifieke nummers (bijvoorbeeld een klanttevredenheidsonderzoek) is beangstigend eenvoudig met die set te liggen. Als je mensen vraagt naar hun tevredenheid te beoordelen op een schaal van 1 tot 3, dat niet per se bewijzen dat klanten die kozen voor 3 zijn drie keer gelukkiger dan degenen die naar 1. Deze koos wordt gebruikt om af te buigen het rekenkundig gemiddelde in in het bijzonder, maar het kan ook worden toegepast op de mediaan en soms zelfs op mode.
Methode 2
Liegen met datasets
1
Gebruik een kleine set Elke expert in statistieken weet dat de enige manier om een nuttig gemiddelde te benaderen of een echte trend te detecteren, is om gegevens te verzamelen van de breedst mogelijke set. Als je informatie van 100 mensen kunt krijgen, is dat goed - 10.000 is nog beter. Hoe meer gegevens u in de set plaatst, hoe nauwkeuriger u bent om nauwkeurige gemiddelden te krijgen. Door een set van bijvoorbeeld 3 of 5 gegevens te gebruiken, kunt u resultaten produceren die de stand van zaken niet goed weergeven.
- Als je bijvoorbeeld ontdekt dat twee mensen die onlangs zijn gekwetst door iets dwaas, zoals een kussen, en ze gebruiken als onderdeel van je dataset, kun je stellen dat kussens categorisch gevaarlijk zijn voor iedereen. Ongeacht het gemiddelde dat u wilt laten zien, zolang het niet onthult dat de steekproef slechts 2 personen omvat, is er geen duidelijke manier om uw claim te weerleggen.
2
Gebruik een gecontroleerde set De meest nauwkeurige datasets zijn niet alleen groot, ze zijn ook breed. Een geoloog het bestuderen van de soorten mineralen in een woestijn zal nauwkeuriger zijn als je veel monsters uit alle hoeken van de woestijn verzamelen, in plaats van het verzamelen van 1000 monsters van dezelfde locatie lijst. Als u de reikwijdte van de gegevensset beperkt, kan dit de resultaten aanzienlijk beïnvloeden.
3
Gebruik een ongebalanceerde set. Deze techniek is heel slim, omdat je kunt liegen met een detail voor de kijker. De truc hier is om gegevens te gebruiken die niet op een eerlijke manier kunnen worden vergeleken en die worden behandeld alsof ze op dezelfde voorwaarden zijn. Bijvoorbeeld, als je een stad van 100.000 die 10 000 inwoners in 10 jaar gewonnen en vergelijken met een bevolking van 10, die 10 bewoners meer in de laatste 10 jaar won, de percentages van elke verhoging lijken aan te tonen dat de kleine stad groeide veel sneller.
Methode 3
Liggen met afbeeldingen
1
Laat de Y-as leeg. Er is geen duidelijker beeld voor de gegevens dan een grafiek of tabel, maar zelfs deze kunnen subtiel worden gemanipuleerd om verschillende effecten te geven. Dit komt omdat mensen de neiging hebben naar de vormen en groottes in de afbeeldingen te kijken voordat ze de moeite nemen om de numerieke details te controleren die daarmee zijn verbonden. De eenvoudigste manier om de Y-as te manipuleren, is deze niet te labelen.
- Als u een set van 5 balken op de X-as hebt, maar geen indicatie van hoe hoog deze is ten opzichte van andere, is er geen manier om te meten of er al dan niet een significant verschil is tussen beide.
2
Gebruik zeer grote of kleine getallen op de Y-as. Zeggen uw gegevensset ligt tussen 1 en 50. Om de verschillen te verbergen, meet de Y-as in stappen van 100 tot doelbewust accentueren meet de Y-as in stappen van 1/10 tienden. Een verschil tussen de 3 en 10 lijkt enorm, gemeten in tienden (Ze worden apart gezet met 70 eenheden!), Maar is nauwelijks merkbaar op een grafiek, waar 100 is de eerste verhoging (Het is veel, veel minder afgelegen dan de eenheid 1! ).
3
Start de Y-as halverwege het bereik. Als de gegevens variëren van 11 tot 51, kunt u het laagste getal er nog lager uit laten zien en het hoogste getal er nog hoger uitzien, uw Y-as labelen zodat deze begint bij 10. Dit maakt de balk die staat voor het getal 11 is nauwelijks hoger dan de X-as, het zal bijna niets lijken tenzij iemand slim genoeg is om heel dichtbij te kijken en te zien dat de kaart begon met 10 in plaats van met 0.
4
Gebruik de ontoereikende schaal. Elke keer dat je de woorden ziet " het is niet op schaal " In de kleine lettertjes is het waarschijnlijk dat u een voorbeeld hiervan bent tegengekomen. Het wordt niet altijd kwaadwillig gedaan, soms zijn de betrokken nummers zo verschillend dat er geen manier is om ze nauwkeurig op dezelfde pagina weer te geven. Het kan echter gemakkelijk worden gebruikt voor ongewenste doeleinden.
5
Gebruik afbeeldingen om gegevens weg te laten. Dit wordt vaak gezien in algemene enquêtes die de resultaten verdelen in bepaalde categorieën, zoals de beroemde grafiek die laat zien wat de meest populaire term is voor een frisdrank in een bepaalde provincie in de Verenigde Staten. Op het eerste gezicht lijkt deze informatie zeer gedetailleerd, maar al snel rijzen de vragen: hoe breed zijn de onderzoeksgegevens? Wat is de drempel om het resultaat te bepalen? Wordt het gemiddelde, de mediaan of de mode gebruikt?
tips
- Controleer in geval van twijfel. Als u geen gedetailleerde en volledige informatie over de grootte, omvang en steekproefmethoden achter een statistiek kunt krijgen, vertrouw dit dan niet.
waarschuwingen
- Het is vrij gemakkelijk om met statistieken te liegen als je eenmaal weet hoe, maar het is niet echt ethisch. Wees voorzichtig met het gebruik van de kennis die je hebt opgedaan. Gebruik het niet om iemand pijn te doen, op te lichten of op te lichten.
Delen op sociale netwerken:
Verwant
- Hoe het gemiddelde en de standaarddeviatie te berekenen met Excel 2007
- Hoe gemiddelden berekenen in Excel
- Hoe een programma in Java te schrijven om het gemiddelde te berekenen
- Hoe het betrouwbaarheidsinterval te berekenen
- Hoe het statistische bereik te berekenen
- Hoe het gemiddelde, de standaarddeviatie en de standaardfout te berekenen
- Hoe het geometrische gemiddelde te berekenen
- Hoe het gemiddelde te berekenen
- Hoe de gemiddelde snelheid te berekenen
- Hoe gemiddelden berekenen (gemiddelde, mediaan en mode)
- Hoe het gemiddelde van een groep getallen te vinden
- Hoe de mediaan van een reeks getallen te vinden
- Basisstatistieken begrijpen en gebruiken
- Hoe statistische significantie te evalueren
- Hoe een doosdiagram te maken
- Hoe mode, mediaan, gemiddelde en bereik te vinden
- Hoe de standaardfout te berekenen
- Hoe de standaarddeviatie te berekenen
- Hoe de gemiddelde afwijking boven het gemiddelde te berekenen (voor niet-geclusterde gegevens)
- Hoe Z scores te berekenen
- Hoe de mode van een reeks getallen te vinden