torsdag, april 15, 2010

Put a number on it

Det har skrivits så mycket bra om vikt, tjockhet, smalhet, hälsa och vårt förhållande till kroppar och mat på sistone. Jag blir alldeles lycklig av att det finns människor som orkar gasta emot reklamidealet. BMI är något slags mått på något, men som med all statistik kan självklart även BMI-begreppet ifrågasättas.

Främst tycker jag att det är fascinerande vad man kan åstadkomma med siffror, bara siffror, och hur normalitet har förvrängts från att vara ett medelmått till att bli det enda ofarliga, det enda att sträva efter, att religiöst vilja tillhöra. Den som inte ligger på kurvan är onormal och onormalitet är tydligen farligt/dåligt omdöme/dödshotande etc etc. Trygghetstörstarna räds det onormala.

Men. I ett starkt dualt samhälle, hej världen, implicerar blotta förekomsten av normalitet även anormala existenser. Detta är det läskigaste som finns och utgör ett hot mot t ex lantisfruar i MQ-kläder (oklart varför.) Normalitet är annars ett ganska trevligt begrepp som talar om ett medel, men man måste dock veta vad man pysslar med för att kunna dra användbara slutsatser. I praktiken behöver inte en enda person utgöra normalfallet, men det kallas normal i alla fall.

Exempel 1: Normalitet och bedrägeri

Betrakta ett urval av 10 fruktkorgar innehållande olika antal äpplen. Korg 1 – 10 innehåller följande antal äpplen:

1: 3

2: 4

3: 4

4: 9

5: 10

6: 2

7: 6

8: 9

9: 2

10: 1

Totalt antal äpplen: 50

Medelantal äpplen per korg: 50/10 = 5

Antal korgar som innehåller normalfallet av äpplen: 0

Nejmen! Nu kanske nån hävdar att det i detta fall hade varit mer värt att prata om medianer, eller att 10 st korgar utgör ett svagt statistiskt underlag, men det är ju precis vad det här problemet går ut på. Det som framställs som fullt normalt är i själva verket ofta sjukt sällsynt.

Vidare måste vi prata om fördelning. En fördelning är en kurva som visar hur det statistiska underlaget sannolikt ser ut. Kurvan för korgexemplet ovan kunde t ex inordnas enligt följande system:

Antal korgar med 1 äpple: 1

Antal korgar med 2 äpplen: 2

Antal korgar med 3 äpplen: 1

Antal korgar med 4 äpplen: 2

Antal korgar med 5 äpplen: 0

Antal korgar med 6 äpplen: 1

Antal korgar med 7 äpplen: 0

Antal korgar med 8 äpplen: 0

Antal korgar med 9 äpplen: 2

Antal korgar med 10 äpplen: 1

En fördelningskurva för detta ser ut så här:




Ur detta kan man tex utläsa att det är lika (o)vanligt att en korg innehåller 5, 7 eller 8 äpplen, men 5 utgör ändå medelantalet. Om man får välja en korg på måfå är sannolikheten störst att man tar en korg med 2, 4 eller 9 äpplen. 9 ligger väldigt långt från medeltalet 5, men ändå är sannolikheten alltså stor att det är en sådan korg som väljs.

Vidare behöver inte ett medeltal komma ur en normalfördelning. Om de 10 korgarna istället innehöll 0, 0, 0, 0, 0, 10, 10, 10, 10 och 10 st äpplen hade medelantalet äpplen per korg fortfarande varit 5, men den underliggande fördelningen hade inte klarat ett normalfördelningstest. Kurvan hade sett ut så här och med största sannolikhet hade inte underlaget kommit ur samma fördelning som för kurva 1. Ändå blir medlet detsamma.

När media blåser upp stora rubriker om medelsvensken hit och dit kan alltså i princip vad som helst ligga bakom. Inte minst ett för litet statistiskt underlag, eller ett som är biased. "Har du slutat slå din fru?" är ett exempel på en fråga som kan tolkas hur som helst. Svarar man ja innebär det implicit att man en gång slagit sin fru. Not good. Svarar men nej, tja, då slår man henne fortfarande. Det är ett löjligt exempel I know, men mycket talande. Problemet handlar om hur siffror behandlas som hårda, oemotsägbara fakta, när de i själva verket är en konsekvens av enkäter författade av idioter och tolkade av idioter. Siffror är alltid siffror, right? Right.

(Vi ska prata om centrala gränsvärdessatsen en annan dag. Just nu låter vi detta sjunka in lite.)


6 kommentarer:

Anonymous Julia sa...

Å vad jag gillar dig just nu.

4/15/2010 5:06 em  
Blogger kai sa...

Yay, matematisk och praktisk statistik! Trycker på "Like"-knappen.

4/15/2010 10:23 em  
Blogger Magnus sa...

Underbart skrivet!

4/17/2010 4:44 em  
Anonymous chris sa...

tack och tack!

4/17/2010 5:07 em  
Anonymous Sanna sa...

Åh, det här gör mig helt glad! Och det är inte bara för att jag precis har läst en kurs i statistik och spenderat halva våren med att dissekera statistiska undersökningar och antaganden man drar av dem. Hurra för dig!

5/01/2010 6:55 em  
Anonymous christina sa...

sanna, vad glad jag blir, tack!

5/02/2010 10:44 fm  

Skicka en kommentar

Prenumerera på Kommentarer till inlägget [Atom]

<< Startsida