| {{ 'ml-lesson-number-slides' | message : article.intro.bblockCount }} |
| {{ 'ml-lesson-number-exercises' | message : article.intro.exerciseCount }} |
| {{ 'ml-lesson-time-estimation' | message }} |
Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.
Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.
I koordinatsystemen visas spridningsdiagram mellan två parametrar.
Vi tittar på diagrammen ett i taget.
A
Diagram A visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten r≈1 som passar bäst.
B
Spridningsdiagram B verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär 0.
C och D
Både C och D visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram D har en starkare korrelation än C, eftersom det visar på en tydligare trend. Därför hör C ihop med r≈-0.85 och D med r≈-1.
Diagram | A | B | C | D |
---|---|---|---|---|
r | ∼185 | ∼085 | ∼-0.85 | ∼-185 |
Kausalitet är ett orsakssamband mellan två korrelerade faktorer där den ena direkt påverkar den andra.
Anta att det finns en korrelation mellan följande parametrar.
Diskutera om det även finns en kausalitet.
Vi går igenom fallen ett i taget.
Skostorlek och antal länder man besökt
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.
Vikt och klädstorlek
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.
Temperatur och antal människor på stranden
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.
Mattebetyg och antal engelskglosor man kan
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.