Så här hittar du korrelationskoefficienten med Excel

Korrelation är en statistisk beräkning för att se om två variabler är relaterade. Vi visar hur du hittar och graverar korrelationskoefficienten med Excel.

Korrelation är en statistisk beräkning för att se om två variabler är relaterade.  Vi visar hur du hittar och graverar korrelationskoefficienten med Excel.
Annons

En av de enklaste och vanligaste statistiska Excel-beräkningarna Så här beräknar du grundstatistik i Excel: En nybörjarhandbok Hur man beräknar grundläggande statistik i Excel: En nybörjarhandbok Microsoft Excel kan göra statistik! Du kan beräkna procentsatser, medelvärden, standardavvikelse, standardfel och studentens T-tester. Läs mer du kan göra är korrelation. Det är en enkel statistik, men det kan vara väldigt informativt när du vill se om två variabler är relaterade. Om du vet rätt kommandon, hitta korrelationskoefficienten i Excel är extremt lätt.

Vi ska ta en titt på vilken korrelation som ska ge dig en uppfattning om den information som den ger dig. Då fortsätter vi att hitta korrelationskoefficienten i Excel med två metoder och ett bra diagram för att titta på korrelationer. Slutligen ska jag ge dig en mycket snabb introduktion till linjär regression, en annan statistisk funktion som kan vara användbar när du tittar på korrelationer.

Vad är korrelation?

Innan vi börjar, låt oss diskutera definitionen av korrelation. Det är en enkel åtgärd av hur saker är relaterade. Låt oss ta en titt på två variabler som inte har någon korrelation alls.

hur man hittar korrelationskoefficienten i excel

Dessa två variabler (en plottad på X-axeln, en på Y) är helt slumpmässiga och är inte nära besläktade.

De två variablerna nedan är emellertid korrelerade:

hur man hittar korrelationskoefficienten i excel

I allmänhet, som en variabel stiger, så gör det andra. Det är korrelation. (Observera att det kan vara tvärtom också, om man går upp och den andra går ner är det en negativ korrelation.)

Förstå korrelationskoefficienten

Korrelationskoefficienten berättar hur relaterade två variabler är. Koefficienten är mellan -1 och 1. En korrelationskoefficient på 0 betyder att det inte finns någon korrelation mellan två variabler. Detta ska du få när du har två uppsättningar slumpmässiga nummer.

En koefficient på -1 betyder att du har en perfekt negativ korrelation: När en variabel ökar, minskar den andra proportionellt. En koefficient på 1 är en perfekt positiv korrelation: när en variabel ökar ökar den andra proportionellt.

Varje tal mellan dessa representerar en skala. En korrelation av .5 är till exempel en måttlig positiv korrelation.

Som du kan se i bilden nedan söker korrelation bara en linjär relation. Två variabler kan vara starkt relaterade på ett annat sätt och har fortfarande en korrelationskoefficient på noll:

hur man hittar korrelationskoefficienten i excel
Bildkrediter: DenisBoigelot / Wikimedia Commons

Hur man hittar korrelationskoefficienten i Excel med hjälp av CORREL

Det finns en inbyggd funktion för korrelation i Excel. CORREL-funktionen har en mycket enkel syntax:

=CORREL(array1, array2) 

array1 är din första grupp av nummer, och array2 är den andra gruppen. Excel spottar ut ett tal, och det är din korrelationskoefficient. Låt oss titta på ett exempel.

I det här kalkylbladet har vi en lista med bilar, med modell och år, och deras värden. Jag använde CORREL-funktionen för att se om modellår och värde var relaterade:

hur man hittar korrelationskoefficienten i excel

Det finns en mycket svag positiv korrelation; så som året går upp, så gör också fordonets värde. Men inte så mycket.

Grafikförbindelser

När du kör korrelationer är det en bra idé att använda en scatterplot för att få en visuell förståelse för hur dina dataset är relaterade. Gå till Diagram> Scatter för att se hur dina data ser ut:

hur man hittar korrelationskoefficienten i excel

Du kan se att bilens år inte påverkar värdet väldigt mycket i dessa data. Det är en liten positiv trend, men det är svagt. Det är vad vi hittade med vår CORREL-funktion.

Ett annat användbart element i en scatterplot är en trendlinje som ser ut så här:

hur man hittar korrelationskoefficienten i excel

Trendlinjen kan vara användbar när du vill göra en korrelation klar i din scatterplot. I Windows klickar du på Diagramverktyg> Design> Lägg till Diagramelement och välj trendlinje . På en Mac måste du gå till Diagramlayout eller Diagramdesign, beroende på utgåvan av Excel.

Och glöm inte att kolla in vår guide för att göra bra diagram i Excel Hur man skapar kraftfulla grafer och diagram i Microsoft Excel Hur man skapar kraftfulla grafer och diagram i Microsoft Excel Ett bra diagram kan göra skillnaden mellan att få din poäng över eller lämna alla dozing av Vi visar dig hur man skapar kraftfulla grafer i Microsoft Excel som kommer att engagera och informera publiken. Läs mer innan du presenterar några resultat!

Korrelera flera variabler med Data Analysis Toolpak

Om du har många olika uppsättningar av siffror och du vill hitta korrelationer mellan dem, måste du köra CORREL-funktionen på varje kombination. Med hjälp av Data Analysis Toolpak kan du dock välja ett antal dataset och se var korrelationer ligger.

Är du osäker på om du har Data Analysis Toolpak? Kolla in vårt genomgång av grunderna Hur man gör grundläggande dataanalys i Excel Hur man gör grundläggande dataanalys i Excel Excel är inte avsett för dataanalys, men det kan fortfarande hantera statistik. Vi visar hur du använder verktyget Data Analysis Toolpak för att köra Excel-statistik. Läs mer för att ladda ner och hänga på det.

För att skjuta upp Toolpak, gå till Data> Data Analysis . Du får se en lista med val:

hur man hittar korrelationskoefficienten i excel

Välj Korrelation och tryck OK .

I det resulterande fönstret väljer du alla dina datasatser i rutan Inmatningsområde och berättar för Excel var du vill att dina resultat ska placeras:

hur man hittar korrelationskoefficienten i excel

Här är vad du får när du slår OK :

hur man hittar korrelationskoefficienten i excel

I bilden ovan har vi kört korrelationer på fyra olika dataset: året, världsbefolkningen och två uppsättningar slumpmässiga nummer.

Varje dataset är korrelation med sig själv 1. År och världsbefolkning har en extremt stark korrelation, medan det finns väldigt svaga korrelationer på annat håll, som vi skulle förvänta oss med slumptal.

Korrelation mot linjär regression i Excel

Korrelation är en enkel åtgärd: hur nära relaterade är två variabler? Denna åtgärd har emellertid inte något prediktivt eller orsakssamband. Bara för att två variabler är korrelerade betyder inte att man orsakar förändringar i den andra. Det är en viktig sak att förstå om korrelation.

Om du är intresserad av att göra ett påstående om orsakssamband måste du använda linjär regression. Du kan också komma åt det här via Data Analysis Toolpak. (Denna artikel kommer inte att omfatta detaljerna om hur linjär regression fungerar men det finns gott om gratis statistikresurser Lär statistik gratis med dessa 6 resurser Lär statistik gratis med dessa 6 resurser Statistik har ett rykte för ett ämne som är svårt att förstå . Men att lära av den rätta resursen hjälper dig att förstå enkäter, valrapporter och dina statistikuppgifter på nolltid. Läs mer som kan gå dig igenom grunderna.)

Öppna Data Analysis Toolpak, välj Regression och klicka på OK .

hur man hittar korrelationskoefficienten i excel

Fyll i X- och Y-intervallet (X-värdet är förklaringsvariabeln och Y-värdet är det värde du försöker förutsäga). Välj sedan var du vill att din produktion ska gå och klicka på OK igen.

Numret som du vill fokusera på här är p-värdet för din förklarande variabel:

hur man hittar korrelationskoefficienten i excel

Om det är mindre än 0, 05 har du ett starkt argument att förändringar i din X-variabel orsakar förändringar i din Y-variabel. I bilden ovan har vi visat att året är en stor förutsägelse för världsbefolkningen.

Linjär regression är också användbar eftersom den kan titta på flera värden. Här har vi använt regression för att se om år och befolkning är viktiga förutsägare för priset på råolja:

hur man hittar korrelationskoefficienten i excel

Båda p-värdena är mindre än 0, 05, så vi kan dra slutsatsen att både år och världsbefolkning är betydande förutsägare för priset på råolja. (Även om starka korrelationer mellan X-variabler kan orsaka egna problem.)

Återigen är det här en mycket förenklad förklaring av linjär regression, och om du är intresserad av orsakssamband, bör du läsa igenom några statistikhandledning.

Men nu har du en uppfattning om hur man går utöver enkel korrelation om du letar efter mer statistisk information!

Få bättre data ut ur Excel

Förstå grundläggande statistiska funktioner i Excel kan hjälpa dig att få mycket mer användbar information från dina data. Korrelation är en enkel åtgärd, men det kan vara en stor hjälp när du försöker göra anspråk på siffrorna i kalkylbladet.

Självklart kan du köra många andra mer komplicerade åtgärder. Men om du inte är bekväm med statistiken vill du börja med grunderna 8 Tips för hur du snabbt läser Excel 8 Tips för hur du lär dig Excel snabbt Inte så bekväm med Excel som du vill? Börja med enkla tips för att lägga till formler och hantera data. Följ den här guiden, och du kommer snart att bli snabb. Läs mer .

Använder du Excels korrelationsfunktionalitet regelbundet? Vilka andra statistiska funktioner vill du lära dig om?

In this article