Kovarianz berechnen


Kovarianz berechnen
Inhaltsverzeichnis
  1. Kovarianz berechnen
  2. Kovarianz am Beispiel erklärt
  3. Formel zur Kovarianz
  4. Kovarianz in Excel bestimmen
  5. Interpretation der Kovarianz
  6. Kovarianz und Korrelation: Unterschied
  7. Kovarianzmatrix

Eine Kovarianz, auch Kovarianz der Stichproben oder empirischen Kovarianz genannt, beschreibt den Zusammenhang zweier metrischer Variablen, die sich aber nur eingeschränkt vergleichen lassen. Die Stärke des statistischen Zusammenhangs zwischen den Variablen ist nicht standardisiert. 


Kovarianz am Beispiel erklärt

Vier Personen machen Angaben zur Entfernung zwischen ihrem Wohn-, Arbeitsort und der Dauer ihres Arbeitsweges. Erstelle eine Tabelle, in der du die Werte zusammenfasst. 
Person 1 2 3 4
Entfernung zwischen Wohnort und Arbeitsplatz in km 10 5 36 16
Dauer des Arbeitswegs in min 15 8 45 23

Es zeigt sich ein positiver Zusammenhang, der aber lediglich die Richtung des Zusammenhangs bestimmt. Für die Stärke und einen Vergleich musst du die Kovarianz erst einmal in einen Koeffizienten der Korrelation umwandeln. 


Formel zur Kovarianz

1.) Bestimme das arithmetische Mittel für jede Variable. 

X = Entfernung Wohnung zum Arbeitsplatz 

X = 10 + 5 + 36 + 16 / 4 = 16,75 

Y = Dauer des Arbeitswegs 

Y = 15 + 8 + 45 + 23 / 4 = 22,75

2.) Abweichungen der Einzeldaten vom arithmetischen Mittel

X1 – X und Y1 - Y
Person 1: 10 km Entfernung – 16,75 (Mittelwert) = -6,75 
Person 1: 15 Minuten Dauer – 22,75 (Mittelwert) = -7,75 

Person2:.....etc. 
 
3.) Bestimme das Produkt aus den Abweichungen: (X1 – X) * (Y1 – Y) 

Person 1: -6,75 * -7,75 = 52,31 etc. 

4.) Bilde die Summe aus den Produkten von 3)

52,31 + Person 2 + Person 3 + Person 4 = …. 

5.) Für die Kovarianz multiplizierst du die Ergebnisse (Endergebnis) aus 4) mit 1 / n-1 

6.) Insgesamt ergibt sich diese Formel zur Berechnung:



Sxy = Kovarianz der Variablen X und Y
n    = gesamte Anzahl der Beobachtungen  
X    = Beobachtungswert Variable X
X1  = arithmetisches Mittel Variable X
Y    = Beobachtungswert Variable Y
Y1  = arithmetisches Mittel Variable Y 


Kovarianz in Excel bestimmen

Mit dem Programm Excel kannst du mit der Funktion KOVARIANZ die Kovarianz zweier Variablen bestimmen. Du musst dafür nur KOVARIANZ oder COVARIANCE schreiben und in den Klammern die Zellen mit den Werten angeben, die du bestimmen möchtest. 

Wenn du für acht Personen die Kovarianz für die „Dauer“ und „Entfernung“ bestimmen möchtest, fügst du in den Klammern C3:J3;C4:J4 ein, um ein Ergebnis zu erhalten. 

Interpretation der Kovarianz

Wenn es für die Kovarianz einen positiven Wert gibt, steigt der andere Wert, wenn eine Variable sich erhöht. Ein negatives Vorzeichen weist auf ein Sinken der anderen Variablen hin, wenn die eine Variable steigt.

Anhand des Beispiels lässt sich erkennen, dass bei einer größeren Entfernung zum Arbeitsort auch gleich die Fahrtdauer ansteigt. Im anderen Fall erhöht sich natürlich die Entfernung. 


Kovarianz und Korrelation: Unterschied

Die Kovarianz ist eine nicht standardisierte Kennzahl, die kaum Vergleiche zulässt. Für eine konkrete Aussage kannst du nach dieser Formel einen Korrelationskoeffizienten ermitteln. 

r = Sxy / Sx + Sy 

Sx und Sy = Kovarianz der Variablen X und Y
sx = Standardabweichung der Variablen X
sy = Standardabweichung der Variablen Y 
r = Korrelationskoeffizient 

Die Korrelation gibt einen standardisierten Wert wieder, den du mit anderen Korrelationen vergleichen kannst. 


Kovarianzmatrix

In der Stochastik hilft die Kovarianzmatrix die Varianz einer eindimensionalen, zufälligen Variablen (Zufallsvariable) auf eine mehrdimensionale, zufällige Variable zu verallgemeinern. Die Elemente auf der Hauptdiagonalen stellen die jeweiligen Varianzen dar. Wenn sich sämtliche Komponenten des Zufallsvektors linear unabhängig verhalten, kann bei der Kovarianzmatrix von einer positiven Definition gesprochen werden.