Recherche chaud: larachide et lacide urique cephalex perruche escalier pour maison de poupee infection urinaire et ganglion chien nourriture pour poupee alive comment faire frire des oignons quest ce quun analyste projet métrique poésie tétramère
Index Loisirs Santé Technologie

Comment calculer la covariance

Publié:2012-12-28Source: général
Advertisement

Trois parties: covariance Cheat SheetUsing standard covariance FormulaUsing covariance Valeurs

Covariance est un type de valeur utilisée dans les statistiques pour décrire la relation linéaire entre deux variables. Le supérieur de la covariance entre deux variables, le plus étroitement leurs valeurs suivent les mêmes tendances sur une gamme de points de données (en d'autres termes, les courbes des moins les deux variables dévient de l'autre). En général, la covariance de deux séries de valeurs x et y peut être trouvé avec la formule 1 / (n -1) Σ (x i - x avg) (y i - y avg), où n est égal à la taille de l'échantillon, x i est égal à la valeur de chaque point x, x moyen égal à la moyenne des valeurs de x les points, et ainsi de suite pour y i et y avg.

Étapes

Covariance Cheat Sheet

Comment calculer la covariance

Covariance Diagramme

Partie 1 de 2: Utilisation standard covariance formule

Ancien fichier pas une ressource

1

Organisez vos données dans une gamme de (x, y) points. Tout ce que vous devez calculer la covariance est un ensemble de points de données pour les deux variables x et y. Si vous travaillez avec des données à partir d'un graphique, vos données viendront du (x, y) paires de coordonnées des points sur le graphique; contraire, les données viendront de trouver des paires de valeurs correspondantes pour vos variables mathématiquement.

Prenez note du nombre de paires x / y. Ce sera '' n '', votre taille de l'échantillon, qui est nécessaire pour résoudre la formule de covariance.

A titre d'exemple, disons que nous courons un épicerie et que nous essayons de déterminer si oui ou non le nombre de coupons nous donnons a un effet sur les ventes. Nous pouvons définir x que le nombre de coupons donnés sur un jour donné et y comme le nombre de ventes pour ce jour-là.

Pour plus de commodité, nous allons utiliser la table dans l'image ci-dessus comme référence - en d'autres termes, le premier jour nous avons donné à x = 1 coupon et a dû y = 8 ventes, le deuxième jour, nous avons donné x = 3 coupons et avaient y = 6 ventes, et ainsi de suite.

Ancien fichier pas une ressource

2

Trouver la moyenne des points de x. Une fois que vous avez une gamme de x / y paires, résoudre l'équation de covariance ne nécessite pas réellement que beaucoup de travail. Pour commencer, trouver le moyen de vos valeurs x. Vous pouvez le faire en ajoutant les valeurs de x et en divisant par le nombre de valeurs (voir notre guide sur la recherche des moyennes pour des instructions détaillées.)

Dans notre exemple, nous pourrions trouver le moyen de nos valeurs x en ajoutant les valeurs dans la colonne «x» dans le tableau ci-dessus et en divisant par le nombre de valeurs de la colonne. Ajout de 1 + 3 + 2 + 5 ..., nous obtenons un total de 44. divisant par 9, le nombre de valeurs de x, nous obtenons 44/9 = 4,89 x comme notre moyenne. Voir ci-dessous:

+ 1 + 3 + 5 2 + 8 + 7 + 12 + 4 + 2 = 44
44/9 = 4,89

Ancien fichier pas une ressource

3

Trouvez la moyenne des points y. Ensuite, trouver le moyen de tous les points y. Ceci est fait exactement la même que pour les points de x: ajouter les valeurs y ensemble, puis divisez par le nombre de valeurs.

Dans notre exemple, nous aimerions ajouter 8 + 6 + 9 + 4 ... pour obtenir un total de 49. divisant par le nombre de valeurs (qui est la même que pour x), nous obtenons 49/9 = 5,44 comme notre Y moyenne. Voir ci-dessous:

+ 6 + 8 + 9 + 3 + 4 + 2 + 3 + 7 = 49 7
49/9 = 5,44

Ancien fichier pas une ressource

4

Branchez vos variables dans la formule 1 / (n -1) Σ (x i - x moyenne) (y i - y moyenne). Notez le sigma (Σ) dans la formule - cela signifie que vous aurez besoin de soustraire la moyenne de x de tous les x valeur individuelle et les mélangent (puis faire de même avec la moyenne de y et chaque valeur y individuel). Cela peut conduire à de longues chaînes de problèmes de soustraction, donc enregistrer vos valeurs avec soin pour éviter une erreur.

Dans notre exemple, nous pourrions résoudre comme suit:

1 / (n -1) Σ (x i - x moyenne) (y i - y avg)

(1/8) (((1 - 4,89) + (3 - 4,89) + (2 - 4,89) + (5 - 4,89) + (8 - 4,89) + (7 - 4,89) + (12 - 4,89) + ( 2 - 4,89) + (4 - 4,89)) ((8 - 5,44) + (6 - 5,44) + (9 - 5,44) + (4 - 5,44) + (3 - 5,44) + (3 - 5,44) + (2 - 5,44) + (7 - 5,44) + (7 - 5,44))

(1/8) ((- 0,01) ((8 - 5,44) + (6 - 5,44) + (9 - 5,44) + (4 - 5,44) + (3 - 5,44) + (3 - 5,44) + (2 - 5,44) + (7 à 5,44) + (7 à 5,44))

(8.1) (- 0,01) (0,04) = 0,00005

Comme nous le verrons ci-dessous, notre réponse de 0,00005 est très proche de zéro, alors cela signifie que le nombre de coupons nous donnons a pratiquement aucun effet sur ​​le nombre de ventes que nous faisons à l'épicerie.

Partie 2 de 2: Utilisation de covariance Valeurs

Ancien fichier pas une ressource

1

Une covariance de 1 indique une corrélation positive parfaite. Quand il vient à covariances, vos réponses sera toujours entre 1 et -1. Toute réponse dehors de cette plage signifie qu'il ya eu une sorte d'erreur dans le calcul. Basé sur la proximité de votre covariance est à 1 ou -1, vous pouvez tirer certaines conclusions au sujet de votre ensemble de données. Par exemple, si votre covariance est exactement 1, cela signifie que vos variables ont une corrélation positive parfaite. En d'autres termes, quand on augmente variable, la seconde augmente, et quand on diminue les autres diminutions. Cette relation est parfaitement linéaire - peu importe comment haute ou basse variables obtiennent, ils auront la même relation.

Comme un exemple de ce genre de covariance, nous allons examiner le modèle d'affaires simple d'un stand de limonade où nous vendons chaque limonade à 3 $. Si x représente le nombre de limonades vous vendez et y représente l'argent que vous faites, y aura toujours augmenter avec x dans cet exemple. Voir ci-dessous:

Dix limonades vendus: x = 10, y = 30 $
Une centaine de limonades vendus: x = 100, Y = 300 $
Un million de limonades vendus: x = 1.000.000, 3.000.000 $ y =
Peu importe à quelle hauteur la valeur de notre x obtient, nous verrez toujours ce même relation exacte - y sera égal à 3 (x). Par conséquent, nous pouvons dire que x et y ont une corrélation positive parfaite, ou, en d'autres termes, une corrélation de 1.

2

Une covariance de -1 indique une corrélation négative parfaite. D'autre part, si votre covariance est -1, ce qui signifie que vos variables sont corrélées négativement parfaitement. En d'autres termes, une augmentation de l'un entraîne une diminution de l'autre, et vice versa. Comme ci-dessus, cette relation est linéaire. La vitesse à laquelle les deux variables se développent les unes des autres ne change pas avec le temps.

Comme un exemple de ce genre de corrélation, disons que nous sommes en charge de l'huile de forage d'un seul puits qui contient environ 10.000 barils de pétrole. Si x est égal à les barils de pétrole que nous avons déjà foré et y est égal au nombre de barils restants dans le puits, nous pouvons dire que tant que x augmente, y va diminuer. En d'autres termes, il n'y a aucun moyen que le pétrole va magiquement réapparaître dans le puits - une fois qu'il est parti, il a disparu. Voir ci-dessous:

Un baril percé: x = 1, y = 9,999.
Deux mille barils percés: x = 2,000, y = 8,000.
Dix mille barils percés: x = 10 000, y = 0.
Comme notre valeur de x augmente, la valeur de notre y diminue à un rythme régulier. La relation est linéaire - chaque baril supplémentaire foré signifiera toujours un de moins baril dans le sol. Par conséquent, nous pouvons dire que x et y ont une corrélation négative parfaite, ou, en d'autres termes, une corrélation de -1.

Ancien fichier pas une ressource

3

Sachez que une covariance de 0 indique pas de corrélation. Si votre covariance est égal à zéro, cela signifie qu'il n'y a aucune corrélation entre les variables. En d'autres termes, une augmentation ou une diminution de l'un ne causeront pas nécessairement une augmentation ou une diminution de l'autre avec toute prévisibilité. Il n'y a pas de relation linéaire entre les deux variables, mais il pourrait encore être une relation non linéaire.

Comme un exemple de ce genre de corrélation, nous allons examiner le cas de quelqu'un qui prend un remède homéopathique pour une maladie virale. Si x représente la dose du remède pris (en cuillères à café) et y représente la charge virale dans le sang de la personne (en unités internationales par millilitre (UI / mL)) nous ne serions pas nécessairement attendre Y pour augmenter ou diminuer quand x augmente. Plutôt, toute fluctuation y serait complètement indépendant de x. Voir ci-dessous:

Une cuillère à café pris: x = 1, y = 615.
Dix cuillères à café pris: x = 10 y = 700.
Vingt cuillères à café prises: x = 20, y = 455.
Comme notre valeur de x augmente, nous ne pouvons pas vraiment prédire si y va augmenter ou diminuer en réponse. La relation est pas clair - prenant parfois plus de remède provoque une diminution de la charge virale, alors que parfois, il provoque une augmentation. Par conséquent, nous nous attendons à ce que x et y aurions corrélation proche de zéro.

Ancien fichier pas une ressource

4

Sachez que l'autre valeur comprise entre -1 et 1 indique une corrélation imparfaite. La plupart des valeurs de covariance ne sont pas exactement 1, -1 ou 0. Habituellement, ils sont quelque part entre les deux. Basé sur comment fermer une valeur de covariance est donnée à l'un de ces critères, vous pouvez dire qu'il est plus ou moins corrélée positivement ou négativement corrélée.

Par exemple, une covariance de 0,8 indique qu'il ya un degré élevé de corrélation positive entre les deux variables, mais pas une corrélation parfaite. En d'autres termes, quand x augmente, y augmentera généralement, et comme x diminue, y seront généralement diminuer, bien que la relation ne peut pas être parfaitement stable. "

Merci pour ton aide! S'il vous plaît nous dire ce que vous savez à propos de

...

Vidéo

Conseils

Voir nos articles sur les diagrammes de dispersion et les coefficients de corrélation pour des informations connexes.

Équations de covariance sont souvent utilisés pour comparer les stocks - investisseurs comme être en mesure de dire si deux stocks sont susceptibles de fluctuer les unes aux autres ou non. Pour le trouver, tout ce que vous aurez besoin est un graphique qui compare les routines quotidiennes de deux stocks sur une plage de dates. Voir ci-dessous:

Société A (x): (1,6 + 1,9 + 2,1 + 3,2 + 0,5 + 0,4 + 0,6) / 7 = 1.47
Société B (y): (2,0 + 2,4 + 2,6 + 3,6 + 0,9 + 0,8 + 1,0) / 7 = 1,9

(1 / n -1) (Σ (x i - x moyenne) (y i - y avg)

(1/6) (((1,6 - 1,47) + (1,9 - 1,47) + (2,1 - 1,47) + (3,2 - 1,47) + (0,5 - 1,47) + (0,4 - 1,47) + (0,6 - 1,47)) ( (2,0 à 1,78) + (2,4 à 1,78) + (2,6 à 1,78) + (3,6 à 1,78) + (0,9 à 1,78) + (0,8 à 1,78) + (1,0 à 1,78))

(1/6) ((0,01) (0,84))

(1/6) (0,084) = 0,14.

[Rédacteur: Admin]
Je vous imagine comme

Articles recommandés

Cliquez Top Ranking