Les paramètres de tendance centrale : Les moyennes, le mode, la médiane

La synthèse d’une distribution statistique peut se faire de deux manières différentes :

  • Utiliser des tableaux et des graphiques pour faire une synthèse visuelle
  • Fournir un résumé numérique en calculant les paramètres statistiques

Ce chapitre examine les trois paramètres de tendance centrale que sont la moyenne, le mode et la médiane.

Les moyennes

La moyenne arithmétique :

La moyenne arithmétique, également appelée moyenne simple ou moyenne, est une mesure statistique qui est utilisée pour décrire la tendance centrale d’un ensemble de données numériques.

Elle est calculée en additionnant tous les nombres dans l’ensemble de données, puis en divisant la somme par le nombre total de nombres dans l’ensemble.

La formule pour calculer la moyenne arithmétique est la suivante : moyenne = (somme des valeurs ou des observations) / (nombre de valeurs ou des observations).

Formule : La moyenne arithmétique

Par exemple, si vous aviez un ensemble de données contenant les nombres 2, 4, 6 et 8, vous pourriez calculer la moyenne arithmétique comme suit :

Moyenne = (2 + 4 + 6 + 8) / 4

= 20 / 4

= 5

Dans ce cas, la moyenne arithmétique de l’ensemble de données est 5. Cela signifie que 5 est une représentation approximative de la valeur centrale de l’ensemble de données.

Application : variable discrète

Calculer les moyennes arithmétiques des séries suivantes :

Soit la série de notes suivante : 2-6-12-10-12-10-10-6

Soit la série des notes de l’exercice qui peut être présentée de la manière suivante :

xinixini
212
6212
10330
12224
TOTALN=868
Moyenne =68/8=8,5

Application : variable continue

Soit la série suivante statistique de répartition des salariés selon l’âge

Salaireni
[20-25[
[25-30[
[30-35[
[35-40[
[40-45[
[45-50[
8
10
20
25
15
10
Total88
Calculer la moyenne Arithmétique

La moyenne géométrique :

La moyenne géométrique est une mesure de tendance centrale qui est calculée en prenant la racine nème du produit de n nombres.

Elle est souvent utilisée pour représenter la croissance moyenne d’un ensemble de valeurs ou pour calculer le taux de rendement moyen d’un investissement.

Plus formellement, si nous avons n nombres réels positifs x1, x2, …, xn, alors la moyenne géométrique est calculée comme suit :

Moyenne géométrique = (x1 * x2 * … * xn)^(1/n)

Par exemple, si nous avons les nombres 2, 4 et 8, la moyenne géométrique serait :

G = (2 * 4 * 8)^(1/3) = 4

Nous identifions G, la racine nième du produit de xini, comme la moyenne géométrique de la distribution, « (xi,ni)i varie entre 1 et k ».

Formule : La moyenne géométrique

Alors le log de la moyenne géométrique de la distribution {(xi,ni)1≤i≤k} n’est autre que la moyenne arithmétique de la distribution {(ln(xi),ni)1≤i≤k}.

Exemple : calculons la moyenne géométrique de 8, 5, 10

Exemple : calculer la moyenne géométrique de la série statistique suivante :

xinifiln(xi)fi*ln(xi)
210,1250,690,08625
620,251,80,45
1030,3752,30,8625
1220,252,50,625
2,02375
G=e(2,02)=7,5

La moyenne Harmonique :

La moyenne harmonique est une mesure statistique qui est utilisée pour calculer la moyenne d’un ensemble de nombres.

Elle est définie comme l’inverse de la moyenne des inverses des nombres dans l’ensemble. Autrement dit, si vous avez une série de nombres x1, x2, x3, …, xn, la moyenne harmonique est donnée par :

Moyenne harmonique = n / (1/x1 + 1/x2 + 1/x3 + … + 1/xn)

Formule: La moyenne Harmonique 

La moyenne harmonique est généralement utilisée pour calculer des moyennes dans des situations où des valeurs extrêmes ou des valeurs aberrantes sont présentes.

Elle est également utilisée en finance pour calculer des ratios tels que le ratio prix/bénéfice d’une entreprise.

Ainsi, on utilise cette moyenne dans le calcul des durées moyennes et des vitesses et aussi dans le calcul des moyennes de rapports et de pourcentages et dans le calcul de certain indice statistiques…

Il convient de noter que la moyenne harmonique est généralement inférieure à la moyenne arithmétique des mêmes nombres.

Cela est dû au fait que les nombres inverses sont souvent plus grands que les nombres eux-mêmes, et donc, la moyenne harmonique est affectée par les valeurs extrêmes plus que la moyenne arithmétique.

Exemple :

xinini/xi
210,5
620,33
1030,3
1220,16
81,29
G=8/1,29=6,2

La moyenne quadratique :

La moyenne quadratique, notée Q, d’une distribution {(xi,ni)1≤i≤k} est la racine carrée de la moyenne arithmétique de la distribution {(xi2,ni)1≤i≤k}

Elle intervient dans le calcul certains paramètres de dispersion, à savoir les écarts types ou les
variances.

Formule : La moyenne quadratique

Exemple :

xinixi²nixi²
2144
623672
103100300
122144288
8664
G=9,11

Conclusion

Les moyennes quadratique, arithmétique, géométrique et harmonique sont toutes des mesures de tendance centrale qui peuvent être utilisées pour résumer un ensemble de données.

Voici une comparaison des quatre types de moyennes :

La moyenne Arithmétique

La moyenne arithmétique est la plus couramment utilisée et est calculée en additionnant toutes les valeurs d’un ensemble de données et en divisant le résultat par le nombre de valeurs. Elle donne une idée de la « valeur moyenne » de l’ensemble de données.

La moyenne Géométrique

La moyenne géométrique est calculée en multipliant toutes les valeurs d’un ensemble de données, puis en prenant la racine n-ième du produit, où n est le nombre de valeurs. Elle est souvent utilisée pour calculer des taux de croissance ou des rendements d’investissement moyens.

La moyenne Harmonique

La moyenne harmonique est calculée en prenant le nombre de valeurs dans un ensemble de données, en divisant ce nombre par la somme des inverses de chaque valeur, puis en prenant l’inverse du résultat. Elle est souvent utilisée pour calculer des moyennes
pondérées de taux ou de ratios.

La moyenne Quadratique

La moyenne quadratique est calculée en prenant la racine carrée de la moyenne arithmétique des carrés de chaque valeur dans un ensemble de données. Elle est souvent utilisée pour calculer des écarts types ou des variances.

Résumé

En résumé, chaque type de moyenne est utile dans des contextes différents. La moyenne arithmétique est la plus couramment utilisée, tandis que la moyenne géométrique est utile pour calculer des taux de croissance. La moyenne harmonique est utile pour calculer des moyennes pondérées de taux ou de ratios. Enfin, la moyenne quadratique est utile pour calculer des écarts types ou des variances.

Nous constatons que les quatre moyennes valident de manière cohérente l’ordre suivant pour des séries statistiques identiques :

Comparaison des moyennes

La moyenne arithmétique présente l’inconvénient d’être très sensible aux valeurs extrêmes de la série. Celles-ci ont peu d’impact sur la moyenne géométrique. La moyenne harmonique est plus sensible aux petites valeurs de la série qu’à ses grandes valeurs.

Les moyennes : formules

Le mode

 C’est la valeur du caractère le plus fréquent.

Cas d’une variable discrète :

Dans cette situation, le mode peut être rapidement déterminé à partir du tableau statistique ou du graphique (diagramme en bâtons).

Série UnimodaleSérie bimodale
8 ; 9 ; 10 ; 12 ; 12 ; 12 ; 18 M0=122 ; 17 ; 17 ; 17 ; 17 ; 33 ; 33 ; 39 ; 39 ; 39 ; 39 ; 51 M01=17 M02=39
La série multimodale accepte plusieurs modes

Cas d’une variable continue (amplitudes égales) :

Salairesni
10-159
15-2025
20-2532
25-3016
Total82
Détermination de la classe modale (20-25)

On peut prendre comme mode le centre de classe 22,5

On peut chercher à obtenir le mode avec plus de précision :

Détermination algébrique :

Formule : le mode

Cas d’une variable continue (amplitudes inégales) :

SalairesniaiL=ai/arn’i=ni/L
0-5505150
5-1010051100
10-20400102200
20-3012010260
30-506020415
Dans ce cas, l’effectif ni doit être corrigé afin d’obtenir n’i qui constitue la base de détermination de la classe modale et du calcul de M0.
Formule : application numérique algébrique

Détermination graphique :

On détermine le mode à l’aide d’un histogramme

le mode : graphiquement

La médiane (Me) :

La médiane est une mesure de tendance centrale qui divise une distribution en deux parties égales.

Elle correspond à la valeur qui sépare la moitié supérieure des données de la moitié inférieure.

Pour calculer la médiane, il faut trier les données par ordre croissant ou décroissant, puis prendre la valeur centrale ou la moyenne des deux valeurs centrales si le nombre de données est pair.

Par exemple, si on a les données suivantes : 2, 5, 7, 8, 10, la médiane est 7, car elle sépare les valeurs 2, 5 et 7 qui sont dans la moitié inférieure, des valeurs 8 et 10 qui sont dans la moitié supérieure.

Si on a les données suivantes : 2, 5, 7, 8, 10, 11, la médiane est 7,5 car c’est la moyenne des deux valeurs centrales, 7 et 8, qui divisent les données en deux parties égales.

Variable discrète :

Série à un nombre impair

Etape 1 : Classer la série 75 62 57 12 18

Etape 2 : Calculer le rang N+1/2=3

Etape 3 : Me= valeur du rang 3 Me=57

Série à un nombre pair

Etape 1 : Classer la série 12 25 32 44 52 69

Etape 2 : Calculer le 1er rang N/2=3

Etape 3 : Calculer le 2ème rang 1+N/2=4

Étape 4 : Me=la moyenne des deux rangs (32+44)/2= 38

Variable continue :

Salairesni
10-159
15-2025
20-2532
25-3016
Total82
Étape 1 : Déterminer le Rang de la médiane N/2=41

Étape 2 : Déterminer la classe de Me :

Il s’agit de trouver la classe à laquelle appartient le 41ᵉ individu, pour cela, on classe les individus par ordre croissant des salaires, ce qui revient à construire la colonne des effectifs cumulés.
Me ∈ [20-25], on peut calculer avec plus de précision Me en faisant une interpolation linéaire.
Étape 3 : Interpolation linéaire
On connaît les salaires des 34 individus est 20 et les salaires des 66 individus est 25
34<41<66
20<Me<25

Interpolation linéaire (médiane)

Alors 50% de la population ont un salaire inférieur à 21,09 dh et 50% ont en plus

Détermination graphique de la médiane :

On détermine la médiane à l’aide de la courbe cumulative

La médiane : graphiquement

4 commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *