Statistiques descriptives : repères essentiels pour ne pas se tromper
Dernière révision le 2 mai 2026.
Quand on parle de statistiques, on pense d'abord à des chiffres : une moyenne, un pourcentage, une marge d'erreur. Ce qui rend les statistiques utiles, c'est moins le calcul lui-même que le choix de la mesure adaptée à la question posée. Cette page passe en revue les indicateurs descriptifs courants — moyenne, médiane, mode, étendue, écart-type, intervalle de confiance — et explique comment ils s'articulent pour décrire un jeu de données.
Trois questions, trois familles de mesures
Pour résumer une série de valeurs, on cherche typiquement à répondre à trois questions complémentaires :
- Où se situe le « centre » de mes données ? → mesures de tendance centrale (moyenne, médiane, mode).
- À quel point sont-elles dispersées ? → mesures de dispersion (étendue, variance, écart-type, écart interquartile).
- Quelle est la part de hasard dans mon estimation ? → mesures d'incertitude (intervalle de confiance, marge d'erreur).
Donner un seul chiffre — par exemple, « la moyenne est de 25 » — sans accompagner d'au moins une mesure de dispersion ou de taille d'échantillon, c'est presque toujours raconter une histoire incomplète.
Tendance centrale : choisir entre moyenne, médiane et mode
Moyenne arithmétique. Somme des valeurs divisée par leur nombre. Sensible aux valeurs extrêmes : une seule donnée aberrante peut tirer la moyenne très loin de la réalité du « cas typique ».
Médiane. Valeur qui sépare l'échantillon en deux moitiés égales une fois trié. Robuste aux extrêmes : c'est elle qu'il faut privilégier pour des revenus, des temps de chargement, des prix immobiliers.
Mode. Valeur la plus fréquente. Utile pour des variables catégorielles (couleur préférée, taille de vêtement) ou pour repérer un pic dans une distribution multimodale.
Exemple : dans la série [22, 24, 25, 26, 28, 30, 80], la moyenne vaut 33,6, la médiane 26 et le mode n'existe pas vraiment. Selon ce que vous voulez communiquer — la valeur typique ou la somme totale par individu — vous choisirez la médiane ou la moyenne.
Outil : calculateur moyenne, médiane, mode. Pour des notes pondérées d'un bulletin scolaire, voir le calculateur de moyenne pondérée.
Dispersion : la moyenne ne suffit jamais
Deux séries peuvent avoir la même moyenne et raconter des histoires opposées. Comparez [50, 50, 50, 50, 50] et [10, 30, 50, 70, 90] : même moyenne (50), dispersions radicalement différentes.
Étendue. Différence entre la valeur maximale et la valeur minimale. Très simple, mais sensible à un seul outlier.
Variance. Moyenne des carrés des écarts à la moyenne. Mathématiquement pratique mais difficile à interpréter (l'unité est carrée).
Écart-type. Racine carrée de la variance, exprimé dans l'unité de la donnée. C'est la mesure de dispersion à connaître. Pour des données qui suivent une loi normale, environ 68 % des observations se trouvent à moins d'un écart-type de la moyenne, 95 % à moins de deux, 99,7 % à moins de trois.
Écart interquartile (EIQ). Différence entre le troisième quartile (Q3) et le premier quartile (Q1). Robuste aux extrêmes, c'est l'équivalent de l'écart-type pour la médiane.
Outils : calculateur d'écart-type, statistiques descriptives complètes.
Incertitude : échantillon n'est pas population
Quand vous mesurez la satisfaction de 200 clients pour estimer la satisfaction des 50 000 clients de l'entreprise, vous travaillez sur un échantillon. Le résultat obtenu sur cet échantillon est une estimation, pas une certitude. L'intervalle de confiance indique la fourchette dans laquelle se trouve probablement la vraie valeur de la population, à un seuil donné (souvent 95 %).
Plus l'échantillon est grand, plus l'intervalle se resserre — mais pas linéairement. Pour diviser la marge d'erreur par deux, il faut multiplier la taille de l'échantillon par quatre. Le calculateur de taille d'échantillon aide à dimensionner une étude avant de la lancer ; le calculateur d'intervalle de confiance fournit l'intervalle a posteriori.
Le score Z : comparer entre échelles différentes
Le score Z exprime à quelle distance, en nombre d'écarts-types, une valeur se trouve de la moyenne : Z = (x − moyenne) / écart-type. Z = 0 signifie « exactement à la moyenne », Z = +2 signifie « deux écarts-types au-dessus ». Cela permet de comparer des grandeurs qui n'ont pas la même unité (un poids et une note, par exemple) une fois standardisées. Outil : calculateur de score Z.
Les pièges les plus fréquents
Confondre corrélation et causalité. Deux séries peuvent évoluer ensemble sans qu'aucune ne cause l'autre. La hausse des ventes de glaces et celle des coups de soleil sont corrélées : leur cause commune est l'été, pas un lien direct.
Lire la moyenne d'un échantillon biaisé. Si vous interrogez uniquement les clients qui répondent à un questionnaire en ligne, vous mesurez l'opinion des clients motivés, pas celle de l'ensemble. La taille de l'échantillon ne corrige pas un biais de sélection.
Sur-interpréter une différence non significative. Une différence de 2 % entre deux versions d'une page web sur 50 visites peut très bien venir du hasard. Sans intervalle de confiance ni test statistique, on ne peut rien conclure.
Choisir la mauvaise mesure de centre. Communiquer le revenu moyen d'un quartier où vit un milliardaire fausse complètement l'image que se font les lecteurs. La médiane est presque toujours plus honnête.
Oublier les unités et les arrondis. 25,4 et 25 ne sont pas équivalents si l'écart-type est 0,3. Adaptez le nombre de décimales à la précision réelle de vos mesures.
Mini-checklist avant de présenter un chiffre
- Mesure de centre choisie : moyenne, médiane ou mode ?
- Mesure de dispersion accompagnée : écart-type ou EIQ ?
- Taille d'échantillon mentionnée ?
- Intervalle de confiance ou marge d'erreur affichés ?
- Source et période des données précisées ?
- Présence d'éventuelles valeurs aberrantes signalée ?
Pour aller plus loin
Voir aussi : permutations et combinaisons pour le dénombrement, probabilités pour passer du descriptif à l'inférentiel, erreur en pourcentage pour des mesures expérimentales, et la calculatrice scientifique pour les calculs intermédiaires.
Cette page introduit des notions générales et ne remplace pas un cours de statistiques. Pour des analyses sensibles (santé publique, finance), faites appel à un statisticien ou à un méthodologiste.