S T A T I S T I Q U E

MENU



1- Quelques définitions.
2- Exemple 1 moyenne, mode, médiane.
3- Exemple 2: les effets du hasard.
4 - Le bon usage des graphiques .
ACCUEIL

 

Quelques mots. . . . . . .
Les individus composent la population, ensemble sur lequel porte l'étude.
On étudie un caractère particulier de cette population. Il est représenté par une variable ou une modalité que l'on mesure ou observe.
Exemple : Population :         - ensemble des hommes de 30 ans.
                 individu :             - chaque homme de 30 ans.
                 caractère étudié : - le poids.
                 représenté par :    - p .
Comme on ne peut pas effectuer la mesure sur tous les hommes de trente ans pour des raisons économiques . . .
on réalise ces mesures sur un échantillon représentatif de la population étudiée.
Plus l'échantillon, tiré au hasard, est grand, plus les résultats sont fiables.
L'ensemble des mesures ou observatoins constitue une série statistique .

Types de caractères :    
Ils
peuvent être:
    - qualitatifs :
    les modalités du caractère ne peuvent être traduits par une mesure .
    On ne peut que les constater. Exemples : couleur des cheveux, marque d'automobile possédée, sexe, profession.....
    On ne peut calculer une moyenne , de médiane, d'écart type .....
   - quantitatifs :
    ce sont des caractères mesurables , à chaque individu correspond un nombre qui mesure le caractère.Ce nombre est
    appelé " variable statistique ".
    comme la taille, l'âge .....On peut en calculer la moyenne , la médiane, l'étendue , .....

Types de variables statistiques (quantitatives) :
    - Si la variable peut prendre toutes les valeurs à l'intérieur de son domaine de variation, on parle
      de variable quantitative continue : le poids , l' âge , une durée.....
     Comme le nombre de valeurs possibles est très grand (infini), on les regroupe en classes .
    - Si la variable ne peut prendre qu' un nombre limité de valeurs à l'intérieur de son domaine de variation,
      on parle de variable quantitative discrète : nombre d'enfants par famille, nombre d'élèves par classe .....
          
Représentation GRAPHIQUE.
On se sert souvent de diagrammes, ou d' histogrammes ou de secteurs ou de courbes .....pour représenter l' effectif correspondant à chaque valeur, ou classe de valeurs, de la variable.
La borne inférieure de chaque classe est incluse tandis que la borne supérieure est exclue.

Caractéristiques d'un échantillon (variables quantitatives) .
= Caractéristiques de position.
Elles résument une série quantitative par une valeur.
- La Moyenne . arithmétique ou pondérée.....
- La Médiane d'une série : - notion approchée : "La médiane est la valeur de la variable pour l’individu médian".
                                       C' est la valeur qui partage la série statistique en deux parties d' effectifs egaux lorsque les                                        valeurs sont rangées dans l'ordre croissant de la variable, elle correspond à la fréquence cumulée                                        de 50%.(>> une définition rigoureuse est en fait très délicate : il peut y avoir des individus                                        "exaeco",un effectif pair ou impair , des classes ...)
- Le Mode                         - c'est la valeur de la variable qui est la plus fréquente dans la série ; celle qui correspond à                                        l'effectif le plus élevé.
                                       Variable discrète : le mode peut être défini précisément. Exemple : famille aynt deux enfants...
                                       Variable continue : le nombre des observations, souvent regroupées en classes, limite la                                        précision.On définit alors une classe modale .
                                       (Dans le cas d'une série qualitative, on parle de classe modale).
= Caractéristiques de dispersion.
Elles iIndiquent si les valeurs observées sont très dispersées ou très proches les unes des autres.
Plus une série est très "ramassée" autour de sa moyenne, mieux celle-ci représente l'ensemble des observations.
- L' étendue. c'est la différence entre les valeurs extrêmes de la série.
- L' écart type >> sera étudié ultérieurement.

Exemple 1.( d'après "Math 2 de " P.H. Terracher - Hachette- p 182 ).
Lors d'un examen écrit, un correcteur a obtenu les notes suivantes, sur 80 copies :



1) Déterminer la moyenne , la médiane, le mode et l'étendue de cette série.
Pour déterminer la moyenne, on peut procéder de deux façons :
- additionner toutes les notes et diviser le résultat par 80, l'effectif total.
- effectuer le calcul : où x1 est une note et n1 l'effectif correspondant à cette note et
n = n1+ n2 + . . . . est la moyenne pondérée des notes obtenues. Résultat : = 9,8/20.
Il est plus commode de ranger les notes dans un tableau du type suivant :

On calcule alors la somme des produits (note x effectif correspondant) que l'on divise par le nombre total de notes
(ici : 80).
Pour déterminer la médiane, on se sert du tableau précédent en le complétant par la ligne des effectifs cumulés
et par la ligne des fréquences cumulées correspondantes.
On constate que 46% des copies on obtenu 9/20 ou moins et que 60% des copies ont obtenu 10/20 ou moins.
"l'individu médian", repéré par la fréquence cumulée de 50 % se situe donc dans la note 10/20.(Mais on ne pourra individualiser la copie correspondante : il y a 11 notes égales à 10/20. Il s'agit d'une classe médiane).
Le mode est égal à 11/20 : c'est la note la plus fréquente : 12 élèves l'ont obtenue.
L' étendue est de 18 - 4 = 14 points.
2) Représentation graphique .





ATTENTION PIEGES !!!

Exemple 2

                                                                      Les effets du HASARD

Influence du nombre d'observations sur les résultats :
On lance un dé de nombreuses fois et on note la valeur obtenue. Deux expériences sont réalisées :
l' une avec 50 lancers ;
l' autre avec 500 lancers (avec le même dé) .
Théoriquement, la fréquence sortie d'une face est de 100 : 6 16,667 % .
En fait, on a obtenu l
es résultats qui sont portés dans le tableau de valeurs ci-dessous.
Peut-on dire si le dé est "pipé" ?
Après 50 lancers, la face 3 apparaît dans 28% des lancers, tandis que la face 6 n'apparaît que dans 6% des lancers !!
On pourrait penser que le dé est déséquilibré en faveur du 3 .
En fait, au bout de 500 lancers, on constate que les fréquences d'apparition des faces se resserrent nettement.
L'étendue passe de 22% à 6 %.Avec 2000 lancers, on "tombe" à une étendue de 1%.à 4% .....
Une série de 50 lancers, c'est très insuffisant !!!!!
TABLEAU DE VALEURS
REPRESENTATION GRAPHIQUE.


Du Bon Usage des Graphiques . . . . . . . ou Comment sauver les apparences . . . . . . . . . .
TOTO n'est pas nul, mais il est à la peine . . . ..Il a choisi de présenter ses résultats trimestriels sous forme d' un graphique .
C'est important pour Noël . . . . .
Quel graphique lui conseillez vous ? :

                Celui - ci ????                                                                               ou celui - la ?????
     



. . . . . . Bien sur , ce sont les mêmes notes ! ! ! ! ! Mais l'échelle des notes est très différente .