IMQ -introduction méthodes quantitatives
Chap. 1 : Vocabulaire
I- Vocabulaire intro. Concernant les chiffres des données statistiques, grâce aux quels on analyse des chiffres/données. Sachant que comme nous somme dans une société où les données/infos sont de plus en plus numérisées qui peuvent définir les variables servant a voir qu’aujourd’hui un certain nombre de personnes ont des difficultés par rapport à la captation des infos car d’un part il on des problèmes par rapport à la conceptualisation des chiffres et d’autre part parce qu’ils ont des problèmes de numérisation et enfin aussi parce que d’autres gens n’ont pas les moyens d’utiliser les outils permettant de comprendre les données, informations numérisées. Ce cour a pour objet de nous familiariser, à nous amener à voir les avantages mais aussi les limites de la numérisation des infos et à nous donner des concepts permettant d’analyser des données sous formes de chiffres. Ex : Pour la sécurité sociale : 1- pour les hommes. 2- pour les femmes. Numérique : Amène une information plus précise en complétant à l’aide de chiffre. Ex : l’utilisation des pourcentages. Le piège c’est de faire des suppositions par rapport au complément qu’on peut apporter. Cette précision par les nombres peut entrainer une forte imprécision dans l’interprétation. La maitrise des outils Mathématiques permet d’analyser des données chiffrées.
1. Différence entre chiffres et nombres Concept (Il y a par exemple 1000 soldats qui avancent dans la plaine). Info numérisée. Mais pour parler de ce nombre, il faut des signes un vocabulaire. Donc pour désigner des nombres on a inventer des chiffres qui servent à représenter les nombres, et pour représenter ce dernière il valait mieux utiliser u n petit nombre de signes permettant de représenter des nombres. Pour ne pas avoir à connaître tous les signes on a inventé les chiffres. Nous sommes dans un système ou on utilise 10 chiffres. sentent les nombres qui eux sont des concepts.
Sachant que ce système cohabite avec un système binaire (transmission de donnée à base 2) Cela permet de désigner des concepts très différents d’om l’importance dans leur transmission du numérique.
Avantage : nuances quasi infinie c’est d’arriver à désigner un très grand nombre de nuance. 2. Vocabulaire Variable : Caractéristique que partage les individus formant la population étudiée ( un seul individu n’est pas une variable). Elle peut aussi prendre des modalités différentes. Les modalités peuvent être désignées par des valeurs numérisées ce qui fait qu’aujourd’hui on dira qu’une variable a des modalités lorsqu’elle désigne des états qui n’ont pas été numérisés et quand elle est désigné de manière numérisé on parle de valeur.
Ex : Etude de la taille des individus dans une population. Taille : caractéristique de tous les individus. Elle est considéré comme une modalité si elle définit un taille moyenne, mais elle sert de valeur si la taille est désigné par la hauteur, un nombre représenté avec des chiffres.
IMQ -introduction méthodes quantitatives
Variables : Données présentées sous forme numérique sont couramment utilisées aujourd’hui et donc nécessite des systèmes de classement et de stockage de plus en plus sophistiqué qui entraine un phénomène que est l’accès au informations stockées. Ex : DMP : dossier médicale personne O. Toutes les données sont numérisées et transmises à distances. Il faut beaucoup de nombre binaire pour arriver à numériser. Il faut une grosse capacité de stockage ce qui est couteux. Effectif : Représente le nombre de personnes qui compose une population, sont à mesurer la taille de la population.
Effectif de la modalité : Nombre d’individu présentant la même caractéristique. La somme des effectifs de chacune des modalités doit être égale à l’effectif total. Série statistique : Le distribution des effectifs de chacune des modalités. Si il y a 30 petits, 50 moyens et 30 grands, la série sera 30, 50,30. Mais si la taille est désigné par des nombres il peut y avoir des confusions… Fréquence : On calcule les fréquences d’une série lorsqu’on veut la comparer à une série analogue portant sur des effectifs différents. Les fréquences sont obtenues en calculant la proportion de l’effectif de chaque modalité dans l’effectif total de la population étudiée. En cela il suffit de diviser chaque effectif de chaque modalité par l’effectif total. Ex : On étudie le niveau des revenus dans un pays des contribuables classé en pauvre, moyen, et riche. On veut faire une comparaison avec les données nationales. Pour avoir une vraie idée, il faut comparer des proportions. Pour mieux comparer les structures de 2 populations différentes mais entre lesquelles on essaye de comparer des modalités (identiques). Ex : Monaco : 20 miles riches en France 20 millions.
Si on compare les deux nombres on va dire qu’il y a plus de riche en France mais on peut aussi sous entendre que Monaco est plus pauvre. Pour éviter cela, intervient un calcule de
2000/22000 : 0.09 8/60 : 0.13 18/22000 : 0.82
50/60 : 0.8 2000/22000 : 0.09 -> 9% de riche à Monaco. 2/60 : 0.03 -> 3% de riches en France
Les fréquences sont exprimées par des nombres compris entre 0 et 1.
La somme des fréquences doit être égale à 1. Rappel : Cas 1 : on connaît le pourcentage de l’effectif total (fréquence cumulée) on dit on ne connaît pas l’effectif d’un modalité particulière de sa série.
Ex : 40 miles habitants dans une ville, 45% de la population a un revenu moyen. Quel est l’effectif de cette modalité. X : x/400000 = 45/100. X = 40 000 x 45/ 100
IMQ -introduction méthodes quantitatives
X= 18 000.
Cas 2 : On connaît l’effectif d’une population après une augmentation d’un certain degré mais on voulait connaître l’effectif avant l’augmentation Ex : Population de 20 000 habitants mais on sait que ces 10 dernières années, la population à augmenté de 15% On cherche donc en définitive 115% de l’effectif initial 20 000 : x x 1.15 X = 20 000/1.15 = 17 391
Notation de variables et leurs modalités : x, y, z. Les différentes modalités de chaque variable sont désignées par un indice généralement i, j, k. Xi désigne l’indice i de la variable X. Xi = Monaco
Yi : France. I : Indice représentant le niveau du revenu. I1 : Les pauvres. I2 : Les moyens. I3 : les riches. Difficultés si l’indice commence à la valeur 0 et parfait ça peut commencer à la valeur 1 pour indiquer le début de la série. Les variables peuvent prendre plusieurs modalités et on peut donc mesure des effectifs de deux modalités rassemblées. Ex : on étudie la taille des français par département
X : taille des français par départements. Xi, j où i : La taille en mètre et j : le département. 1 : entre 1.20 et 1.30 2 : 1.30 et 1.40
X1, 64 = 12630. Les variables à doubles indices peuvent avoir leur série (i.e. effectif de chacune de leurs
N3, 2 i =3 et j = 2.
Addition des valeurs d’une variable : l’addition des valeurs d’une somme affecté à son sommet et à sa base la valeur des indices indiquant les effectifs de chacune des modalités. I=3Σi=1 = X1+X2+X3
L’addition des effectifs des modalités peut être pondéré par l’effectif des modalités.
I=3 Σais. i=1 ni xi : Somme totale de la taille des franç
Avertissement : Dans l’addition des variables il y 1 erreur fréquente, c’est celle venant du fait que les modalités sont regroupées en classes dans la présentation des données.
IMQ -introduction méthodes quantitatives
Ex : Tableau indiquant le revenu annuel des français par tranche d’âge depuis 1980
10 x (150+ 600+ 2000). II- Des variations d’une variable
Variables numériques dont les modalités sont des valeurs. Quand une variables passe donc d’un valeur à une autre elle connaît une variation.
1. Les différents types de variations.
Si une variable passe de la valeur 9 à la valeur 12 l’écart est 3, il définit ce qu’on appel sa variation abs, on l’appel aussi écart absolu. Mais les variations abs sont généralement peu parlantes. Pour mieux apprécier les écarts on les traites en valeur relative (en nombres significatifs)
Une variable peut être à l’augmentation ou à la baisse. Pour établir et mesurer une variation relative d’une variable par rapport a elle même on divise la valeur de la variable obtenu après la variation par la valeur initial de la variation c’est à dire la comparaison se fait toujours par rapport à la valeur initial (difficulté de définir la variable initiale)
On obtiendra un nombre supérieur à 1 si la variable augmente et inférieur à 1 si la variable diminue. Le nombre obtenu serai entre 1 et 2 si la variable a augmenté mais n’a pas doublé, supérieur à 2 si elle a plus que doublé, et supérieur à trois si elle a plus que triplé.
Accroissement des variables en % : Ex : une variable passe de 124 à 178 la variation relative peut être mesurée en faisant 178/124 = 1.43. Donc la valeur I à été multiplié par 1.43.
La valeur passe de la valeur 178 à 136 la valeur finale devient valeur initiale. La valeur relative est 136/178 : 0.76 On a donc un nombre inférieur a 1 ce qui montre que la variable à diminué et indique aussi que la Vi a été multiplié par 0.76 pour arriver à la VF.
a. Les pourcentages. Lorsque dans le 1er exemple comme dans le 2nd on a divisé la VF par la VI on a considéré que la valeur initiale correspondait a la valeur 1 dans le 1er cas. On considère que 124 correspondait au nombre 1 et que la VF correspond a 1.43. 178 et associé a la valeur 1.43. On évalue encore mieux des variations en % qu’en pour un. Pour aller direct des niveaux de l’accroissement des % on multiplie le résultat par 100, si le nombre est en accroissement on retranche par 100 pour obtenir l’accroissement en % de l’écart absolue. Autrement dit 178 représente 143% de 124 et l’écart entre 178 et 124 représente 43% de 124. b. Les indices Ils consistent à relativiser une variable en se référant à une variable initiale qu’on a considéré = à 100. Et en exprimant les autres valeurs par rapport à cette base.
IMQ -introduction méthodes quantitatives
Ex : On passe de 136 à 178 et on considère que 136 est la base 100. Pour exprimé 178 en base 100 il faut divisé 178 pat 136 et multiplier le tout par 100 (130,88). Les taux de variation : Ils expriment la proportion de variation d’une variable par rapport à la valeur précédente l’appréciation la plus primaire de la variation relative se fait en divisant VI par VF on obtient du pour un. Or le nombre obtenu, les valeurs supérieures à 1 définissent le taux d’accroissement.
Ex : On passe de la valeur 110 à la valeur 136. 136/110 : 1.2363 ce qui signifie que 136 est 1.23 fois plus grand que 110. Le 0.23 représente le taux d’accroissement entre la valeur 110 et 136. On le multiple par 100 pour obtenir le taux d’accroissement en pourcentage. Ex : VI d’un placement de 1000€ à un taux d’accroissement de 5% par an pendant 2 ans. Calculer VF. 5%= 0.05. 1000 x 1.05 : 1050. Année 2 : 1050 x 1.05 : 1102.50.
On peut aussi écrire 1000 x1.052.
VF : V annuelle (1+r) n.
X1 : 126 x (1.21) = 152.46 « pour un ».
X2 : 126 x 1.21 x (1-0.17) = 126, 54 Taux de variation cumulé : 126 x (1 +0.21-0.17+0.11+0.38) III- Variation semi-logarithmique
Ces variations permettent de travailler sur des variable que prennent très rapidement des grandes valeurs (augmentent de manière exponentielle). Ce qui donne des représentations où généralement les petites valeurs initiales sont écrasées cela peut aussi donner des valeurs finales de série qui ne peuvent pas être représentées sur le graphique.
Pour pouvoir mieux représenter ces variables on utilise ce que l’on appel des repère semi logarithmique. Qui permettent d’utiliser les propriétés des logarithmes. Les repères sont construits en plaçant sur l’axe des abscisses la valeur des indices de la variante et en ordonnée on place la valeur logarithmique de la valeur de la variable.
Les fonctions logarithmes établissent une relation entre un nombre et l’exposant qui permet d’exprimer ce nombre comme la puissance d’un autre nombre. X= a y avec y =log x X associé à y tel que x = a log y
Propriété des logarithmes : Log a t= t log a. Log Xi : Log Xi (1+r) t => Log Xi (1+r)t = Log Xi / t.
IMQ -introduction méthodes quantitatives
IV- Les moyennes 1. Les valeurs arithmétiques Elle est d’apparence courante, simple mais dont l’usage peut être trompeur. Pour l’obtenir on additionne toutes les différentes valeurs de la variables et on divise par le nombre d’observation de cette variable. Ex : Un étudiant a passé 3 épreuves : E1 : 12 E2 : 14
E3 : 16. 12+14+16 /3 = 14 = moyenne arithmétique. Remarque : cout moyen marginal. On sait que la moyenne commence à baisser quand la dernière valeur lui est inférieure. Ce qui signifie que la moyenne ne baisse pas forcément quand diminue les valeurs de la variable. Dire que la moyenne diminue parce que la variable diminue peut être trompeur. Ex : Etudiant, 1ère note de 10 sa moyenne est de dix. E2 : 14 la moyenne sera a 12
E3 : 13 moyenne augmente 12, 33. 2. Moyenne arithmétique pondérée Chaque valeur de la variable est affectée d’un nombre qui est appelé coefficient de pondération qui est égal au nombre de fois que la variable prend cette valeur. Ex : Etudiant : 12, 14, 16, 12, 13, 12, 16. (3 x 12) + 13+ 14+ (2 x16) /7 = 13.57.
n= somme des coefficients de pondération Bi : coefficient de pondération Ai : valeur de la variable B1A1 + B2A2…. + BNAN / BN
Propriété des logarithmes : 1 : Si on ajoute un même nombre à toutes les valeurs d’une série, la moyenne pondérée se trouve augmenté du même nombre. 2 : Si on multiplie par un même toutes les valeurs d’une série la moyenne arithmétique pondérée se trouve multipliée par ce nombre. Ex : On multiplie par 100 toutes les observations, la moyenne sera elle aussi multipliée par 100. Ce principe permet d’obtenir les mêmes résultats si on change des unités de mesures.
Ex : on observe la longueur de poutrelles qui sortent de machine. On observe que dans la minute sont sorties trois poutrelles de 2m, 4 poutrelles de 3m, et 6 de 5m. (3 x 2) + (4 x 3) + (5 x 6) /13 : 3m69. On veut changer, l’unité de valeur en cm, on multiplie par 100 toutes les données et on tombe sur 369 cm en moyenne. 3. Les pièges de la moyenne arithmétique Ils viennent de l’imaginaire que l’on a de la moyenne celui qui donne la moyenne n’est pas forcément le trompeur.
IMQ -introduction méthodes quantitatives
Ex : Dans une entreprise, la moyenne des salaires est le double de la moyenne générale. Supposons qu’il soit 100 à travailler et que parmi c’est 100 99 ont un salaire de 1000 et 1 un salaire de 101 miles euros donc la moyenne des revenus et de 200 000 € et le salaire moyen de 200 000 /100 : 2 000 €. Or dans cette entreprise la quasi totalité sont payés 1000€.
Pour éviter ceci on utilise la notion de médiane. Elle est le nombre qui est surpassé par la moitié de la valeur de la série. C’est la valeur qui est associé à la moitié des effectifs lorsque ceux ci sont rangés par ordre croissant de la variable.
Ex : l’ensemble des nombres entiers rangés de 0 à 1000 admet pour médiane 500. Ce n’est donc pas la moyenne arithmétique. Ex : dans une entreprise, il y a 10 salariés, qui perçoivent un salaire montant de 1000 en 1000. 1000+2000+3000+4000+5000 (médiane) + 6000+7000+8000+9000+10 000 / 10 = 5500 (moyenne) Salaire médian entre 5000 et 6000. Ex : Dans une famille de 5 personnes, les âges sont les suivants. Cloé : 1 an. Jérémie : 5 ans. Romain 15 ans. Fanny 40 ans. David 44 ans.
Moyenne : 21 ans Age médian : 15 (romain) Ex : on veut partir en vacances, on est très sensible à la chaleur, on hésite de ce fait entre deux destinations. Premier proposition : température de 24°C. Deuxième proposition : 26°C. Dans un premier temps on peut pencher pour la première destination vu que la moyenne des température est plus basse que pour la seconde, or les changements de température pour cette destination sont compris entre 6°C et 46°C alors que pour la seconde température les écarts de température sont compris entre 21°C et 27°C. Il est donc préférable de choisir le 2nde destination. Pour évaluer la dispersion d’une série autour de la moyenne par rapport à une valeur centrale, on doit mesurer les écarts qu’on les valeurs de la variables avec leur moyenne. `Remarque : La valeur centrale n’est pas la moyenne arithmétique ou la médiane. Il faut bien choisir la valeur centrale pour que la dispersion ait un sens. Ex : on passe un concours, il y a 6 800 candidats mais qu’on ne prend que les 100 premiers par ordre de résultat. On a eu 16, 80 de moyenne mais on a pas été pris, ils ont pris les 100 premiers. Si on prend la valeur centrale, cette moyenne n’a aucune signification. La signification c’est la moyenne de ceux qui ont été pris, c’est la note minimale.
Il y a beaucoup de technique : l’écart absolu moyen, et la variance on prendra comme valeur centrale la moyenne arithmétique. Le raisonnement consiste à calculer la moyenne des écarts à la moyenne. Série de chiffre : 2, 2, 3, 4, 6, 6, 7, 7, 8. La moyenne de cette série : 5. 2-> un écart de 3
3 un écart de 2 4 un écart de 1
IMQ -introduction méthodes quantitatives
6 un écart de 1
7 un écart de 2 8 un écart de 3 Moyenne des écarts = 2. C’est l’écart absolu des moyennes. Il a un sens que si on le compare à une autre série. Elle a pour avantage de réduire le biais qui peut être amené par les écarts. Pour les éliminer on va prendre le carré des écarts et il permet d’accentuer les écarts entre les valeurs : Formule : V : 1 /n Σ (xi –moyenne) 2. √ (v)= écart type. Ex :
Série : -4 ; -2 ; 0 ; 2 ; 4 Moyenne =0 Ecart absolu moyen = 0 Variance :
(-4)2+ (-2)2 +22+ 42 /5 =40/5 =8