Chapitre 2- les scores et leur distribution
La dispersion pour les echelles d'intervalles
-La variance et l'écart type -on peut faire asymétrie et kurtose ausssi
Les dizaines associés aux valeurs 5 a 9
1. 2. 3. 4. 5.
Les 3 types de mesure de kurtose (l'aplatissement d'une distribution)
1. La distribution leptokurtique 2. La distribution platykurtique 3. La distribution mésokurtique
Ex de voussure
2 5 5 5 5 5 8 -Le meme score se répete souvent et la variance des resultats n'est imputable qu'a deux cas extremes
Operations de l'echelle ordinale
< > Plus grand ou plus petit que l'autre en comparant les observations
Les operations admissables pour l'echelle nominale
=
A partir des rangs centiles
A partir des rangs centile, on peut determiner les quartiles 1, 2 et 3 qui correspond au rang 25, 50 et 75
La distribution platykurtique
APPLATIE, se caractérise par un étalement de scores K<0
Pourquoi on met parfois n-1 quand on calcule l'écart type
Chaque fois qu'on veut determiner la dispersion des résultats non pas seulement de notre echantillon mais de tout échantillon similaire de meme taille on peut division par n-1
Pour calculer le rang centile
Comme pour la médiane, on doit mettre les données en rang -On fait ceci pour situer rapidement une personne par rapport a une groupe de reference
1) Intervalle semi-interquartile
Degré de dispersion des scores pres de la moyenne
3) Symétrie
Determiner si les résultats se distribuent EGALEMENT de part et d'autre de la valeur du tendance centrale
Etendue
E= (Max-Min) -Elle tient pas compte des valeurs extremes car seulement une valeur extremes pourraient changer l'etendu de facon importante- la reponse ne tient pas compte qu'il y avait une valeur extreme
La validité
La capacité a mesurer ce qu'il vise a mesurer
La courbe normale
La courbe normale represente une distribution parfaitement symétrique
Alors la variance est:
La moyenne des écarts au carré
L'esperance mathématique
La valeur qui consititue la meilleure prediction pour chaque valeur individuel -On peut dire que c'est la moyenne -La somme des ecarts a la moyenne= 0
Le saut
Le saut équivalent a 1.5 fois l'intervalle interquartile en dessous de Q1 et au dessous de Q2
Mode
Le score qui apparait le plus souvent -Le score avec le frequence le plus elevé constitue la mode
Les déciles
Les déciles 1 et 2 correspondent aux centiles 10 et 20
Les operations admissibles pour un echelle proportionnelle
Les opérations admissibles est 0
Les propriétés des echelles
Les propriétés des echelles plus simple sont comprises a l'interieur d'une echelle plus complexe
Les transformations possibles pour un echelle proportionnelle
Les transformations possibles sont multiplicatives -On peut faire y=ax
Les valeurs a l'exterieur du saut
Les valeurs a l'exterieur du saut sont des extremes et sont representer par *
L'étude d'un distribution de fréquences
On peut calculer 4 valeurs 1) Tendance centrale 2) Dispersion 3) Symétrie 4) Kurtose
Pourquoi que c'est appelé proportionnelle?
On peut doubler le point d'origine absolu -La quantité de 80 litres represente le double de 40 litres
Tranformations possibles pour l'echelle de intervalle
Pour l'echelle de intervalle on peut avoir un fonction lineaire y=ax+K K=La constante et la point d'orgine
Leptokurtique
Résultats homogènes -difficle de différencier les individus qui sont tous proche de la moyenne
Si x est une variable continu
Si x est un variable continu, il peut prendre une infinité de valeurs alors impossible de calculer la probabilité occurence d'une valeur précise de x mais on peut calculer la probabilité d'occurence d'une valeur de x dans un intervalle particulier
Les disciplines scientifiques
Toute discipline scientifique aspire a mesurer et a décrire de la maniere la plus précise tous les phénomenes qu'elle étudie
Les valeurs aberrantes
Toutes les valeurs situées au dela d'une étendue appelé le SAUT
Le rang de la médiane
rang médiane= 1+n/2
Les opérations admissibles pour un échelle de intervalle
+ - x / -Un exemple de intervalle est la temperature. La valeur entre 21 et 22 degrés est la meme que la valeur entre 30 et 31 degres -On peut calculer la moyenne et la variance
L'echelle ordinale
-Mettre en rang les observations Ex. quand les eleves d'une classe sont mis en rang selon leur score total Ex. des profesionnelles (ingénieur junior, ingénieur senior) Ex. echelle de Likert il y a un ordre
La distribution normale
Distribution théorique d'une variable continu au sein d'une population infini
Autres méthodes de representation graphique des données
Jusqu'a maintenant, on a seulement vu l'histogramme des fréquences
La distribution mésokurtique
Represente une situation INTERMEDIAIRE entre leptokurtique et platykurtique -Alors c'est entre des scores qui sont proche de la moyenne et les scores qui sont applaties K=0
La distribution leptokurtique
Un grand nombre de scores qui sont autour de la MOYENNE K>0
Diagramme en boite
-Pas interesser dans l'ensemble des valeurs individuelles mais la dispersion des valeurs est la préoccuptation importante -On peut voir les données autour de la médiane ainsi qu'aux extrémités
Choisir le nombre de classes et l'étendue- les regles
1) La distribution dois comporter un minimum de 7 classes et un maximum de 12 2) La fréquence d'un classe doit jamais etre 0 3) Il faut limiter le nombre de classes dont la frequence est inférieure a 5
Les dizaines associés aux valeurs 0 a 4
1* 2* 3* 4* 5*
Les formules de l'asymétrie
A=0 quand la distribution est symétrique -Avec l'equation standard, on prend on consideration la moyenne, la mediane et l'ecart type quand on calcule l'asymetrie -On peut aussi avoir une formule pour l'asymetrie qui prend en compte des centiles pour qu'on compte 80% des données au lieu de 50%
L'utilité et propriétés des échelles de mesure
Avantages a utiliser des nombres mais on doit savoir que nous operons sur des valeurs et pas les réalités qu'ils symbolisent Ex. sur le test, on attribue un point par question réussite, nous agissons comme s'il s'agissait d'items ayant chacune une importance égale -Echelle a intervalle-egaux est cohérente avec cela meme s'il n'est pas coherente avec la realite sous-jacente
Les types d'échelles de mesure- la réalité
Avent de effectuer une opération sur les valeurs mesurées, il faut demontrer qu'elle correspondent a une certain réalité et que l'opération est valide
Voussure ou applatissement
Cette caractéristique de homogénéité est appeler la voussure ou l'applatissement
La presentation du diagramme des tiges et feuilles
Cette presentation est pour conserver les valeurs individuelles
L'echelle proportionnelle
Contient toutes les propriétés d'une echelle intervalle mais contient un zero absolue -Aussi appelé un echelle de rapport -Pas utiliser souvent en psychologique mais beaucoup en sciences physiques
Les transformations possibles pour l'echelle nominale
Correspondance 1 a 1
La distribution normale réduite
Dans la distribution normale réduite, les valeurs de x sont appelés scores z
Distribution symétrique
Discriminer les deux extrémités d'une distribution Ex. un test d'intelligence
Situations echecs
En donnant un test facile, on peut voir ce qui echoue avec l'asymetrie négative
Tests
En psychologie, on recours a des tests pour rendre compte d'une caractéristique ou un trait en particulier d'une personne
Ou est-ce qu'on utilise beaucoup l'echelle proportionnelle ou de rapport?
En sciences physiques
L'echelle nominale en statistique
En statistique, ce forme de mesure se présente sous forme de la fréquence d'observation appartenant a un meme class EX. cyblothymie 23 depression majeure 18 -C'est le profil diagnostique de toutes les gens consulter (c'est le caracteristique en commun) et il n'y a pas un ordre spécifique
Erreur de prediction
En utilisant les valeurs prédites, on peut trouver les ecarts a la moyenne avec les scores actuelles
Echelle intervalle
Existe une unité constante de mesure de sorte que l'intervalle entre chaque valeur de l'echelle est le meme -Possede les memes propriétés de l'echelle ordinale mais on prend en consideration que les intervalles ou ecarts entre les valeurs ne changent pas en aucun point de l'echelle -Difficle a soutenir dans les tests psychologique
Manière opérationnelle
Il faut comprendre l'ensemble des opérations qui permettent d'obtenir une valeur caractérisant de maniere valide -la validité est une propriété qui nous intéresse
L'intervalle semi-interquartile
Il s'agit de faire calculer l'etendue entre deux positions particulierement significatives autour de la moyenne -Il est moins representatif que l'ecart type car on utilise seulement la moitié des scores -Les quartiles ne sont pas influencés par des valeurs extremes
Des autres valeurs importantes pour une distribution de scores
Il s'agit de quartiles qui divisent une distribution de scores en parties égales et des déciles et centiles qui divisent une distribution en respectivement en 10 et 100 parties égales
Les propriétés de l'echelle
Important de connaitre les propriétés de l'echelle de mesure pour savoir quel type de traitement et transformation on peut faire -L'echelle de mesure a une influence sur la maniere qu'on peut faire la distribution de resultats
1) Tendance centrale
Indice de la valeur vers laquelle tend l'ensemble des résultats
2) Dispersion
Indice du degré de l'écart des résultats a la valeur du tendance centrale
La variance
Indice numérique de la dispersion autour de la moyenne 1) On fait les écarts a la moyenne 2) Les écarts a la moyenne au carré 3) La somme des écarts au carré 4) La moyenne des écarts au carré
Limites de l'echelle intervalle
L'echelle intervalle possede pas un zero absolue, aucun veritable zero Ex. Un score de 0 sur un test d'intelligence ne veut pas dire que t'as aucun intelligence -On peut quand meme obtenir le score de 0 mais ca ne veut pas dire que t'as aucun intelligence
2) L'intervalle C90 et C10
L'intervalle entre c90 et c10- davantage influencé par des valeurs extremes
S avec un chapeau
L'écart type de la population estimer a partir de l'échantillon
Les influences pour la moyenne et la médiane
La moyenne est influencé par le poids relatif de chaque score alors que le point milieu n'est pas influencer par les autres scores
Asymétrie négative
La moyenne est inférieure a la médiane -Le signe d'un entassement des valeurs au dessus de la moyenne et une nombre réduit de valeurs beaucoup plus petites
Asymétrie positive
La moyenne est supérieure a la médiane -Le signe d'un entassement des valeurs plus petites et d'un petit nombre de valeurs tres elevés
La médiane
La médiane correspond au rang centile 50, au décile 5 ou en quartile 2
L'echelle nominale
La plus elementaire comme forme de mesure -Elle consiste a nommer les caractéristiques mesurées -Elle est donc qualitative et regroupe dans un meme ensemble les observations qui possedent au moins une caractéristique commune Ex. homme ou femme -Les couleurs
Ecart type
La racine carré de la variance -un petit ecart type veut dire qu'en moyenne, les valeurs de l'échantillon sont proches de la moyenne -Un grand écart type veut dire qu'en moyenne, les valeurs de l'échantillon ne sont pas proches de la moyenne
La statistique descriptive
La statistique descriptive aide a comprendre la distribution des résultats -On va voir les meilleurs moyens de decrire une distribution de résultats
Echelles d'intervalles
La tendance centrale est la MOYENNE
Valeurs de voussure de la distribution
La tendance centrale, dispersion et l'assymétrie oublie le degré de homogénéité des scores
L'effet de l'opération de la mesure
Le comportement du sujet est different a cause d'un therapie ou un test Ex. quelqu'un qui est demander de compter les cigarettes qu'il fume va fumer moins Ex. Faire une questionnaire peut changer les réponses du sujet
Comment calculer la voussure
Le degré de voussure se calcule en calculant le rapport de deux étendues significatives 1) Intervalle semi-interquartile 2) Intervalle C90- C10
La médiane
Le valeur qui separe chaque série de nombres en deux moitiés égales -Pour calculer la médiane, on met les données en rang -Ensuite il faut calculer le rang occupé par la médine dans la distribution
Les opérations
Les echelles de mesure permet de savoir quelles opérations sont possibles -Plus l'echelle est simple, plus les opérations sont limités Ex. les nombres sur les dossards des athletes sont nominales alors on ne peut pas calculer la moyenne
Les extrémités du rectangle
Les extrémités sont le Quartile 1 et le Quartile 3 et le trait a l'interieur du boite est la médiane
Les échelle de mesure
Les échelles de mesure ont des propriétés tres variés -Stevens a identifié 4 echelles de mesure en 1946 qu'ils ont utilisé en sciences humaines
Limites et avantages du diagramme de boite
Limite: peux pas voir la mode Avantages: il est simple
Lorsque la distribution est leptokurtique
Lorsqu'il est leptokurtique -Le rapport de semi-interquartile- premier etendue (proche de la moynne) est tres petite par rapport par rapport a la seconde (l'intervalle C90 et C10)
Lors la distribution est etalé
Lorsque les valeurs sont étalées, le rapport entre les deux étendues s'accroit
Les valeurs de tendance centrale- moyenne
Lorsque nous avons des resultats, on veut decrire la distribution- le mieux connu est la moyenne
L'opération de la mesure
Lorsque nous mesurons une caracteristique, on suppose que l'operation de la mesure le laisse inchangé
Diagramme en feuilles
Lorsque nous voulons retenir les valuers individuelles des données on utilise une diagramme en feuilles -Répose sur le dénombrement des valeurs comme lors d'une histogramme
La transformation de l'echelle ordinale
Monotone: Ex. "beaucoup" sur une echelle de Likert correpsond a la valeur la plus elever mais on peut changer la valeur qu'on donne a beaucoup -Monotone meme si on change les intervalles entre les categories de reponses
Les données discretes
On a beaucoup de données discretes en psychologie alors on peut faire une approximation de cette de cette distribution theorique
Les valeurs de dispersion
On a besoin plus que la tendance centrale pour définir une distribution de scores Ex. Deux séries peuvent avoir la meme moyenne et médiane mais la dispersion n'est pas la meme
La distribution normale
On a des tableaux qui considere la moyenne de 0 et l'ecart type de 1 -La distribution est symétrique alors l'aire est identique
Les valeurs d'asymétrie
On a vu les valeurs du tendance centrale et dispersion mais on manque la degré de l'asymétrie -Pour voir le degré de l'asymétrie, on peut comparer les valeurs de la moyenne et de la médiane
Kurtose
On calcule la voussure (alors homogénéité des scores) en utilisant la Kurtose -Mesure le degré de l'aplatissement d'une distribution
Limite de l'étendue
On peut avoir 2 séries de nombres qui ont la meme moyenne, médiane et étendue mais qui ont des dispersions différents
Dispersion pour l'echelle ordinale
On peut faire l'intervalle semi-interquartile
Pour les échelle ordinale
On peut faire la tendance cenrtale de MEDIANE -On peut faire les calculs de l'asymetrie et la kurtose
Pour les échelles nominales
On peut faire la tendance centrale de MODE
Les caractéristiques d'une distribution
On peut resumer les resultats et les representer graphiquement, on le fait souvent avec un histogramme pour saisir l'essentiel
Pour comprendre la nature des résultats numériques
On utilise 1) La mesure 2) La statistique descriptive -pour comprendre la nature des résultats numériques que nous obtenons en notant les résultats a un test
Qu'est ce qu'on utilise pour rendre compte d'une caractéristique ou d'un trait d'une personne
On utilise des: 1) Notions de mesure 2) Statistiques -Les deux sont nécessaire au traitement et a l'analyse des données
Situations compétitives
On veut une asymétrie positive -Car pas tout le monde peut etre accepter a l'ecole par exemple
4) Kurtose
Permet de determiner si une proportion importante de resultats se REGROUPE autour de la valeur de tendance centrale ou si les resultats sont dispersés de maniere egales dans l'ensemble du distribution
Opérations de l'echelle nominale
Permet une seule operation: équivalence -Tous les elements d'une meme classe sont considerer comme équivalent et l'extension de la classe ou la fréquence est la seule statistique qu'on peut calculer
Ecarts a la moyenne
Pour chaque valeur, on fait la Valeur observé - La moyenne et ca c'est l'écart a la moyenne
Les écarts a la moyenne
Pour trouver la somme des ecarts a la moyenne, on prend la valeur observé et le soubstrait par la moyenne (ou la valeur prédit), on fait ca pour toutes les sujets et il nous donne 0
Symétrie
Quand la moyenne et la médiane coincident, on peut pas conclure qu'il y a de symétrie -Plus la distribution est asymétrique, plus il y aura une grande différence entre l'étendue des scores en faisant Q3-mediane et Q1-mediane
Quand on mesure une caractéristique- stabilité
Quand on mesure une caractéristique, nous supposons que cette trait a une certaine permanence ou stabilité -Ex. on ne serait pas interesser a etudier l'intelligence si ce n'etait pas un caractéristique stable
Platykurtique
Résultats hétérogenes qui permet de mieux différencier les individus au centre de la distribution
Ex. de rang centile
Si nous savons que le score 19 occupe le rang centile de 82, on sait que pour chaque tranche de 100 peronnes évalués, 82 obtiennent un score inférieur ou égal a 19 -On ne transforme pas le score, on le transforme simplement en rang
Exemple de la compréhension de la réalité
Si on utilise l'opération de l'addition sur les scores de QI pour voir ce qui peut faire deux personnes avec un QI de 60, ca ne fait pas de sens -ils ne pourraient pas resoudre des problemes de meme facon que quelqu'un avec un QI de 120
Un distriubtion normale
Typiquement un distribution normal, symetrique et mésokurtique est bonne -C'est un situation intermédiaire entre les cas extremes d'asymetrie et de voussure -Mais, il y a des situations ou on veut avoir un autre type de distribution pour mieux discriminer des individus dans certains catégories
L'utilité de l'intervalle semi-interquartile
Utile pour juger la dispersion des scores a la proximité de la médiane