Il existe deux statistiques permettant de tester la fiabilité de cohérence interne d’un construit :
- le coefficient alpha de Cronbach (1951)
- le rhô de Ksi ou rhô de Jöreskog (1971)
Où :
n est le nombre d’items composant l’instrument de mesure Vi est la variance de l’item i
Vt est la variance de l’item t
Le coefficient alpha est plus fréquemment utilisé et son comportement est relativement bien connu. Le coefficient alpha présente normalement une valeur comprise entre 0 et 1. Un coefficient de 0 représente une fiabilité nulle et un coefficient de 1, une fiabilité parfaite, indiquant que les items mesurent effectivement la même chose.
Bien qu’il n’existe aucune règle liée à l’utilisation de l’alpha de Cronbach, les travaux de Nunnally (1967) sont souvent cités comme source de valeurs critiques de fiabilité. Celui-ci a proposé différents niveaux d’alpha de Cronbach en fonction du champ d’application de l’instrument évalué. Peterson (1994) a complété les travaux de Nunnaly (1967) en analysant les coefficients généralement obtenus dans les études empiriques dans le champ du marketing.
Peterson ne fait hélas pas de comparaison directe entre les recommandations de Nunnally et les coefficients observés. Toutefois, il explique que les coefficients dépassent en général ces recommandations. Ceci n’est pas étonnant car les coefficients collectés dépendent largement des recommandations de Nunnally.
Les résultats de Peterson (1994) montrent, après l’examen de 4286 coefficients, que l’alpha moyen est de 0,77, que 75% des coefficients sont supérieurs à 0,70, que 49% sont supérieurs à 0,80 et 14% supérieurs à 0,90.
Le comportement de l’alpha est sensible au nombre d’items, ce qui invite à le considérer avec prudence. Généralement, les items diminuant la fiabilité sont supprimés mais il apparaît que cette approche est de nature à accroître la répétitivité des items.
La validité d’une échelle de mesure peut être vérifiée en quatre étapes (Evrard et al., 2003 ; Peter, 1979) : La validité de contenu, la validité de trait, la validité nomologique et la validité prédictive.
Cette analyse vient compléter l’analyse exploratoire et vérifier, après que la fiabilité des instruments de mesure ait été établie, que ceux-ci sont également valides et confirmer ainsi leurs qualités psychométriques (Vernette, 1991).
La validité de contenu ou validité faciale
Elle consiste à vérifier la capacité d’un instrument de mesure à capter les différents aspects d’un construit. Aucun outil statistique ne permet de tester la validité de contenu. Celle-ci est directement appréciable par le chercheur et/ou des experts.
La validité de trait ou de construit
Elle consiste à estimer la capacité des indicateurs à mesurer spécifiquement et complètement le phénomène étudié relativement à d’autres phénomènes proches ou différents (Roehrich, 1993). Ceci passe par la vérification de la validité convergente et de la validité discriminante des outils.
Le test de validité convergente a pour but de vérifier que les mesures du concept sont bien corrélées avec celles qui sont obtenues à l’aide d’autres outils de mesure (Roussel et al., 2002).
Le test de validité discriminante a pour but de vérifier que le construit mesuré est bien différent des autres construits. Pendant longtemps vérifiée grâce à la matrice MTMM ou multi-traits, multi-méthodes (Campbell et Fiske, 1959), la validité de trait est désormais essentiellement testée grâce à la méthode initialement proposée par Fornell et Larcker (1981) comme méthode complémentaire. Celle-ci sera détaillée dans la section suivante.
La validité nomologique
La validité nomologique d’une échelle consiste à vérifier si l’outil se comporte conformément aux prédictions théoriques issues des recherches antérieures (Evrard et al., 2003), en termes de relation avec les autres concepts.
La validité prédictive
Celle-ci repose sur la vérification de la capacité de l’instrument de mesure étudié à prédire des comportements ou des attitudes qu’elle devrait théoriquement pouvoir prédire.
Références
Campbell D.T. and Fiske D.W. (1959), “Convergent and discriminant validation by multitrait- multimethod matrix,” Psychological Bulletin, 56 81-105.
Cronbach L.J. (1951), “Coefficient alpha and the internal structure of tests,” Psychometrika, 16(3), 297-334.
Evrard Y., Pras B., and Roux E. (2003), Market : études et recherches en marketing. DUNOD.
Fornell C. and Larcker D.F. (1981), “Structural equation models with unobservable variables and measurement error : algebra and statistics,” Journal of Marketing Research, 18(3), 382-8.
Jöreskog K.G. (1971), “Simultaneous factor analysis in several populations,” Psychometrika, 36(4), 409-26.
Nunnaly J.C. (1967), Psychometric theory. New York.
Peter J.P. (1979), “Reliability : a review of psychometric basics and recent marketing practices,” Journal of Marketing Research, 16 6-17.
Peterson R.A. (1994), “A meta-analysis of cronbach’s coefficient alpha,” Journal of Business Research, 21(2), 381-91.
Roerich G. (1993), “Les consommateurs-innovateurs : un essai d’identification,” Thèse de doctorat Université Pierre Mendès-France, ESA de Grenoble.
Roussel P., Durrieu E., Campoy E., and El Akremi A. (2002), Méthodes d’équations structurelles et recherche en gestion. Paris.
Vernette E. (1991), “L’efficacité des instruments d’études : évaluation des échelles de mesure,” Recherche et Applications en Marketing, 6(2), 43-65.