VL10 Exploratorische Faktorenanalyse
Ladung
= Gewichtungskoeffizient des Items auf dem Faktor, bei unkorrelerierten Faktoren: Korrelation zwischen Item und Faktor
muss die Kommunalitäten nehmen Kommunalität = Anteil der Varianz, der beobachteten Variable, die mit den Faktoren erklärt werden kann.
= Itemreabilität = nicht unter .60 bei nur 1 Messung kann man nicht direkt die Reliabilität bestimmen
Faktorwert
Ausprägung einer Person auf einem Faktor
Sie werden gleichmässiger auf die Hauptkomponenten verteilt. Man erkennt gut, dass bei der unrotierten Matrix Hauptkomponente1 einen deutlich höheren Eigenwert hat als Hauptkomponenten 2 und 3. Bei der rotierten Matrix ist es gleichmässiger. Um dies zu berechnen, könnte man die Ladungen aller Items auf einer Hauptkomponente spaltenweise quadrieren und aufsummieren
Eigenwert (Summe der quadrierten Faktorladungen; Spalte) verändert sich durch die Rotation?
Kaiser Kriterium, ein Faktor soll mehr Unterschiede in der Itembeantwortung aufklären als nur ein einzelnes Item
Eigenwerteverlauf
- Vorliegen einer expliziten Theorie zur Faktorenreduktion: theoretische Überlegungen geben die Anzahl zu extrahierender Faktoren vor - Eigenwertkriterium grösser 1 (Kaiser-Kriterium) - Scree-test nach Cattell - Parallelanalyse nach Horn: es werden Zufallswerte generiert (mit den selben Spezifikationen wie im eigenen Datensatz) und nur Faktoren, deren empirisch beobachtete Eigenwerte über dem Eigenwerteverlauf von Zufallswerten liegen, werden berücksichtigt - Weitere Kriterien (z.B. Minimal-Average-Partial (MAP)-Test nach Velicer)
Entscheidung 2: Abbruchkriterium
- Gesucht wird (aus psychologischer Sicht) eine Lösung, bei der die Unterschiede in der Itembearbeitung möglichst nur auf einen Faktor zurückzuführen sind - Einfachstruktur: Liegt vor, wenn die Ladungen eines Items auf einem Faktor sehr hoch sind und auf den restlichen Faktoren sehr gering (nahe null); die Items messen dann jeweils nur einen Faktor (ein Konstrukt) --> relevant für die Testkonstruktion, weil in vielen Fällen ein Item nur einer Dimension zugeordnet werden soll - Rotationsproblem: Es sind theoretisch viele Möglichkeiten realisierbar, um die ursprüngliche Korrelationsmatrix zu reproduzieren
Entscheidung 3: Rotationsmethode
- theoriefrei („struktursuchend") Struktur Suche und nicht Theorie Prüfung - datenreduzierend - kann nicht zum Prüfen von Hypothesen verwendet werden - gibt Antworten auf die Frage, was die bestmögliche Struktur ist
Exploratorische Faktorenanalyse (EFA)
gleiche Ursachen Suche wie bei geringer Korrelation: Kriterium? Varianzeinschränkung?, Itemsschwierigkeiten?, Korrelierung des Items?
Geringe Reliabilität was tun?
CFA
Grundsätzlich: Wenn eine Theorie (d.h. Vorannahmen über die Zuordnung der Items zu den Faktoren) vorliegt, dann sollte eine was verwendet werden?
(principal axis factoring, PAF) • Wie lässt sich die Ursache bezeichnen, die für hohe Ladungen der Variablen auf diesem Faktor verantwortlich ist? • Ziel: Analyse von Zusammenhängen zwischen Items und latenten Variablen • Messfehler der Items wird geschätzt • Kommunalität kann maximal so gross sein wie die Reliabilität der jeweiligen Variablen
Hauptachsenanalyse
(principal component analysis, PCA; eigentlich keine Faktorenanalyse im engeren Sinn) • Wie lassen sich auf einem «Faktor» hoch ladende Variablen durch einen Sammelbegriff (Komponente) zusammenfassen? • Ziel: Datenreduktion • Annahme: Variablen wurden messfehlerfrei erhoben • Kommunalität kann maximal 1 sein
Hauptkomponentenanalyse
induktiven Testkonstruktion, aber auch bei der Auswahl von Items
In Rahmen der Testtheorie kann die EFA in verschiedenen Schritten eine Rolle spielen, z.B. bei der?
1. Extraktionsmethode: Wie werden die Faktoren extrahiert? (z.B. Hauptkomponentenanalyse (PCA), Hauptachsenanalyse (PAF), Maximum-Likelihood-Faktorenanalyse) 2. Abbruchkriterium: Wie viele Faktoren werden extrahiert? (z.B. Kaiser-Kriterium, Scree-Plot, Parallelanalyse) 3. Rotationskriterium: Wie sollen die Faktoren rotiert werden? (z.B. recht- oder schiefwinklig)
In der EFA zu treffende Entscheidungen
verändert sich nicht durch Rotation
Kommunalität verändert sich durch die Rotation? (Summe der quadrierten Faktorladungen; Zeile)
- theoriegeleitet („strukturprüfend") --> habe ich eine Theorie verwende ich das (wird in Praxis oft nicht gemacht. - prüft Hypothesen - gibt Antworten auf die Frage, ob eine (oder mehrere) intendierte Strukturen zu den Daten passen
Konfirmatorische Faktorenanalyse (CFA)
• Geprüft wird die Nullhypothese, dass alle Korrelationen der Korrelationsmatrix gleich null sind; bei einem signifikanten Ergebnis deutet das darauf hin, dass die H0 nicht zutrifft und die Korrelationsmatrix verwendet werden kann • aber: stichprobenabhängig (wird bei N ≥ 60 i.d.R. signifikant); daher als Minimalanforderung zu sehen --> möchte die Nullhypothese immer verwerfen
Kriterien zur Bewertung der Durchführbarkeit einer FA Bartlett-Test
• Prüfung der Itemauswahl/der Korrelationsmatrix • Bestimmung des gemeinsamen Varianzanteil aller Items miteinander • Bewertung: .60 - .69 mässig, .70 -.79 mittel, .80 - .89 gut und ≥.90 sehr gut
Kriterien zur Bewertung der Durchführbarkeit einer FA Kaiser-Meyer-Olkin (KMO) Koeffizient
• Inhaltlich ähnliche Aussagen wie mit KMO • Prüfung der Eignung eines jeden einzelnen Items; jedes Item wird mit allen anderen Items in Beziehung gebracht • Bewertung: .60 - .69 mässig, .70 -.79 mittel, .80 - .89 gut und ≥.90 sehr gut
Kriterien zur Bewertung der Durchführbarkeit einer FA Measure of Sample Adequacy (MSA) Koeffizient
(schiefwinklige) Rotation
Oblique
- Korrelation zwischen Faktoren wird ermöglicht - Ergebnis sind zwei Matrizen • Strukturmatrix: Korrelationen zwischen Items und Faktoren • Mustermatrix: Ladungen der Items auf den Faktoren kontrolliert für den Einfluss der anderen Items (d.h. semipartielle standardisierte Regressionsgewichte der Items auf die Faktoren) --> wird in der Regel interpretiert - Am häufigsten eingesetzte Methoden: • Direct-Oblimin • Promax (Bei diesen beiden Methoden kann man steuern, wie stark die Faktoren korrelieren dürfen)
Oblique (schiefwinklige) Rotation
(rechtwinklige) Rotation
Orthogonale
- führt zu unkorrelierten Faktoren - am häufigsten eingesetzte Methode: VARIMAX • Varianz (σ2) der quadrierten Ladungen der Items (λ2) wird maximiert, mit dem Ziel, zu einer Einfachstruktur zu kommen • praktisch bedeutet das, dass einige wenige hohe Ladungen und viele Ladungen nahe bei null entstehen • interpretiert wird die rotierte Ladungsmatrix - sollte nicht eingesetzt werden, wenn aus theoretischer Sicht ein genereller, übergeordneter Faktor erwartet wird bzw. mit Merkmalen gearbeitet wird, die korreliert sind
Orthogonale (rechtwinklige) Rotation
graphische Darstellung des Verlaufs der Eigenwerte und (visuelle) Suche nach einem bedeutsamen Eigenwerteabfall („Knick")
Scree-test nach Cattell
Bei weniger Faktoren braucht es auch geringere Stichprobenrösse, von Kommunalitäten abhängig, je messgenauer desto grösser muss die Stichprobe sein
Stichprobengrösse beeinflusst die FA wie?
Insgesamt aufgeklärte Varianz
Summe der Eigenwerte der extrahierten Faktoren geteilt durch die Anzahl Items
Kommunalität (h2)
Summe quadrierter Ladungen pro Zeile --> Je höher die Kommunalität, desto mehr Varianzanteile der Variablen durch alle Faktoren erklärbar (d.h. bessere Repräsentation der Variable durch Faktoren)
- Das faktorenanalytische Modell ist für die Fragestellung geeignet • Alternativen: z.B. Clusteranalyse - Es bestehen substantielle Korrelationen • kann empirisch geprüft werden - Es liegen unverzerrte Zusammenhänge vor • Ausschluss von Ausreissern, die Kennwerte verzerren können (Streudiagramm!) - Es liegen ausreichend viele Items vor in Kombination mit ausreichender Itemreliabilität • Die Stabilität der Faktorenlösung nimmt mit wachsender Stichprobengrösse zu • Erforderliche Stichprobengrösse richtet sich aber auch nach Anzahl der erwarteten Faktoren bzw. der Messgenauigkeit, die angenommen werden kann
Voraussetzungen für eine FA?
Datenreduktion, Strukturfindung Überprüfung der Konstruktvalidität (insb. der faktoriellen Validität)
Warum ist Faktorenanalyse (FA) wichtig?
ähnliche
Wenn die Kommunalitäten hoch sind, die Items normalverteilt sind und die Daten intervallskaliert sind, bringen alle drei Methoden was für Lösungen?
Gar nicht. Um dies zu veranschaulichen könnte man beispielsweise die Eigenwerte der drei Hauptkomponenten oder die Kommunalitäten der neun Items aufsummieren und durch die Anzahl Items teilen. Das Ergebnis entspricht der insgesamt erklärten Varianz.
Wie verändert sich die durch alle drei Hauptkomponenten insgesamt erklärte Varianz durch die Rotation?
Zur Interpretation sollte die rotierte Matrix herangezogen werden. Hauptkomponente 1 könnte beispielsweise als «Gewissenhaftigkeit», Hauptkomponente 2 als «Extraversion» und Hauptkomponente 3 als «Verträglichkeit» beschrieben werden. Hier gäbe es aber natürlich mehrere richtige Lösungen, da auch andere Bezeichnungen denkbar wären
Wie würden Sie die drei Hauptkomponenten inhaltlich interpretieren (bzw. benennen)?
Eigenwert
aufgeklärte Varianz eines Faktors über alle Items, d.h. bei unkorrelierten Faktoren die Summe der quadrierten Ladungen aller Items über einen Faktor in der jeweiligen Spalte (Hauptkomponentenanalyse: Eigenwert von 1 entspricht der Varianzaufklärung durch ein Item der Skala)
Hauptkomponentenanalyse PCA
erbringt immer eine Lösung, die anderen PAF und ML-EFA evtl. nicht