Die Wahl zwischen linearer Regression und dem allgemeinen linearen Modell: Welche Methode ist für die Hypothesentests geeignet?
Welche Methode, die lineare Regression oder das allgemeine lineare Modell (ALM), ist für die Hypothesentests geeignet? Was ist der Unterschied zwischen den beiden Methoden und wie sollen die unabhängigen Variablen getestet werden?
Die Wahl zwischen linearer Regression und dem allgemeinen linearen Modell hängt von der Skalierung der unabhängigen Variablen (UV) und der theoretischen Grundlage der Beziehung zwischen den abhängigen Variablen (AV) ab.
In Ihrem Fall handelt es sich um Likert-Items die oft als ordinale Skalen betrachtet werden ebenfalls wenn sie eigentlich ordinalskaliert sind. Die Regression ist die bevorzugte Methode wenn diese Variablen als intervallskaliert betrachtet werden. Das ALM betrachtet die Stufen der Likert-Items jedoch als qualitative Kategorien was zu einem Informationsverlust führt. Daher empfehle ich die Verwendung der linearen Regression für Ihre Hypothesentests.
In Bezug auf die Frage welche UV den stärksten Einfluss auf die AV hat, kann dies auf verschiedene Arten beantwortet werden. Wenn die UVs untereinander korreliert sind und sich in ihrem Erklärungswert für die AV "überlappen" können, kann eine einfache Korrelationsanalyse durchgeführt werden. Hierbei werden die Korrelationen zwischen den beteiligten Variablen berechnet und per statistischem Test paarweise verglichen. Eine weitere Möglichkeit besteht darin ´ eine multiple lineare Regression durchzuführen ` bei der alle UVs gleichzeitig in die Regression einbezogen werden. Die Regressionsgewichte können dann betrachtet werden ohne umfassende Tests durchzuführen.
Es wird empfohlen, sowie ein einfaches OLS-Modell als auch ein Ordinal-Modell zu berechnen um festzustellen, ob es deutliche Unterschiede gibt. Zusätzlich sollte geprüft werden ob die AV normalverteilt ist. Wenn die Normalverteilung nicht erfüllt ist, sollten robuste Standardfehler in den Regressionsberechnungen verwendet werden.
Es ist auch wichtig zu beachten ob eine theoretische Grundlage für die Beziehungen zwischen den Variablen vorliegt. Wenn dies nicht der Fall ist, kann zunächst eine Korrelationsanalyse durchgeführt werden um erste Hinweise zu erhalten und das Regressionsmodell kann identisch angepasst werden.
Am Ende können alle unabhängigen Variablen implementiert werden und es können standardisierte Koeffizienten betrachtet werden um festzustellen welche Variable den größten Einfluss hat. Es ist jedoch zu beachten – dass dieser datengetriebene Prozess je nach Fachbereich unterschiedlich bewertet wird. In den Sozialwissenschaften ist es eher unüblich während es in den Wirtschaftswissenschaften akzeptiert ist.
In Ihrem Fall handelt es sich um Likert-Items die oft als ordinale Skalen betrachtet werden ebenfalls wenn sie eigentlich ordinalskaliert sind. Die Regression ist die bevorzugte Methode wenn diese Variablen als intervallskaliert betrachtet werden. Das ALM betrachtet die Stufen der Likert-Items jedoch als qualitative Kategorien was zu einem Informationsverlust führt. Daher empfehle ich die Verwendung der linearen Regression für Ihre Hypothesentests.
In Bezug auf die Frage welche UV den stärksten Einfluss auf die AV hat, kann dies auf verschiedene Arten beantwortet werden. Wenn die UVs untereinander korreliert sind und sich in ihrem Erklärungswert für die AV "überlappen" können, kann eine einfache Korrelationsanalyse durchgeführt werden. Hierbei werden die Korrelationen zwischen den beteiligten Variablen berechnet und per statistischem Test paarweise verglichen. Eine weitere Möglichkeit besteht darin ´ eine multiple lineare Regression durchzuführen ` bei der alle UVs gleichzeitig in die Regression einbezogen werden. Die Regressionsgewichte können dann betrachtet werden ohne umfassende Tests durchzuführen.
Es wird empfohlen, sowie ein einfaches OLS-Modell als auch ein Ordinal-Modell zu berechnen um festzustellen, ob es deutliche Unterschiede gibt. Zusätzlich sollte geprüft werden ob die AV normalverteilt ist. Wenn die Normalverteilung nicht erfüllt ist, sollten robuste Standardfehler in den Regressionsberechnungen verwendet werden.
Es ist auch wichtig zu beachten ob eine theoretische Grundlage für die Beziehungen zwischen den Variablen vorliegt. Wenn dies nicht der Fall ist, kann zunächst eine Korrelationsanalyse durchgeführt werden um erste Hinweise zu erhalten und das Regressionsmodell kann identisch angepasst werden.
Am Ende können alle unabhängigen Variablen implementiert werden und es können standardisierte Koeffizienten betrachtet werden um festzustellen welche Variable den größten Einfluss hat. Es ist jedoch zu beachten – dass dieser datengetriebene Prozess je nach Fachbereich unterschiedlich bewertet wird. In den Sozialwissenschaften ist es eher unüblich während es in den Wirtschaftswissenschaften akzeptiert ist.