Microsoft Excel ist definitiv das populärste Tabellenkalkulationsprogramm der Welt. Wenn man jedoch über Statistik-Software spricht, fällt nur selten der Name MS Excel. In diesem Zusammenhang wird meistens von R, SPSS oder Python gesprochen. Nichtsdestotrotz können einige gängige statistische Auswertungen auch in Excel durchgeführt werden. Daher gibt dieser Artikel einen kurzen Überblick darüber, welche statistische Verfahren in Excel möglich sind.
Sie benötigen Hilfe bei Ihrer statistischen Auswertung in Excel (z.B. Fragebogen-Auswertung) oder bei der VBA-Programmierung, dann zögern Sie nicht uns zu kontaktieren (Kontaktdaten unten rechts). Unsere Datenanalyse-Experten helfen Ihnen gerne weiter (kostenloses unverbindliches Erstgespräch)!
Grundsätzlich beginnt die statistische Datenanalyse mit der deskriptiven Statistik (auch: beschreibende Statistik). In diesem Part der Statistik geht es darum, die Daten mit Hilfe von statistischen Kennzahlen und Grafiken zu beschreiben. Wie den meisten Lesern dieses Artikels wahrscheinlich bekannt ist, ist dies in Excel kein Problem. Mit Hilfe der implementierten Funktionen (z.B. MIN(), MAX(), MEDIAN(), QUARTILE(), MITTELWERT() oder STABW(), SCHIEFE(), KURT()) können sehr schnell deskriptive Statistiken berechnet werden. Ist Ihnen dies zu aufwendig, dann können Sie die statistischen Kennzahlen auch gerne automatisiert mit dem Analysetool Populationskenngrößen des kostenlosen Excel-Add-ins „Datenanalyse” ermitteln. Hierzu muss das Datenanalyse Add-in allerdings zunächst geladen und aktiviert werden. Eine detaillierte Anleitung hierfür finden Sie hier. Nach der Aktivierung steht das Add-in wie in der folgenden Abbildung erkennbar im Tab Daten auf der rechten Seite zur Verfügung.
Mit Hilfe des Add-ins können zudem unkompliziert Kovarianz- und Korrelationsmatrizen für die betrachteten Variablen berechnet werden. Auch Histogramme können mit dem Datenanalyse Add-in erzeugt werden. Andere gängige statistische Grafiken, wie z.B. Häufigkeitsdiagramme, Zeitreihenplots oder Boxplots stellen für Excel ebenso kein Problem dar.
Im Anschluss an die deskriptive Statistik folgt in der Regel die Inferenzstatistik. Einige der in diesem Teil der Statistik häufig durchgeführten statistischen Tests und Verfahren sind glücklicherweise auch im Excel-Add-in „Datenanalyse” enthalten. Folgende gängige statistische Verfahren der Inferenzstatistik können mit Hilfe des Add-ins in Excel durchgeführt werden:
T-Tests
Es können sowohl t-Tests für abhängige als auch für unabhängige Stichproben bei gleichen oder unterschiedlichen Varianzen durchgeführt werden.
Gauß-Test
Mit dem Gauß-Test werden auf Grundlage der beobachteten Stichprobenmittelwerte Hypothesen über die Erwartungswerte derjenigen Grundgesamtheiten geprüft, aus denen die Stichproben stammen.
F-Test
Dieser F-Test ermöglicht den Vergleich der Varianzen zweier Stichproben.
ANOVA
Es sind verschiedene Formen der Varianzanalyse (einfaktorielle ANOVA, zweifaktorielle ANOVA mit und ohne Messwiederholung) durchführbar.
Regression
Das Regression-Analysetool erlaub die Schätzung eines multiplen linearen Regressionsmodells auf Basis der Methode der kleinsten Quadrate. Der Output enthält die Regressionskoeffizienten, die P-Values der t-Tests der Koeffizienten, das Bestimmtheitsmaß des Modells sowie die Ergebnisse des Overall-F-Tests. Darüber hinaus erlaubt das Tool u. a. auch die Erstellung von Residualplots zur Modelldiagnostik.
Stichprobenziehung (Sampling)
Hiermit werden Stichprobenziehungen aus einem bestehenden Datensatz ermöglicht. Es sind sowohl Zufallsziehungen als auch sog. periodische Ziehungen möglich. Im Zuge der letzten Variante wird aus einer Datenreihe lediglich jeder x-te Wert extrahiert. Dies kann z.B. nützlich sein, wenn aus einer Zeitreihe mit kumulierten Monatsdaten nur jeder vierte Wert gezogen werden soll, um eine Quartalszeitreihe zu erhalten.
Darüber hinaus können mit dem Datenanalyse Add-in auch Zufallszahlen aus verschiedenen Verteilungen (Normal-, Gleich-,Poissonverteilung, etc.) erzeugt werden. Zudem beinhaltet das Add-in unter anderem noch Analysetools für die Fourieranalyse, zum exponentiellen Glätten sowie zur Berechnung eines gleitenden Durchschnitts.
Es kann also festgehalten werden, dass einfache statistische Auswertungen dank dem Add-in Datenanalyse durchaus in Excel durchgeführt werden können. Die Durchführung der statistischen Verfahren in Excel ist hier jedoch hier nicht näher erläutert, da es für diesen Zweck bereits zahlreiche Tutorials gibt. Zu beachten ist allerdings, dass die Anwendung der beschriebenen Analysetools nur die eine Seite der Medaille darstellt. Die andere und deutlich wichtigere Seite der Medaille wird dagegen durch die Kenntnis der zugrundeliegenden Theorie der angewandten statistischen Verfahren repräsentiert. Sie sollten sich daher im Rahmen Ihrer statistischen Auswertung stets die folgenden Fragen stellen:
Wie lauten die Hypothesen zu meiner Forschungsfrage?
Welches statistische Verfahren ist zur Überprüfung der aufgestellten Hypothesen geeignet?
Liegen die Voraussetzungen für die Durchführung dieses statistischen Verfahren vor? Wie kann ich diese prüfen?
Darüber hinaus müssen Sie in der Lage sein, die Ergebnisse der durchgeführten statistischen Auswertung richtig zu interpretieren.
Allerdings soll nicht unerwähnt bleiben, dass sich MS Excel wirklich nur für überschaubare Statistik-Projekte eignet. Bei großen Datensätzen mit zahlreichen Variablen sind R, Python und SPSS zu bevorzugen, da die statistischen Auswertungen in diesen Programmen deutlich schneller durchgeführt werden können. MS Excel weißt bei großen Datensätzen auch deutliche Geschwindigkeitsverluste auf.
Zusammenfassung
Im Zuge dieses Artikels wurde ein Überblick über die in MS Excel durchführbaren statistischen Verfahren gegeben. Dabei war es uns wichtig zu betonen, dass es bei der Anwendung von statistischen Verfahren essentiell ist, deren Annahmen zu verstehen und deren Ergebnisse interpretieren zu können. Die letztendlich verwendete Statistik-Software ist nur ein Tool zur Zielerreichung und kann im Falle der geplanten Durchführung einer der oben genannten statistischen Methoden bei einer überschaubaren Datensatzgröße auch MS Excel sein.
Falls Sie Hilfe bei Ihrer statistischen Auswertung (z.B. Fragebogen-Auswertung) in MS Excel benötigen oder komplexere statistische Auswertungen in SPSS, R, Python durchführen wollen, zögern Sie nicht uns zu kontaktieren. Unser Team an Freelancern verfügt über langjährige Erfahrung auf dem Gebieten der Statistik. Wir beraten Sie gerne im Rahmen eines kostenlosen und unverbindlichen Erstgespräch. Sie können uns jederzeit per E-Mail oder Telefon (siehe unten rechts) erreichen.
Comentarios