als absoluter Statistik-Neuling stehe ich nun im Rahmen meiner Bachelorarbeit vor der Aufgabe einer umfangreichen statistichen Auswertung. Nach tagelanger Einarbeitung und diverser Lektüre habe ich mich nun für einen Weg entschieden, diese durchzuführen, bin mir aber sehr unsicher, ob dieser Weg richtig ist. Meinen Betreuer kann ich erst in einer Woche fragen, muss aber bis dahin eigentlich schon weiterarbeiten.
Deshalb würde ich mich über einen Kommentar bezüglich meiner Vorgehensweise bei der statistischen Analyse freuen und diese im Folgenden kurz erläutern:
Meine Daten sind die Anzahl bestimmter HTML-Elemente (hier nur eine Auswahl) aus einer Reihe von Webseiten:
Website A: 34 bilder, 10 tabellen, 21 links, css vorhanden: 1 (kennzahl für "vorhanden")
Website B: 19 bilder, 4 tabellen, 13 links, css vorhanden: 0 (kennzahl für "nicht vorhanden")
Website C: 33 bilder, 65 tabellen, 32 links, css vorhanden: 1 (kennzahl für "vorhanden")
usw..
Diese Daten liegen für verschiedene Jahre vor (1996, 2001, 2006 und 2011), da ich die Entwicklung des Webdesigns nachvollziehen möchte.
Als Schritte für die statistische Analyse (mit SPSS) habe ich mir die folgenden überlegt:
1. Bestimmung des Skalenniveaus -> Alle Variablen intervallskaliert, eine nominalskalierte, nämlich diejenige mit der Frage nach der CSS, da nur "vorhanden" oder "nicht vorhanden" möglich ist
2. Test auf Normalverteilung mit Kolmogorov-Smirnov-Test bereits durchgeführt: Eine einzige Variable hat sich als normalverteilt herausgestellt, alle anderen habe ich als "nicht normalverteilt" definiert
3. Bestimmung des Gruppierten Medians bei den nicht normalverteilten, intervallskalierten Variablen, arithmetrisches Mittel bei der normalverteilten, intervallskalierten Variable und Modus bei der nominalskalierten Variable
3.1 Bei einigen Variablen ist der gruppierte Median immer 0 und ich erreiche für meine Analyse bessere Ergebnisse wenn ich das arithmetrische Mittel berechne. Ist es legitim, dieses trotz fehlender Normalverteilung anzuwenden?
4. Prüfung auf Signifikanz, um Zusammenhang zwischen Variable und Jahr zu überprüfen : H-Test nach Kruskal und Wallis für die intervallskalierten Variablen, Chi-Quadrat für die eine nominalskalierte Variable (vor allem hier bin ich sehr unsicher)
5. Korrelationskoeffizient nach Spearman
Kann ich das so machen, habe ich etwas vergessen oder verwechselt, ist das zuviel,... ?

Ich freue mich über jede Anregung...
Viele Grüße und Danke im Voraus,
Aviendha