Hallo zusammen,
ich bin neu in SPSS und habe Grundkenntnisse aber wenig Erfahrung in der Lösung statistischer Fragestellungen allgemein.
Jetzt sitze ich vor einem Problem, bei dem mich bereits die Eingabe in das SPSS-Datenblatt ins Wackeln bringt.
Problem: Im ersten Schnitt soll für ein Geschäft A erfasst werden, wie viele kg Äpfel an jedem Tag im Juni verkauft werden. Im zweiten Schritt soll eine Vergleichsdatenreihe für ein zweites Geschäft B erstellt werden. Nachher wird ein Liniendiagramm erstellt und Kennzahlen verglichen....
Wie erfasse ich das Problem sinnvoll im SPSS-Datenblatt. Mir fallen 3 Möglichkeiten ein:
1) Lege ich 30 Fälle mit den Variablen (umgangssprachlich) 'Datum', 'Verkauf kg in A' und 'Verkauf kg in B" an?
2) Lege ich 60 Fälle mit den Variablen 'Datum', 'Verkaufte kg' und "Name Geschäft" an?
3) Lege ich 2 Datenblätter jeweils mit 30 Fällen und den Variablen "Datum" und "verkaufte KG" an? Geht das überhaupt in SPSS?
Meine Gedanken:
Bei Version 1) packe ich die Kriterien (Name des Geschäfts, Menge und Maßeinheit) in eine Variable. Ist das methodisch korrekt?
Bei Version 2) erfasse ich die Tagesdaten redundant. Dafür kann ich wohl die Eingabe übersichtlicher gestalten, wenn ich z.B. noch die Verkaufszahlen für Bananen eingeben will (ist aber in der Fragestellung nicht vorgesehen).
Version 3) käme vllt. in Excel in Betracht. Ich weiß nicht, ob das bei SPSS geht und sinnvoll ist.
Als Ausgabe will ich neben dem Diagramm noch eine Tabelle mit einer Spalte 'Datum' und den Spalten 'Geschäft A' und 'Geschäft B', die beide eine gemeinsame Überschrift 'Verkaufte Äpfel in kg' haben, erzeugen.
Also in etwa so:
_____⎮_Verkaufte Äpfel in KG_⎮
Datum⎮Geschäft A ⎮Geschäft B⎮
Wie gehe ich am Besten vor? Bin für jeden Tipp dankbar.
Schöne Grüße
Hanno
Korrekte/Sinnvolle Eingabe ins Datenblatt
-
drfg2008
- Beiträge: 2391
- Registriert: 06.02.2011, 19:58
re
wie du vorgehst, hängt von deiner Fragestellung ab (die hier fehlt), denn sämtliche drei Alternativen sind selbstverständlich möglich. Und selbstverständlich könen nach jeder der drei unterschiedlichen Eingaben nachträglich die Daten so umgeformt werden, dass sie für die unterschiedlichen Fragestellungen passen. Wobei ich jetzt davon ausgehe, dass für jeden Tag sowohl für Filiale A als auch Filiale B die gleichen gleichen Daten erhoben werden.
Folgende Fragestellungen mit ihren Vorgehensweisen
(a) Frage: Macht Filiale A täglich den gleichen Umsatz wie Filiale B
-> Variablen
Datum - "Filiale" (A/B) - "Umsatz"
Nullhypothese µ(A) = µ(B) -> t-Test bei unabhängigen Stichproben oder U-Test
(b) Frage: Macht Filiale A täglich den gleichen Umsatz wie Filiale B
-> Variablen
Datum - "Umsatz (A)" - "Umsatz (B)"
Nullhypothese µ(A) = µ(B) ABER !! -> t-Test bei abhängigen Stichproben oder äquivalenter NP-Test
Natürlich können die Daten auch auf verschiedenen Datenblättern gesammelt werden und dann über die Variable Datum (möglichst im Datumsformat) zu einem Datenblatt gematched werden.
Folgende Fragestellungen mit ihren Vorgehensweisen
(a) Frage: Macht Filiale A täglich den gleichen Umsatz wie Filiale B
-> Variablen
Datum - "Filiale" (A/B) - "Umsatz"
Nullhypothese µ(A) = µ(B) -> t-Test bei unabhängigen Stichproben oder U-Test
(b) Frage: Macht Filiale A täglich den gleichen Umsatz wie Filiale B
-> Variablen
Datum - "Umsatz (A)" - "Umsatz (B)"
Nullhypothese µ(A) = µ(B) ABER !! -> t-Test bei abhängigen Stichproben oder äquivalenter NP-Test
Natürlich können die Daten auch auf verschiedenen Datenblättern gesammelt werden und dann über die Variable Datum (möglichst im Datumsformat) zu einem Datenblatt gematched werden.
drfg2008



