Hallo,
ich möchte eine Untergruppe meines Datensatzes mit der Gesamtheit meiner Fälle vergleichen. Die Untergruppe wird darüber gebildet, dass die betreffende Personen sich mit einem bestimmten Lebensstil identifizieren; abgefragt wird dies auf einer eigenen Variable (Ausprägungen: identifiziere mich/identifiziere mich nicht). Mich interessiert nun, ob/wie sich das Antwortverhalten der Untergruppe gegenüber der Gesamtheit unterscheidet hinsichtlich der Ausprägungen/Werte bei weiteren Variablen, die zb bestimmte Vorlieben und Verhalten abfragen. Die "statistische Operation" beschränkt sich dabei zunächst auf schlichtes Feststellen des prozentualen Anteiles der Nennungen verschiedener Variablenwerte.
Meine Idee war zunächst, "Daten aufteilen" zu wählen. Auf diese Weise kann ich meine Untergruppe problemlos definieren und entsprechende Abfragen für weitere Variablen durchführen. Vergleichsgröße ist dann aber die Restgruppe, und eben nicht die Gesamtheit. Frage also: Wie komme ich an diese heran?
Eine Möglichkeit wäre, die Auszählung in zwei Schritten zu machen - einmal für die Untergruppe, dann noch mal das selbe für den gesamten Datensatz - und die Ergebnisse dann zusammenzufrickeln .... Sollte aber doch einfacher gehen??
Weitere Frage eines Statistik-Laien dann: Ist es in Ordnung, aus den eventuellen Unterschieden zwischen Untergruppe und Gesamtheit, die sich im beispielsweise bei der Zustimung zu bestimmten Aussagen zeigen, einen vorsichtigen Schluss zu ziehen? Oder muss hier ein Test her, der zeigt, ob vermeintliche Auffälligkeiten stastisch signifikant sind, oder eben nur Zufall? Welcher Test wäre hier angesagt?
Danke für jede Hilfe!
Vergleich Untergruppe - Gesamtheit. Daten aufteilen?
-
- Beiträge: 3
- Registriert: 27.10.2011, 11:00
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Re: Vergleich Untergruppe - Gesamtheit. Daten aufteilen?
Ein Vergleich "Untergruppe mit Gesamtheit" ist ziemlich unsinnig, da dabei die Untergruppe u.a. mit sich selbst verglichen wird. Man denke sich einen prägnanten Fall, wie zum Beispiel dass jemand eine "Untergruppe" der deutschen Männer (50%) mit "allen Deutschen" (die zu 50% aus denselben deutschen Männern bestehen, die auch die Untergruppe bilden) vergleichen wollte. Einen inferenzstatistischen Test gibt es für den Vergleich von Personen mit sich selber natürlich nicht. Deskriptivstatistisch kannst Du es so machen, wie Du Lust hast. Es wird Dir nur vermutlich kein Gutachter abnehmen.
-
- Beiträge: 3
- Registriert: 27.10.2011, 11:00
Hm. Die Sinnlosigkeit erschließt sich mir nicht ganz. Beispiel, das recht nahe an meinen Datensatz & Fragestellung rankommt:
Grundgesamtheit (über die ich mit Hilfe meiner Stichprobe eine Aussage machen möchte): bundesdeutsche Gesamtbevölkerung;
hierin enthaltene Untergruppe: Wähler der Piratenpartei.
Variablen, für die ein Zusammenhang zwischen bestimmten Ausprägungen und Piraten-Wahl vermutet wird: Alter, Bildung, Wohnort
Die allgemein übliche (jedoch völlig verfälschende?) Gegenüberstellung läuft dann doch zb zwischen dem Anteil der Studierten unter den Piratenwählern (PW) und dem Anteil der Studierten an der deutschen Gesamtbevölkerung, oder zwischen Durchschnittalter der PW und dem Durchschnittalter der deutschen Gesamtbevölkerung (in der die PW natürlich einen gewissen Anteil haben, die mich aber trotzdem als Durchschnittswert-Geber interessiert).
Wie auch immer: Falls jeman einen Weg weiß, der eine solche Gegenüberstellung von Untergruppe und Gesamtheit unkomplizierter erlaubt, als meine aktuelle Methode (s. Ausgangsfrage),wäre ich sehr dankbar.
Grundgesamtheit (über die ich mit Hilfe meiner Stichprobe eine Aussage machen möchte): bundesdeutsche Gesamtbevölkerung;
hierin enthaltene Untergruppe: Wähler der Piratenpartei.
Variablen, für die ein Zusammenhang zwischen bestimmten Ausprägungen und Piraten-Wahl vermutet wird: Alter, Bildung, Wohnort
Die allgemein übliche (jedoch völlig verfälschende?) Gegenüberstellung läuft dann doch zb zwischen dem Anteil der Studierten unter den Piratenwählern (PW) und dem Anteil der Studierten an der deutschen Gesamtbevölkerung, oder zwischen Durchschnittalter der PW und dem Durchschnittalter der deutschen Gesamtbevölkerung (in der die PW natürlich einen gewissen Anteil haben, die mich aber trotzdem als Durchschnittswert-Geber interessiert).
Wie auch immer: Falls jeman einen Weg weiß, der eine solche Gegenüberstellung von Untergruppe und Gesamtheit unkomplizierter erlaubt, als meine aktuelle Methode (s. Ausgangsfrage),wäre ich sehr dankbar.
-
- Beiträge: 1733
- Registriert: 11.03.2010, 22:28
Ist mir nicht präsent, dass das allgemein üblich wäre. Unsinn passiert natürlich immer mal, vor allem in der Presse; die haben schreiben gelernt, aber können leider oft nicht 2+2 zusammenzählen. Deskriptiv ist es sicherlich durchführbar. Schlussfolgerungen kann man daraus schwerlich ziehen, dazu wäre der Vergleich getrennter Gruppen erforderlich.Die allgemein übliche (jedoch völlig verfälschende?) Gegenüberstellung
Du kannst die Subgruppe duplizieren (kopieren und an den bestehenden Datensatz anhängen), dazu eine Kennungsvariable einführen mit "1" für den Ursprungsdatensatz und "2" für die duplizierte Subgruppe. Deskriptiv lässt, wie gesagt, mit sowas arbeiten. Schließende Statistk (Signifikanztests) würde hingegen ungültige Ergebnisse produzieren.Wie auch immer: Falls jeman einen Weg weiß, der eine solche Gegenüberstellung von Untergruppe und Gesamtheit unkomplizierter erlaubt, als meine aktuelle Methode (s. Ausgangsfrage),wäre ich sehr dankbar.
-
- Beiträge: 1
- Registriert: 19.04.2014, 18:51
Ich stand vor einem ähnlichen Problem. Zunächst möchte ich allen danken, die hier schon gepostet haben 
Und vielleicht hilft es anderen ja weiter:
Ich bin der Anleitung von Generalist gefolgt, und habe dann zusätzlich, in meinem verdoppelten Datensatz, die Variable, die die Untergruppen definiert um einen Wert x für meine Gesamtgruppe ergänzt und kann nun wunderbar einfach, z.B. in Boxplot-Diagrammen, meine Untergruppen zur Gesamtgruppe im Verhältnis anzeigen lassen.

Und vielleicht hilft es anderen ja weiter:
Ich bin der Anleitung von Generalist gefolgt, und habe dann zusätzlich, in meinem verdoppelten Datensatz, die Variable, die die Untergruppen definiert um einen Wert x für meine Gesamtgruppe ergänzt und kann nun wunderbar einfach, z.B. in Boxplot-Diagrammen, meine Untergruppen zur Gesamtgruppe im Verhältnis anzeigen lassen.