Advent, Advent, 1 Monat weihnachtliche Laufzeit geschenkt.

Nicht bis zur Bescherung warten, Aktion nur gültig bis zum 18.12.2016!

Textversion des Videos

Transkript Statistik II - Video 48: Der Vorzeichen-Rang-Test

Herzlich willkommen zusammen zu einer weiteren Ausgabe von Statistik II. Wir beschäftigen uns heute mit dem Vorzeichen-Rang-Test. Der Vorzeichen-Rang-Test schließt, wie der Name schon erahnen lässt, an den Vorzeichentest an. Unterschied, hier kommen wir gleich dazu, ist, dass das Ereignis zumindest metrisch messbar sein muss. Das ist eigentlich der Hauptunterschied. Was das für die Testentscheidung, für den Test an sich bedeutet, werden wir jetzt schrittweise uns anschauen. Also Vorzeichen-Rang-Test kann beispielsweise auch auf die Fragestellung angewendet werden wie der Vorzeichentest. Wenn wir zum Beispiel 2 verschiedene Medikamente überprüfen wollen, seien es in dem Fall Schlaftabletten, und wir als Merkmal die Anzahl der Stunden Schlaf eines Probanden nehmen. Nun zur Aufgabenstellung an sich: Wir haben weiterhin 2 verbundene Stichproben. Noch mal zur Erinnerung, was heißt das? Das heißt, dass die, wenn wir hier mal direkt zu Voraussetzungen springen, dass die Merkmalspaare, die sich ergeben, also wir haben einen Merkmalsträger, eine Person n, also wir haben eine Person bis n-Personen, und 1 Person wird auf das Medikament x getestet und auf das Medikament y. Und so ergeben sich für 1 Person, für 1 Merkmalsträger ergibt sich 1 Merkmalswertepaar xi, yi, zum Beispiel die Anzahl der Stunden Schlaf. Also, wir brauchen 2 verbundene Stichproben, das heißt nämlich, dass wir jetzt nicht 50 Personen auf das eine Medikament testen, 50 Personen auf das andere, sondern insgesamt 50 Personen werden auf beide Medikamente überprüft - also eine Grundgesamtheit, die hier zusammengefasst wird. Gut, was können wir überhaupt überprüfen? Wir überprüfen, ob die Verteilung von x und y sich unterscheidet oder eben nicht. Auf die Voraussetzungen bin ich schon teilweise eingegangen, es muss zumindest metrisch messbar sein, das heißt, wir brauchen konkrete Zahlen für die Merkmale, um die Unterschiede hier auch deutlich zu machen. In dem Stil hier mit dem Vorzeichen-Rang-Test geht es darum, dass wir nicht nur sagen, besser oder schlechter, sondern wir gewichten auch, wie viel besser oder wie viel schlechter das einzelne Medikament wirkt. Voraussetzungen dann wie gehabt, muss eine verbundene Stichprobe sein. Die Nullhypothese, die ist hier auch schnell dargelegt. Hier geht es einfach darum: Wir behaupten, dass die Wahrscheinlichkeit, dass xy ist, also dass die Verteilung gleich ist - mit 0,5 bewertet. Also dass wir genauso viele, jetzt mal auf das Beispiel angewendet, dass wir genauso viele Probanden haben, die besser auf das x-Medikament reagieren und genauso viele Probanden haben, die besser auf das y-Medikament reagieren, also sind die Zufallsvariablen x und y in dem Sinne gleich verteilt. Das ist die Nullhypothese, und die kann wie immer nun widerlegt werden oder nicht widerlegt werden. Bitte nicht erschrecken an dieser Stelle, aber es ist so, die Testgröße wird hier ein wenig komplexer zu berechnen sein beim Vorzeichen-Rang-Test als bei dem ein oder anderen Test, den wir bislang kennengelernt haben. Nun gehen wir schrittweise durch, einfach das Wichtigste mitschreiben, ein bisschen versuchen, zu verstehen, aber das meiste Verständnis, versprochen, kommt am Ende dieses Videos mit dem Beispiel - wie immer eigentlich. Ne? So, das heißt, der I. Schritt, den wir zu tun haben, ist, wir müssen die Differenzen xi-yi bestimmen, und wenn wir Paare haben, das heißt, eine Person, die auf das eine oder und auf das andere Medikament mit einer Schlafzeit von 6 Stunden reagiert, wird das eliminiert. Diese Fälle werden also nicht betrachtet, sondern wir bestimmen nur die Differenzen xi-yi, wenn eben das eine nicht gleich dem anderen gleicht. Das II. was wir jetzt hier machen, deswegen Vorzeichen-Rang-Test, wir ordnen jetzt die Beträge der Differenzen von xi, yi nach der Größe. Dabei markieren wir gleichzeitig, ob es sich um eine positive Differenz handelt oder eine negative Differenz, also ob die Differenz > oder <. Wenn wir das alles geordnet haben, teilen wir den einzelnen Differenzen Rangziffern zu, Rangziffern ri der Größe nach. Das heißt zum Beispiel, die kleinste Differenz bekommt die Nummer 1, die zweitkleinste Differenz die Nummer 2, den Wert 2 und so weiter. Also ordnen, Rangziffern geben. Was ist jetzt, wenn wir eine Differenz, zum Beispiel den Wert 2, mehrmals haben? Nun, dann zählen wir, wie oft wir den Wert 2 haben als Differenz, und bilden daraus das arithmetische Mittel. Dann bestimmen wir die Randsummen, das heißt, wir zählen, wie oft kam es vor, dass xi-yi >0 war? Das ist dann unser Rn^+, unsere positive Randsumme. Und wir zählen, wie oft xi-yi. Hier folgt noch eine Ergänzung zur Testgröße, und zwar nach IV kommen wir V. Was ist denn jetzt eigentlich die Testgröße genau, weil bisher haben wir nur Arbeitsschritte befolgt. Die Testgröße an sich, die wir brauchen, ist Rm. Und Rn ist das Minimum zwischen Rm^+ und Rm^-. Also was die kleinere Größe ist zwischen Rm^+ und Rm^- ergibt sich als allgemeine Testgröße Rn. Was können wir noch über die Verteilung sagen? Wenn unser n≤25 ist, können wir leider keine Aussagen über die Verteilung machen. Um dann trotzdem Werte zu bekommen für die Annahmekennzahlen, was jetzt gleich im nächsten Schritt folgt, benötigen wir eine gesonderte Tabelle. Also merken für den Vorzeichen-Rang-Test, das normale Tabellenwerk ist nicht verwendbar, wenn unsere Stichprobe ≤25 ist. Da muss man sich das im Internet raussuchen oder in der Klausur muss es entsprechend gegeben sein. Ist unser n aber >25, können wie die Normalverteilung annehmen für Rn^+ sowie für Rn^- mit den entsprechenden Parametern μR und σR, die da sind ¼n×(n+1) und unsere Standardabweichung ergibt sich aus 1/24×n×(n+1)×(2n+1). Das sind die Sachen, die wir brauchen und das bitte alles schön notieren. Hier sind die 2 noch ausstehenden Punkte, und zwar die Bestimmung der Annahmekennzahlen und letztendlich die Testentscheidung. Nun, Annahmekennzahlen, wie bereits erwähnt, wird das hier ein bisschen schwieriger oder einfacher, je nachdem, wie man es sieht, für n≤25. Weil wir können uns das nicht selber raussuchen, wie wir es aus dem Standardtabellenwerk kennen, sondern in dem Fall benötigt man für den Vorzeichen-Rang-Test eine extra Tabelle, die gegeben sein muss. Das setzen wir mal hier voraus. Das Ablesen daraus ist wiederum einfach, nur der Zugang zur Tabelle muss einfach gewährleistet sein. Ja, für den Fall n>25, wie bereits gesagt, sind wir dann hier in der Normalverteilung. Dementsprechend brauchen wir einfach unseren Wert z, abhängig von unserem Signifikanzniveau, und unser μR und σR berechnen wir, wie es gerade in der Testgröße unter V aufgezeigt wurde. Die Testentscheidung fällt dann so: H0 wird abgelehnt, falls unser Rn, also die Testgröße, die wir uns hergeleitet haben, wenn die unterhalb der Untergrenze liegt. So weit die Formalitäten, gleich folgt das Beispiel, anhand, ja, dessen es etwas einfacher werden sollte. So zusammen, dann sind wir auch schon am Beispiel zu dem Vorzeichen-Rang-Test angelangt. Also die lange Vorgeschichte bringe ich jetzt hier nicht ans Tafelbild, sondern erkläre euch kurz, was wir hier gegeben haben. Wir haben, wenn wir beim Medikamententest bleiben, 8 Personen, die getestet werden, das ist unser i. Also i geht von 1 bis 8. Also haben wir n=8, das ist hier unten auch noch mal gesagt, n=8. Die Differenzen haben wir jetzt hier schon gebildet, das heißt, ja, ich habe die Werte jetzt schon als gegeben angenommen und die Differenzen gebildet, das heißt, der Proband 1 hat 1 Stunde länger geschlafen mit dem Mittel x als mit dem Mittel y. Und genauso weiter, Proband 2 2 Stunden länger mit x als mit y und so weiter. Zieht sich hier durch, das heißt wir hatten letztendlich nur 1 Probanden, der überhaupt länger geschlafen hat mit dem Schlafmittel y als mit y und das war der Proband 6. Daher bekommen wir hier eine negative Differenz. Nun, ihr seht, ein paar Felder sind hier noch frei, ein paar Spalten. Was haben wir gemacht? Wir haben unsere i's aufgelistet, unsere Differenzen gebildet. Für die entsprechenden Differenzen, also wir gehen jetzt hin zur Testgröße - all da, was ihr euch dazu notiert habt, dürfte jetzt hilfreich sein - von der Differenz xi-yi gehen wir direkt hierüber in eine 2. Tabelle. Also das sind jetzt einfach 2 unabhängige Sachen voneinander. Und hier erarbeiten wir uns die Spalte ri. Das heißt, was haben wir hier? Hier ist das gleiche xi-yi, nur dem Betrag nach. Also das -1 wurde hier bereits als positiv ausgewiesen, einfach als 1 und sie ist schon geordnet. Wir haben ja gesagt, wir wollen sie ordnen. Das heißt, die geringste Differenz 1 taucht 3× auf, dann 2 und dann die Differenz 3, das heißt, die Spalte einfach der Größe nach geordnet. Dann, was haben wir hier, so gesehen, an Plätzen zu vergeben? Also die 1. 3 Probanden haben die Differenz 1. Wir haben in der Testgröße, als wir uns damit beschäftigt haben, notiert, was wir in so einem Fall tun. Das heißt, wir bilden jetzt hier das arithmetische Mittel. Und das arithmetische Mittel ist jetzt so gesehen, kann man, je nachdem, wie deutlich man es sieht. Der korrekteste Weg ist so gesehen, wenn wir hier die Summe bilden, also 3+2+1, sind wir bei 6. Das heißt wir haben die Ordnung jetzt hier 6, geteilt durch die Anzahl an Probanden, die Anzahl, wie oft kommt das vor. Also die Summe 6/3, bekommen wir das Gewicht 2. Das ist unser ri. Die gleiche Differenz 1 wird gewichtet mit 2. Ja, gleiches Beispiel machen wir hier. Wir haben hier die Differenz 2, die kommt 2× vor, und zwar auf die Plätze 4 und 5 verteilt. Das arithmetische Mittel von 4+5=9/2=4,5. Das ist das Gewicht hierfür. Und dann haben wir noch die Differenz 3 3× auf den Plätzen 6, 7 und 8. Und ja, entweder wir bilden wieder die Summe und teilen es durch 3 oder wir nehmen, ne, wenn wir 3 Ziffern haben, können wir einfach das in der Mitte nehmen, also haben wir hier das Gewicht 7. So, das sind unsere ri's für die entsprechenden Differenzen. Die übertragen wir jetzt in unsere eigentliche Tabelle, die wir benötigen. Das heißt, für die Differenz xi-yi=1 haben wir das Gewicht 2 gerade berechnet, das heißt 2. Für die Differenz 2 haben wir das Gewicht 4,5 berechnet, also 4,5. Für 1, wie gehabt, 2. Für die Differenz 2 weiterhin 4,5. Für die Differenz 3, schauen wir in unserer Tabelle nach, haben wir das Gewicht 7. Für 1, nach wie vor, also beziehungsweise für -1 das Gleiche wie für 1. Deswegen haben wir hier auch den Betrag genommen. Das heißt, auch hier haben wir das Gewicht 2. Und für die Differenz von 3 haben wir weiterhin unsere 7. Nun, das ist jetzt geordnet beziehungsweise den entsprechenden Probanden zugeordnet. Was haben wir noch ausgewiesen in der Testgröße? Wir haben gesagt, wir sollen einen Vermerk machen, ob es trotzdem eine positive Differenz ist oder eine negative Differenz. Daher haben wir hier noch mal 2 Spalten: >0, <0. Das bezieht sich auf die Differenz xi-yi. Das heißt, hier tragen wir jetzt noch einmal unsere ri's in die entsprechende Spalte ein. Das heißt, >0, orientieren wir uns hier bei der Differenz, sind so gesehen alle >0 bis auf Proband 6. Dementsprechend übertragen wir die ri's fast komplett hier rüber: 2; 4,5; 2; 4,5; 7, das ist die positive Spalte. Und jetzt der 6. Proband, der hat als Ergebnis eine negative Differenz für die beiden Medikamente, das heißt diese 2 kommt in die negative Spalte, 2. Und die letzten beiden sind wieder positiv, daher hier. Gut, das hätten wir schon mal geschafft. Der nächste Schritt ist jetzt, wir brauchen jetzt tatsächlich unser Rm^+ und unser Rm^-. Und was die Formel hergibt, wir schauen noch mal nach, ist jetzt einfach die Summe dieser Spalten. Das heißt, das ist ja positiv, >0, also unser Rn^+ ergibt sich aus der Summe dieser Zahlen, das ergibt 34. Und die 2. Summe ist ebenso schnell berechnet, ergibt 2. Jetzt haben wir gesagt, nehmen wir noch einen Schritt zur Kontrolle dazwischen, das heißt (Rn+)+(Rn-)=, und jetzt haben wir n(n+1)=8×9/2. 8×9=72/2, sind wir bei 36 - und das entspricht der Summe von (Rn+)+(Rn-). 24+2=36, und genau das ist auch das, was die Kontrolle ergibt. So, jetzt haben wir die Testgröße noch nicht ganz. Der letzte Schritt, unsere richtige Testgröße Rn=min(Rn+;Rn-), das heißt aus dem Minimum von 34 und 2. Das Minimum dieser beiden Zahlen =2. Also ist 2 unsere finale Testgröße für dieses Beispiel. Jetzt nehmen wir noch die Werte, die gegeben sind bei dieser Aufgabe. Also α=0,05, ist gegeben. Unser Signifikanzniveau, wir haben 8 Probanden, daher n=8. Und daraus ergibt sich für den einen oder anderen an dieser Stelle etwas willkürlich, aber das ergibt sich aus dieser anderen Tabelle, die ich bereits erwähnt habe, die ihr mal im Internet nachsuchen müsst. Für den Vorzeichen-Rang-Test bekommt ihr aus dieser Tabelle für diese Angaben α=0,05, bekommt ihr die untere Grenze 03. So, für Rn und Cu haben wir den Vergleich. In unserem Fall ist Rn<Cu, weil 2<3. Also liegt unsere Testgröße unterhalb der unteren Annahmekennzahl, der unteren Grenze. Was heißt das? Das heißt, dass wir unser H0 verwerfen müssen. H0 wird verworfen. Was war unser H0? Unsere Nullhypothese für den Vorzeichen-Rang-Test lautete allgemein, dass wir gesagt haben, die Medikamente x und y sind gleich verteilt. In anderen Worten, sie haben die gleiche Wirkung. Nun, dem einen oder anderen wird anhand dieser Spalte direkt aufgefallen sein, dass das anscheinend nicht der Fall sein kann, da letzen Endes nur 1 Proband eine bessere Wirkung mit dem Medikament y erzielt hat als mit dem Medikament x. Das ist jetzt an dieser Stelle auch statistisch noch nachgewiesen und damit, ja, valide. Ja, das war jetzt das Beispiel zum Vorzeichen-Rang-Test. Ich hoffe, so weit ist es verständlich geworden. Die Theorie an sich klingt ein wenig kompliziert mit den einzelnen Schritten. Wie wir hier gesehen haben, ist es doch recht einfach durchführbar, wenn man die einzelnen Schritte kennt. Viel Aufwand steckt da nicht dahinter, zumindest bei diesen Stichprobenumfängen. Von daher, viel Erfolg mit dem Gelernten und schaut auch mal in die anderen Tests noch rein, ja? Bis dahin.

Informationen zum Video