Statistik 2 VL 1

Card Set Information

Author:
huatieulans
ID:
311805
Filename:
Statistik 2 VL 1
Updated:
2016-01-13 08:06:41
Tags:
Klausur
Folders:
Statistik 2
Description:
Klausurvorbereitung
Show Answers:

Home > Flashcards > Print Preview

The flashcards below were created by user huatieulans on FreezingBlue Flashcards. What would you like to do?


  1. Stetige Zufallsvariablen
    • Eine Zufallsvariable X heißt stetig, falls der Wertebereich von X durch ein
    • endliches bzw. unendliches Intervall gegeben ist.

    • Die Funktion F(x) = P(X ≤ x), x ∈ R, heißt Verteilungsfunktion von X.
    • Es sei X eine stetige Zufallsvariable. Es gebe eine Funktion f (x), so dass gilt:

    • P(a≤X≤b)=∫f(x) dx mit a<b
    • Dann heißt die Funktion f (x ) die (Wahrscheinlichkeits-)Dichte der Verteilung von X.
  2. Das p-Quantil xp ist für eine stetige, streng monotone Verteilungsfunktion F(x) definiert durch:
    • F(xp)= p bzw
    • xp = F-1 (p)
  3. Der Erwartungswert E (X ) = μ einer Zufallsvariablen X mit der Dichtefunktion f (x) ist definiert durch:
    E(X)= -∞ x f(x) dx
  4. Die theoretische Varianz V (X ) = σ2 einer Zufallsvariablen X ist definiert durch:
    V(X)=-∞(x − μ)2 f (x )dx

    Vereinfachte Berechnung der Varianz:

    V (X ) = E (X 2 ) − [E (X )]2
  5. Die Standardabweichung ist gegeben durch:
    σ=+ √σ2
  6. Gleichverteilung
    Eigenschaften:
    • Eine Zufallsvariable X heißt gleichverteilt (oder rechteckverteilt) über
    • dem Intervall [a, b],X ∼ U(a, b), wenn ihre Dichte die folgende Form hat:

    f(x) =

    • Eigenschaften: 
    • E[X] = a + b / 2
    • Var[X] = (b-a)2 /12
  7. Pareto-Verteilung: Definition und Eigenschaften
    Verteilung der Erwerbseinkommen über einen Minimalwert k.

    Definition (Pareto-Verteilung)

    • Eine Zufallsgröße X heißt Pareto-verteilt mit den Parametern k,α > 0,
    • X ∼ PA(k, α), wenn ihre Dichte gegeben ist durch:
    • f(x) = 

    Eigenschaften:
  8. Definition: Exponentialverteilung
    • Eine stetige Zufallsgvariable X heißt exponentialverteilt mit dem
    • Parameter λ > 0, X ∼ EX (λ), wenn ihre Dichte gegeben ist durch:
    • f(x) = λe-λx für x>= 0

    • Eigenschaften 
    • a) E(X) = 1/λ
    • b) V(X) = 1/ λ2
    • c) P(X > x2 + x1 | X > x1) = P(X > x2)

    • "Prozess ohne Gedächtnis“: Rest-Laufzeit x2 nach x1 hängt nicht von
    • der Länge der erreichten Zeit x1 ab.
  9. Verteilungsfunktion der Exponentialverteilung
    F(x) = 1-e-λx für x>= 0
  10. Quantilsfunktion der Exponentialverteilung:
    • F(xp)= p = 1-e-λx
    • xp= - ln (1-p) /λ
  11. Normalverteilung
    Die Normalverteilung besitzt in der Statistik eine herausragende Bedeutung.

    • Trotzdem:
    • Die Normalverteilung ist kein natürliches Verteilungsmodell für alle
    • empirischen Phänomene!

    • Ihre Bedeutung resultiert aus dem zentralen Grenzwertsatz der
    • Wahrscheinlichkeitstheorie: Bei Zufallsgrößen als Summe von vielen
    • unabhängigen Einflussgrößen.
  12. Eigenschaften der Normalverteilung (Cont’d)
    Beziehung zwischen Quantilen

    • Zwischen dem p-Quantil xp der N(μ,σ2)-Verteilung und dem
    • p-Quantil zp der Standardnormalverteilung besteht die Beziehung

    zp = xp − μ /σ  bzw. xp = μ + σzp

    Insbesondere gilt:

    P(X ≤ x) = Φ (x- m /σ) 

    • d) Symmetrie bezüglich μ:
    • P(X ≤μ−c)=P(X ≥μ+c)

    d.h  F(μ − c) = 1 − F(μ + c).
  13. Probleme mit umfangreichen Grundgesamtheiten
    • Die genau spezifizierte Menge aller interessierenden Untersuchungseinheiten
    • wird Grundgesamtheit genannt.

    • Probleme in Zusammenhang mit sehr umfangreichen Grundgesamtheit
    •  Abgrenzbarkeit: In vielen Fällen ist eine exakte Abgrenzung (gehört
    • eine Untersuchungseinheit zur Grundgesamtheit oder nicht) vorab
    • schwierig (z.B. sind dem Hersteller eines Joghurts seine Kunden i.d.R.
    • nicht namentlich bekannt).

    • Kosten: Die Erfassung der Ausprägungen der Merkmale bei sehr vielen
    • Untersuchungseinheiten kann extrem kostspielig sein (z.B. Befragung
    • von allen Nutzern eines Produktes).

    • Zeit: Die Erfassung der Ausprägung der Merkmale bei sehr vielen
    • Untersuchungseinheiten kann zu lange dauern. (Daten als
    • Entscheidungsgrundlage für die Gestaltung einer kurzfristigen
    • Promotion-Aktion werden binnen weniger Tage benötigt, eine
    • Befragung einiger 10000 Kunden ist in dieser Zeit nicht realisierbar.)

    • In einigen Fällen ändert sich die Ausprägung des interessierenden
    • Merkmals durch die Messung (z.B. muss eine Batterie vollständig
    • entladen werden, um die genaue Kapazität bestimmen zu können).
  14. Lösungsmöglichkeit
    nicht alle Einheiten der Grundgesamtheit untersuchen (Totalerhebung)

    • nach einem bestimmten Auswahlverfahren (→ Vorlesung Stichprobentheorie) eine Stichprobe ziehen
    • die Ausprägung des interessierenden Merkmals bei den Untersuchungseinheiten in der Stichprobe messen

    • anhand der Untersuchung der Stichprobe gewonnenen Ergebnisse auf
    • die Population der Grundgesamtheit übertragen (Inferenzstatistik)
  15. Frage: Wann ist die Körpergröße einer Person eine zufällige Größe?
    Die Person ist nicht festgelegt.

    • Aus einem Personenregister werden zufällig nacheinander n Personen
    • ausgewählt.

    • a) Die Auswahl der Personen ist unabhängig voneinander.
    • b) Die Auswahlwahrscheinlichkeit darf nicht von der Körpergröße abhängen.

    • Die Anforderung a) sichert die Unabhängigkeit der Größenmessungen.
    • Die Anforderung b) ist für die Interpretation der Ergebnisse auf Basis der
    • Stichprobe essentiell.
  16. Wiederholung: Eiegnschaften von E(X) und V(X)
    Für zwei Zufallsvariablen X1 und X2 mit den Erwartungswerten E(X1) und E(X2) gilt:

    • E(aX1+b)=a E(X1)+b  a,b∈R
    • E(X1 + X2) = E(X1) + E(X2)

    • • Für zwei Zufallsvariablen X1 und X2 mit den Varianzen V(X1) und
    • V (X2) gilt:

    • V(aX1+b)=a2V(X1) a,b∈R
    • Sind X1 und X2 unabhängig, so gilt weiterhin:

    V (X1 + X2) = V (X1) + V (X2)
  17. Schätzfunktion
    • Unbekannte Verteilungsparameter, z.B. μ, σ2, p, λ, usw., werden
    • üblicherweise mit dem griechischen Buchstaben θ (sprich: „Theta“)
    • bezeichnet.

    Definition (Schätzfunktion)

    • Eine Stichprobenfunktion θˆ(X1, . . . , Xn), deren Wert θˆ(x1, . . . , xn) als
    • Schätzwert für den unbekannten Parameter θ dient, heißt Schätzfunktion
    • (oder kurz: Schätzer) für θ.

    • Häufig benutzt man die Kurzschreibweise θˆ für θˆ(X1, . . . , Xn) bzw.
    • θˆ(x1, . . . , xn). Der Unterschied zwischen Schätzfunktion und Schätzwert ist
    • dabei aus dem jeweiligen Kontext zu ersehen.
  18. Wahl der Schätzfunktion
    • Häufig stehen mehrere alternative Schätzfunktionen für denselben
    • Parameter zur Verfügung, so dass das Problem entsteht zu entscheiden,
    • welche der Schätzfunktionen gewählt werden soll.

    Wichtig:

    • Schätzfunktionen sind Funktionen von Zufallsvariablen. Somit sind
    • Schätzfunktionen selbst Zufallsvariablen, haben also eine Verteilung, einen
    • Erwartungswert und eine Varianz. Im Folgenden wird es darum gehen, diese
    • Eigenschaften zu bestimmen und zu interpretieren.
  19. Erwartungstreue
    Def. Bias
    Ein Schätzer sollte den wahren Parameterwert im Mittel treffen.

    Definition (Bias (Verzerrung))

    • Die erwartete Abweichung des Schätzers vom wahren Wert
    • b ( θˆ , θ ) = E ( θˆ ) − θ
    • heißt Bias bzw. Verzerrung.

    Definition (Erwartungstreue (Unverzerrtheit))

    • θˆ(X1, . . . , Xn) heißt unverzerrt bzw. erwartungstreu für θ, wenn
    • b(θˆ,θ)=0 d.h. E(θˆ)=θ.

    Andernfalls heißt θˆ verzerrt.
  20. Erwartungstreue: Bemerkungen
    • Der Bias b(θˆ, θ) = E (θˆ) − θ ist die systematische Abweichung, die
    • eine Schätzfunktion vom zu schätzenden Parameter aufweist.



    • In empirischen Arbeiten wird häufig jede Abweichung von θˆ von θ als
    • Verzerrung bezeichnet. Diese Bezeichungsweise ist nicht gerechtfertigt.
    • Abweichungen vom wahren Wert θ können rein zufällig entstehen,
    • obwohl der Schätzer θˆ unverzerrt ist.
  21. Asymptotische Erwartungstreue
    • Schätzer, deren Erwartungwert mit wachsendem n gegen den wahren
    • Parameterwert konvergiert, heißen asymptotisch erwartungstreu.

    Definition (Asymptotischer Bias)

    • Die asymptotische erwartete Abweichung des Schätzers vom wahren Wert
    • lim b(θˆ,θ)= lim E(θˆ)−θ

    heißt asymptotischer Bias.

    Definition (Asymptotische Erwartungstreue)

    • θˆ(X1, . . . , Xn) heißt asymptotisch erwartungstreu für θ, wenn
    • lim b(θˆ,θ) = 0 d.h. lim E(θˆ) = θ.

    Hinweis: Jeder erwartungstreue Schätzer ist auch asymptotisch

    erwartungstreu.
  22. Konsistenz
    • Die Varianz einer „guten“ Schätzfunktion sollte mit wachsendem
    • Stichprobenumfang n immer kleiner werden und für n → ∞ gleich 0 sein.

    Definition (Konsistenz)

    • θˆ(X1, . . . , Xn) heißt eine konsistente Schätzfunktion für den Parameter
    • θ, falls

    • lim E(θˆ)=θund lim V(θˆ)=0
    • n→∞ 
    • gilt.

    • Konsistenz ist eine Minimalvoraussetzung an Schätzfunktionen: Mit
    • wachsendem Stichprobenumfang strebt die Schätzung θˆ gegen den wahren
    • Wert θ.
  23. Mean Squared Error
    Wichtiges Kriterium zur Beurteilung der Güte eines Schätzers:

    Definition (Mean Squared Error)

    • Der mittlere quadratische Abstand eines Schätzers θˆ zum zu schätzenden
    • Parameterwert θ

    • ˆ 􏰂􏰑ˆ 􏰒2􏰃
    • MSE(θ,θ) = E θ(X1,...,Xn)−θ

    heißt Mean Squared Error (= MSE).
  24. Bias-Varianz-Zerlegung des MSE
    • MSE(θˆ,θ) = (E(θˆ) − θ)2 + V(θˆ)
    •                 = b(θ,θ)2 +V(θ)

    • Die Konsistenz lässt sich äquivalent zu der bekannten Weise auch über den
    • MSE definieren:

    • θˆ(X1, . . . , Xn) heißt eine konsistente Schätzfunktion für den Parameter θ,
    • falls

    • lim MSE(θˆ,θ)=0
    • n→∞

    gilt.
  25. Vergleichkriterium: Effizienz
    • Vergleich mehrerer erwartungstreuer Schätzfunktionen: Welche
    • Schätzfunktion ist bei gegebener Verteilung und festem
    • Stichprobenumfang n die „beste“?

    • bevorzugen die Schätzfunktion mit der geringsten Varianz
    • über MSE-Vergleich können auch Schätzfunktionen sinnvoll verglichen

    werden, die lediglich asymptotisch erwartungstreu sind

    MSE: „trade-off“ zwischen Bias und Varianz

    Definition (Effizienz)

    • Sind θˆ1 und θˆ2 zwei Schätzfunktionen für denselben Parameter θ, so heißt
    • θˆ1 effizienter als θˆ2, wenn für alle Werte von θ
    • MSE(θˆ1,θ) ≤ MSE(θˆ2,θ)
    • gilt und für mindestens ein θ0 echt “<” gilt.
  26. Robustheit
    • Eigenschaft, dass Schätzer unempfindlich sind gegen „Ausreißer“ und
    • „leichte“ Modellabweichungen

    • empirische Erfahrung: Bis zu 10% der Daten sind „verschmutzt“, d.h.
    • ca. 90% der Daten lassen sich gut durch ein Verteilungsmodell
    • beschreiben, die restlichen liegen aber vom „Datenkörper“ zu weit weg
    • bzw. stören die Anpassung

    • unter einer symmetrischen Verteilung sind X ̄ und der Median X ̃
    • konsistente Schätzer für den Erwartungswert μ

    • • X ̄ nutzt alle Daten: Nicht robust, unter Normalverteilung jedoch
    • effizienter als X ̃

    • • X ̃ nutzt nur einen (bzw. zwei) Werte: robust, jedoch unter
    • Normalverteilung weniger effizient als X ̄
  27. Zielstellung eines Konfidenzintervalls
    • Für gut interpretierbare Parameter einer Verteilung (z.B. den
    • Erwartungswert) soll auf Basis einer Stichprobe . . .

    • a)  ein Intervall angegeben werden, so dass die Wahrscheinlichkeit
    • berechnet werden kann, mit der der wahre Parameter von dem
    • Intervall überdeckt wird.

    • b)  Die Überdeckungswahrscheinlichkeit ist mindestens so groß wie ein
    • vorgegebener Wert („Konfidenzniveau“).

    Alternative Bezeichnung: Intervallschätzung

    Gesucht sind zwei Stichprobenfunktionen mit:

    • U(X1,...,Xn) < O(X1,...,Xn)
    • P􏰀U(X1, . . . , Xn) ≤ θ ≤ O(X1, . . . , Xn)􏰁 ≥ 1 − α

    Definition (Konfidenzintervall)

    • [U , O ] ist das Konfidenzintervall für θ zum Konfidenzniveau 1 − α
    • (α =„Irrtumswahrscheinlichkeit“).
  28. Anwendung eines Konfidenzintervalls
    • U = u und O = o werden beobachtet.
    • Aussage:
    • „θ liegt im Intervall [u, o]“

    • diese Aussage ist mit Wahrscheinlichkeit α bei wiederholter Anwendung falsch
    • daher sollte α klein sein!

    • - wurden die Grenzen für ein konkretes Intervall berechnet, so gilt die
    • Wahrscheinlichkeitsaussage nicht mehr!

    -statistisches Problem bei der Festlegung von U(X1, . . . , Xn) und O(X1,...,Xn):

    • a) Die Intervall-Länge soll möglichst klein sein.
    • b) Das Konfidenzniveau muss eingehalten werden.
  29. Konfidenzintervall für den Erwartungswert μ der Normalverteilung (σ bekannt)
    • a) X ̄ ist ein guter Schätzer für μ. Das Konfidenzintervall sollte um X ̄
    • konzentriert sein.

    b) Die Normalverteilung ist symmetrisch um μ. Daher sollte das Konfidenzintervall ebenfalls symmetrisch um X ̄ sein.

    Ansatz: U = X ̄ − c         O = X ̄ + c

    c) Drücke c in Vielfachen der Standardabweichung von X ̄= (σ/√n) aus:

    U = X − k σ/√n      O = X + k σ/√n

    􏰎
  30. Konfidenzintervall für den Erwartungswert μ der Normalverteilung (σ bekannt) (Cont’d)

    d) Bestimmung von k:
    • 1−α ≤ P(U≤μ≤O)
    • = P( X − k σ/√n <= μ <= X + k σ/√n)

    • Durch Umformen erhält man:
    • -k <= X⊽ - m // σ/√n <= k
  31. Konfidenzintervall für den Erwartungswert μ der Normalverteilung (σ bekannt) (Cont’d)
    • Da X⊽ - m // σ/√n ∼ N(0,1), lautet die Lösung:
    • k = z1− α/2 , d.h.
    • P(...)= 1- a

    • Schwankungsintervall für X ̄:
    • • Die Wahrscheinlichkeit, dass der aus einer Stichprobe vom Umfang n
    • bestimmte Mittelwert X ̄ im Intervall liegt, beträgt 1 − α.

    • • Die Grenzen des Intervalls sind fest, X ̄ ist eine Zufallsvariable.
    • Konfidenzintervall für μ:
    • • Die Wahrscheinlichkeit, dass μ im Konfidenzintervall liegt, beträgt
    • 1−α.

    • • μ ist eine (unbekannte) Konstante, die Grenzen des Intervalls sind
    • Zufallsvariablen, weil X ̄ eine Zufallsvariable ist!
  32. Konfidenzintervall für μ der Normalverteilung (σ unbekannt) 
    Problem
    • Durch die Schätzung von σ durch σˆ kommt zusätzliche Unsicherheit in den Term. Die Zufallsgröße T = X ̄−μ //σˆ/ n ist nicht standardnormalverteilt!
    • T ist t-verteilt mit ν = n − 1 Freiheitsgraden (degrees of freedom (df)).
  33. Einschub: Die t-Verteilung
    • Die t-Verteilung besitzt den Parameter ν („Freiheitsgrade“). Sie ist in
    • jedem Statistik-Lehrbuch tabelliert.

    • tν,α ist das α-Quantil der t-Verteilung mit ν Freiheitsgraden. Wegen der
    • Symmetrie zum Nullpunkt gilt: tν,α = −tν,1−α

    Für große Werte von ν gilt: tν,α≃z awobei: zα das α-Quantil der Standardnormalverteilung ist.

    Im R-Studio:

    • dt(x, df) Dichtefunktion
    • pt(x, df) Verteilungsfunktion
    • qt(p, df) Quantilsfunktion
    • rt(n, df) Zufallszahlengenerator

    df entspricht der Anzahl der Freiheitsgrade.
  34. Hypothese und Alternative: einseitig
    • Hypothese und Alternative zerlegen die Menge der möglichen
    • Parameterwerte in zwei disjunkte Teilmengen.

    • Im Beispiel: θ = p ∈ (0, 1)
    • Hypothese: H : θ ≥ 0.3
    • Alternative: A : θ < 0.3

    • Allgemeine Formulierung:
    • („einseitige Hypothese“)

    • H:θ≥θ0 A:θ<θ0
    • bzw.
    • H:θ≤θ0 A:θ>θ0
  35. Hypothese und Alternative: zweiseitig

    In bestimmten Situationen hat man es mit zweiseitigen Alternativen zu tun:
    Beispiel:

    • Situation Qualitätskontrolle. Es wird ein neues Material eingesetzt, von
    • dem man nicht weiß, ob es besser oder schlechter ist als das bisher
    • benutzte Material.

    • Fragestellung: Unterscheidet sich die Ausschussrate θ überhaupt von θ0
    • (=Wert für bekanntes Material)?


    Allgemeine Formulierung:

    („zweiseitige Hypothese“)

    • H : θ=θ0
    • A : θ≠θ0
  36. Testen und Hypothesen 
    Fehler 1. und 2. Art
    • Fehler 1. Art: Man entscheidet sich für die Alternative („neues Verfahren
    • ist besser“), obwohl in der Realität das alte Verfahren mindestens genau so
    • gut ist. ⇒ Die Produktion wird auf das teure Verfahren umgestellt, obwohl
    • dieses keine Vorteile bringt!

    • Fehler 2. Art: Man lehnt die Alternative („neues Verfahren ist besser“) ab
    • und geht fälschlicherweise davon aus, dass die Umstellung keine Vorteile in
    • Bezug auf den Ausschussanteil bringen würde. ⇒ Die 20 beim Versuch
    • verschlissenen Teile werden abgeschrieben.

    • Die Wahrscheinlichkeit für den Fehler 1. Art wird vorab festgelegt, der
    • Fehler 2. Art ist nicht genau bekannt und kann bei einzelnen Tests hohe
    • Werte annehmen.
  37. Testen und Hypothesen
    Konsequenzen
    • Hypothese und Alternative sind so zu formulieren, dass die Konsequenzen
    • des Fehlers 2. Art „weniger schlimm“ sind als die des Fehlers 1. Art.

    • Wird bei einem Test die Hypothese nicht abgelehnt, wird das Ergebnis
    • vorsichtig formuliert, weil man die Größe des Fehlers 2. Art nicht kennt:

    • Statt: „Die Hypothese ist richtig“ mit der Folgerung „Die Alternative ist
    • daher abzulehnen“,

    • sagt man: „Die Hypothese kann nicht abgelehnt werden.“ Dies hat nicht
    • die Implikation, dass die Alternative abzulehnen ist.
  38. Test und Hypothese 
    Beispiel: Formulierung
    • Häufig ist das Forschungsinteresse auf die Bestätigung eines Effekts
    • gerichtet, z.B. der Erwartungswert μ der Differenz zweier Zufallsgrößen X1
    • und X2 ist von 0 verschieden (X1= Merkmalswerte ohne Behandlung; X2=
    • Merkmalswerte mit Behandlung).

    • In diesem Fall lautet die („Null“-)Hypothese μ = 0, also „kein Effekt“. Das
    • Testergebnis „Die Null-Hypothese kann nicht verworfen werden“ bedeutet
    • dann nicht, dass kein Effekt vorhanden ist, sondern nur, dass mit den
    • vorliegenden Beobachtungen kein Effekt sicher nachgewiesen werden kann.
    • Die Konsequenz kann z.B. sein, die Anzahl der Beobachtungen zu
    • vergrößern.
  39. Teststatistik und kritischer Bereich
    • Eine Teststatistik T ist eine Stichprobenfunktion, dessen Ausprägung zur
    • Testentscheidung führt. Dazu wird ein „kritischer Bereichs“ K (auch als
    • „Ablehnungsbereich“ bezeichnet) und ein „Annahmebereichs“ K ̄ festgelegt.

    • T ∈ K ⇒ Hypothese ablehnen
    • T ∈ K ̄ ⇒ Hypothese annehmen

    bzw. nicht verwerfen

    Die Werte, die diese Bereiche voneinander trennen, heißen kritische Werte.

    • Bemerkung: Ein Test möchte gerade zufällige Schwankungen der
    • Teststatistik erkennen und erst zu einer Ablehnung führen, wenn die
    • Teststatistik signifikant abweicht.
  40. Testen und Hypothesen
    Überlegungen zur Festlegung des kritischen Bereichs
    • Für θ ∈ H gibt P(T ∈ K|θ) den Fehler 1. Art an. Ein statistischer Test
    • sollte ein vorgegebenes Fehlerniveau α einhalten:

    P(T∈K|θ)≤α für θ∈H

    • Für θ ∈ A gibt P(T ∈ K|θ) die Wahrscheinlichkeit an, die richtige
    • Entscheidung zu treffen. Hier sollte diese Wahrscheinlichkeit möglichst groß
    • sein, um den Fehler 2. Art zu minimieren.
  41. Testen und Hypothesen
    Eigenschaften von einseitigen Tests
    • 1)  Je eindeutiger θ in dem durch H oder A definierten Bereich liegt,
    • desto besser werden die Testaussagen.



    • 2)  Je kleiner α (=Fehler 1. Art), umso größer ist in der Regel der Fehler
    • 2. Art (trade-off!).



    3)  Je größer n, desto genauer die Testaussage.
  42. Testen und Hypothesen
    Eigenschaften von zweiseitigen Tests
    • 1)  Je weiter θ (= μ) von θ0 (= μ0) entfernt ist, desto größer ist die
    • Wahrscheinlichkeit, die Differenz θ − θ0 aufzudecken.



    • 2)  Auch hier: Je kleiner α (= Fehler 1. Art), desto größer ist in der Regel
    • der Fehler 2. Art.



    • 3)  Je größer n, desto größer die Wahrscheinlichkeit, dass Differenzen
    • θ − θ0 aufgedeckt werden.
  43. Testen und Hypothesen
    Allgemeines Konstruktionsprinzip
    • Ein Testproblem wird immer gleich gelöst:
    • 0)  Feststellen eines geeigneten Modells für die Stichprobenwerte Xi

    • 1)  Formulierung der (Null-)Hypothese und der Alternative sowie
    • Wahl eines Signifikanzniveaus

    2)  Festlegung einer geeigneten Teststatisik T

    • 3)  Bestimmung der Verteilung von T unter der Null-Hypothese
    • 4)  Bestimmung des kritischen Bereichs, in dem H abzulehnen ist

    5)  Konkrete Berechnung von T und Entscheidung mit Interpretation
  44. Testen und Hypothesen
    Ein- vs. Zwei-Stichprobentests
    • Ein-Stichprobentests: Beobachtungen stammen aus einer Verteilung.
    • Es sollen Aussagen über die Parameter dieser Verteilung gemacht werden.

    • Zwei-Stichprobentests (nächste Abschnitte): Beobachtungen stammen
    • aus zwei Verteilungen. Es sollen Aussagen über die Gleichheit der
    • Parameter, nicht jedoch über ihren Wert gemacht werden.
  45. Testen und Hypothesen
    Gauss-Test
    • Test auf μ bei Normalverteilung, σ2 bekannt (d.h. Prüfgröße hat
    • Normalverteilung): Gauss-Test

    • Da die Annahme „σ2 bekannt“ unrealistisch ist, wird dieser Fall nicht
    • weiter behandelt.
  46. Testen und Hypothesen
    t-Test
    • Test auf μ bei Normalverteilung, σ2 unbekannt: (Ein-Stichproben-)t-Test
    • Das allgemeine Konstruktionsprinzip liefert die t-verteilte Testgröße:
    • T= X ̄ − μ0  ∕/ σˆ / √ n
    • hat man beispielsweise die Hypothese:

    • H : μ ≤ μ0 A : μ > μ0
    • so ist der kritische Bereich:

    • K = {T > tn−1,1−α}
    • d.h. H ablehnen, wenn T zu groß wird

    (=wenn X ̄ hinreichend größer als μ0 ist.)
  47. Testen und Hypothesen
    Einstichproben-t-Test auf μ (σ unbekannt): Übersicht
    Modell: Xi ∼ N(μ,σ2), i = 1,...,n, σ unbekannt

    • Hypothesen:
    • a)H: μ=μ0 gegenA: μ̸=μ0
    • b)H: μ≤μ0 gegenA: μ>μ0
    • c)H: μ≥μ0 gegenA: μ<μ0

    Teststatistik:T= X ̄ − μ0 ∕/ σˆ / √ n

    Verteilung unter H:T ∼ tn−1

    • Testentscheidung H ablehnen, wenn
    • a) |T| > tn−1,1−α/2
    • b) T > tn−1,1−α
    • c) T < −tn−1,1−α
  48. Testen und Hypothesen
    p-Wert
    • Das empirische Niveau eines Tests: Der p-Wert:
    • Angabe des Testniveaus, bei dem der kritische Wert gerade mit dem

    beobachteten Wert T = t der Testgröße übereinstimmt.

    • Statistik-Programme weisen stets den p-Wert aus und überlassen die
    • Entscheidung über Nicht-Ablehnung bzw. Ablehung der Hypothese dem
    • Nutzer


    Allgemein:

    kleine p-Werte ⇒ Ablehnung der Hypothese

    große p-Werte ⇒ Hypothese wird nicht abgelehnt
  49. Testen und Hypothesen
    Umgang mit p-Werten

    Statistikprogramme weisen oft nur den p-Wert für den 2-seitigen Test aus:
    • 1. Test 2-seitig
    • H:θ=θ0 , A:θ= θ0
    • θ0 und α vorgegeben

    • Programm liefert 2-seitigen p-Wert:
    • p > α: H nicht ablehnen

    p ≤ α: H ablehnen
  50. Testen und Hypothesen
    Umgang mit p-Werten (Cont’d)
    Test 1seitig
    • 2. Test 1-seitig
    • z.B.H:θ≥θ0 , A:θ<θ0
    • θ0 und α vorgegeben

    • Programm liefert 2-seitigen p-Wert:
    • Schätze erst θˆ.

    • a)θˆliegtaufderSeitevonA→p∗ =p/2
    • b)θˆliegtaufderSeitevonH→p∗ =1−p/2

    • Dann wieder:
    • p∗ > α: H nicht ablehnen
    • p∗ ≤ α: H ablehnen

What would you like to do?

Home > Flashcards > Print Preview