Statistik

Home > Preview

The flashcards below were created by user maskenjao on FreezingBlue Flashcards.


  1. Diskreta sannolikhetsfördelningar
    • Stokastisk variabel:
    • Sannolihetsfördelning:
    • Fördelningsfunktion:
    • Väntevärde:
    • Varians:
    • Standardavvikelse:
    • Kovarians:
    • Binomialfördelning:
    • Hypergeometrisk fördelning:
    • Poisson-fördelning:
    • Simultan sannolikhetsfördelning:
  2. Index:
    • KPI:
    • Laspeyres:
    • Paaschee:
  3. Säsongsrensning:
  4. Kombinatorik:
  5. Minsta kvadratmetoden:
    • Linjär trend:
    • Exponentiell trend:
  6. Sannolikhetslära:
    • Ömsesidigt uteslutande:
    • Statistisk oberoende:
    • Betingad sannolikhet:
    • Bayes' teorem:
    • Statistiskt uttömmande:
  7. Kontinuerliga sannolikhetsfördelningar:
    • Stokastisk variabel:
    • Täthetsfunktion:
    • Fördelningsfunktion:
    • Väntevärde:
    • Varians:
    • Standardavvikelse:
    • Median:
    • Normalfördelning:
    • Exponentialfördelningen:
  8. Linjära kombinationer av stokastiska variabler
    • W=aX+bY
    • E(W)=a*E(X)+b*E(Y)
    • V(W)=a^2*V(X)+b^2*V(Y)+2ab*Cov(X,Y)
    • Corr(X,Y)=Cov(X,Y)/stdv(X)*stdv(Y)

    Om X och Y är oberoende, så Cov(X,Y)=0
  9. Centrala gränsvärdessatsen:
    Den centrala gränsvärdessatsen är en fundamental sats inom statistik. Enligt centrala gränsvärdessatsen gäller att om man adderar ett stort antal oberoende slumpmässiga variabler, eventuellt med olika sannolikhetsfördelningar, men med ändliga varianser, kommer summan att gå mot en normalfördelning.
  10. Approximativa sannolikhetsfördelningar
  11. Empiriska regeln:
    Den empiriska regeln är en modell för att bestämma proportioner av observationer inom ett band av standardavvikelser. Den empiriska regeln förutsätter en normalfördelning, en symmetrisk fördelning.Den empiriska regeln innebär att för symmetriska frekvensfördelningar ligger cirka 68 % av observationerna inom plus/minus 1 standardavvikelse från medelvärdet, 95% av observationerna ligger inom plus/minus 2 standardavvikelser från medelvärdet och 99,7% av observationerna ligger inom plus/minus 3 standardavvikelser från medelvärdet. Den empiriska regeln kallas också för normalregeln.
  12. Five-number summary och lådagram
    Minsta < Q1 < Median < Q3 < Max
  13. Interquartile range (IQR)
    IQR=Q3-Q1 och används när man ska avgöra längden på "lådan" i ett lådagram.
  14. Lådagram:
    Vi behöver medianen, vi behöver räkna ut Q1 och Q3.

    Sen tar vi q1-1,5*(q3-q1) för att dra en linje för "extremt låga värden", eller "uteliggare".

    Därefter tar vi q_1+1,5*(q3-q1) för att dra en linje för extremt höga värden.

    Vi ritar dock endast ut minsta värden, högsta värdet, q1, q3 och medianen. Sen kan värden utanför extremvärdena markeras och diskuteras.
  15. Chebychevs teorem:
    • Vi har ett medelvärde, och vi har en standardavvikelse.
    • Förslitning av däck. 
    • Medelvärdet för hur långt däcken räcker är 29 000 miles. Standardavvikelsen är 3000 miles. 

    Chebyshevs teorem visar att andelen observationer som finns inom ± k stycken standardavvikelser från medelvärdet är åtminstone 1-1/k2. (k > 1)

    Så, om vi har två standardavvikelser kommer 75% av däcken att hamna där, dvs. kunna köra 29000+/-2*3000, alltså 75% av däcken räcker mellan 23000-35000 miles. Med tre standardavvikelser kommer 89% hamna däremellan osv.
  16. Simultana sannolikhetsfördelningar
    Nu har vi ju två olika stokastiska variabler, X och Y. Dessas sannolikheter skrivs ut i en tabell och kan summeras i marginalerna (marginalfördelningen för X och Y). Summan av marginalfördelningarna skall alltid bli 1.
  17. Den betingade sannolikheten av två stokastiska variabler (conditional probability function):
    • P(y|x)=chart?chf=bg,s,00000000&cht=tx&chl=%5Cfrac%7BP(x%2Cy)%7D%7BP(x)%7D&chs=90x86
    • där P(x) alltså är marginalsannolikheten för X=x. P(x,y) är den simultana sannolikheten, dvs P(x,y)=P(X=x∩Y=y)

    • Vi kan även bedöma om dessa två stokastiska variabler är statistisk oberoende av varandra genom att testa om:
    • P(x,y)=P(x) * P(y). Om så, är variablerna X och Y oberoende. Nu måste vi testa ALLA simultana fall i tabellen.

    • Av detta följer, att om X och Y är oberoende stokastiska variabler, så:
    • P(x|y)=P(x) samt P(y|x)=P(y)
  18. Väntevärdet av en simultan sannolikhetsfördelning W
    • Vi har X och Y
    • Den generella formen för den simultana sannolikhetsfördelningen W=aX+bY
    • Med utgångspunkt i denna kan vi ta fram varians, väntevärde och kovarians (samt korrelation).

    • Väntevärdet av W:
    • E(W)=μW=a*μX+b*μY

    • Variansen för W:
    • chart?chf=bg,s,00000000&cht=tx&chl=%5Csigma_W%5E2%3Da%5E2*%5Csigma_X%5E2%2Bb%5E2*%5Csigma_Y%5E2%2B2abCov(X%2CY)&chs=574x46


    • Kovariansen för X,Y:
    • Cov(X,Y)=ΣxΣy xyP(x,y)-μXY
    • Detta tar tid men måste göras. 

    • Korrelationskoefficienten för X,Y.
    • chart?chf=bg,s,00000000&cht=tx&chl=%5Cfrac%7Bcov(X%2CY)%7D%7Bstdv(X)*stdv(Y)%7D%3DCorr(X%2CY)&chs=450x86
  19. Bayes teorem:
    Image Upload
  20. Kombinationer:
    • Image Upload
    • där n=antalet element och r=antalet element som väljs.
    • Kombinationer används när ordningen SAKNAR BETYDELSE!
  21. Permutationer:
    • Image Upload
    • där n=antalet som kan väljas
    • och r=antalet som väljs
    • Permutationer används när ordningen HAR BETYDELSE!
  22. Binomialfördelning
    • X-bin(n,p)
    • 1. två utfall
    • 2. konstant sannolikhet, p 
    • 3. n oberoende upprepningar

    • E(X)=n*p
    • V(X)=n*p(1-p)
  23. Poisson-fördelning

Card Set Information

Author:
maskenjao
ID:
313602
Filename:
Statistik
Updated:
2015-12-30 13:14:59
Tags:
stat
Folders:
stat
Description:
Stat
Show Answers:

Home > Flashcards > Print Preview