štatistika
z datasetu statistika 5.11. vypocitajte z-skóre, priemer, modus, medián, štandardnu odchýlku, kvartily, šikmosť, špicatosť + histogram a boxplot premennej "vek." + môžeme tieto dáta považovať za normálne rozložené?
! z-skóre: analyze->descriptive-> zakliknúť save standardized
koeficient determinácie
- koľko z variability zdieľajú dve premenné r2
neparametrické korelácie
-Spearmanov koreláčý koeficient (rs) - ordinálne dáta -Kendalovo tau - ordinálne dáta, keď viaceré položky dosahujú na škále rovnaké hodnoty
aká je šikmosť normálneho rozloženie?
0
dôležité hodnoty z
1,96 - nad týmto skóre je 2,5% najvyšších hodnôt -1,96 - pod týmto skóre je 2,5% najnižších hodnôť' +-2,58 - 1% bude vyšších/nižších +-3,29 - oddeľuje 0,1% najvyšších/najnižších
štatistická sila
1-alfa - schopnosť testu odhaliť efekt závisí od: effect size (e.g. r-korelačný koeficient) N of sample size
z datasetu statistika - vypocitajte frekvenčnú tabuľku (príjmy zamestnancov firmy). Vypočítajte maximum, minimum a rozsah (rozpätie dát) + vypocitajte rocny bonus (suces mesacneho planu a letneho bonusu), vytvorte kontingencnu tabulku (pohlavie x rocny bonus) a zastupenie pohlavia aj bonusov vyjadrite v jednotlivych grafoch samostatne
1. analyze-frequencies 2. transform-compute 3. kont: analyze-desc-crosstabs pohlavie: bar chart bonus: histogram
aká premenná je IQ a dosiahnutý ročník na ZŠ?
1. intervalová 2. ordinálna
aký kvartil je medián?
2. kvartil
kritické hodnoty chi-kvadrátu
3,84 (p=0,05) 6,63 (p=0,01)
testová štatistika
=model/chyba
čo používame namiesto chi-kvadrátu pri malých vzorkách?
Fisherov exaktný test
Aký je rozdiel medzi štandardnou chybou a štandardnou odchylkou?
SD - standard deviation (štandardná odchýlka) - týka sa vzorky SE - standard error - od populačného priemeru, štandardná odchýlka priemerov jednotlivých vzoriek
vzorec štandardnej odchylky + vypočítaj priemer a SD z tohto súboru 1,2,3,3,4
SD=odmocnina s2 s2 - variancia = SS/df SD=sq.root of s2 SS-súčet švorcov nad odchýlkami df - stupne voľnosti (N-1) x=2,6+-1,14
čo je centrálna limitná veta?
SE=SD/square root of N
parciálna korelácia
SPSS cor-partial -variable -controling for
Má státie na jednej nohe pri umývaní si zubov súvis so zvýšenou spokojnosťou v sexuálnom živote? Americkí vedci zozbierali dáta od 500 probandov, ktorí boli nespokojní so svojim sexuálnym životom, polovica z nich bola inštruovaná, aby každé ráno pri umyvaní zubov stála na jednej nohe, druhá nie. Po roku zozbierali dáta a zistili, že: 150 ľudí, ktorí stáli každé ráno na jednej nohe sa cítilo so svojim sex. životom spokojnejší a 100 sa cítilo rovnako nespokojne. 50 ľudí z kontrolnej skupiny uvádzalo, že sú spojnejší a 200 rovnako nespokojných ako pred rokom. Uveď, či je súvis medzi státim na jednej nohe a spokojnosťou medzi sexuálnym životom a v prípade, že je koľko násobne je väčšia pravdepodobnosť, že ak budeme stáť ráno na jednej nohe, budeme spokojnejší so sexuálnym životom ako keď stáť nebudeme.
SPSS, chi kvadrát + odds ratio Report: Zaznamenali sme vzťah medzi typom liečby a výsledkom liečby, x2=83,3, p<0,01. Pri každodennom státi na jednej nohe pri uývaní si zubov je 6x pravdepodobnejšie zvýšenie spokojnosti so sexuálnym životom ako pri nestáti na jednej nohe pri umývaní si zubov.
chyba 1. typu
alfa - predpokladanie efektu, keď tam nie je - Fisherovo pravidlo p <0,05
aké sú predpoklady pre počítanie chi-kvadrátu?
all expected frequencies > 5 idependence (1 person = 1 value)
ako vypočitame koreláciu v spss?
analyze-correlate-bivariate
chyba 2. typu
beta - pravdepodobnosť, že efekt nezaznamenáme za predpokladu, že existuje prístupná úroveň 0,2 (20%) - závisí od veľkosti vzorky a veľkosti efektu
diskrétne a spojité premenné + príklad
diskrétne (kategorické) - len konečný počet hodnôt e.g. mladší/starší školský vek spojité premenné - kontinuum e.g. vek (môže byť meraný na akejkoľvek úrovni presnosti - mesiac/rok...)
pri akých dátach testujeme normalitu rozloženia?
intervalových a pomerových
kedy môžeme použiť Pearsonovu koreláciu?
intrervalové, pomerové dáta - normálne rozloženie
kovariancia, vzorcec, problém, riešenie problému
kovarianciu vypočítame násobkov odchýlok od priemerov a vydelením stupňami voľnosti ak je + je pozitívny vzťah, ak - negatívny problém - závislosť od jednotky riešenie: vypočítanie korelácie r=cov(z,y)/SDz x SDy
čo nám vyjadruje kumulatívna početnosť?
koľko údajov spolu dosahuje danú alebo menšiu hodnotu
pri akom type dát počítame median a pri akom type priemer?
median - ordinalne priemer - intervalove, pomerove
na čo slúži z-skóre, ako ho vypočítame?
na zistenie pravdepodobnosti, ak sú dátaa normálne rozložené (X=0, SD=1)->štandardizácia z= (x-Xpriemer)/SD - následne nájdeme tabuľku s pravdepodobnosťou pre príslušné z-skóra
čo je modus?
najčastejšie sa vyskutujúca zmena v štatistickom súbore -bimodálne, multimodálne
na reprezentáciu akých premenných používame bar chart?
nominálnych a ordinálnych
modus, median a priemer v prípade normálneho rozloženia a v prípade šikmosti
normálne rozloženie - Md=Mo=X + špicatosť Mo,Md,X - špicatosť X, Md,Mo
s čím súvisí špicatosť rozloženia dát?
s veľkosťou SD
pri akých typoch premenných používame histogram?
spojitých intervalových lebo pomerových
ako zistíme, či je rozloženie normálne?
šikmosť špicatosť boxplot