Statistika - otázky
Koeficient determinace v regresní analýze lze případně spočítat jako:
druhá mocnina korelační koeficient na druhou
K čemu slouží upravený index determinace?
k porovnání kvality modelů s odlišnými počty parametrů
Byly naměřeny teploty pod bodem mrazu, rozptyl bude:
kladný
Jaký druh proměnné je počet dětí v rodině
kvantitativní (diskrétní)
Co znamená při testování hypotéz síla testu 1-Beta
pravděpodobnost zamítnutí nesprávné nulové hypotézy
Hladina významnosti statistické testové hypotézy je:
pravděpodobnost zamítnutí nulové hypotézy, která ale platí
Rozptyl je:
průměr čtvercových odchylek od průměru
Testové kritérium používané v analýze rozptylu je:
závislé na počtu tříd
Kolik mezí a které/á jsou udány u jednostranných intervalů spolehlivosti?
1-horní nebo dolní
Zadáno 7 konkrétních platů, kolik zaměstnanců pobírá plat, který je nižší než medián?
3
Jaké jsou parametry testového kritéria u F-testu, když jsou 4 firmy a od každé se zkoumalo 5 žárovek.
3 a 16
U kontingenčních tabulek využijeme:
Chí-kvadrát
Regresní analýza vyjadřuje závislost
Dvou kvantitativních proměnných
Máme I na druhou v korelační analýze, kdy je závislost nejtěsnější:
I na druhou = 0,85
Když máme rovnici Y = 16 - 0,8 x, platí, že:
Korelační koeficient musí být záporný
Kde se používá metoda nejmenších čtverců?
Při určování parametrů regresních funkcí
Provedli jsme 25 měření před hnojením a po hnojení půdy. Jak zjistíme, jestli velikost úrody závisí na hnojení?
Testem o rovnosti středních hodnot (párový t test)
Mějme vypočítán interval spolehlivosti na základě n=50 hodnot. Jestliže zvětšíme rozsah výběru a nyní je n = 150, dostaneme:
Užší interval spolehlivosti.
Průměr ze souboru hmotnosti sušenek je 500 g a medián 575 g. Jaká je jednotlivá váha sušenek?
Více sušenek váží více než je průměr.
Co platí pro test rovnosti středních hodnot dvou rozdělení, pokud jsou n1 a n2 větší než 30?
Výběry nemusí být z normálního rozdělení. Protože u velkých výběrů se všechna rozdělení blíží normálnímu
Regresní přímka je zadána rovnicí Y=100 + 5x, co se stane se závislou proměnnou Y, když se x zvýší o100 jednotek?
Zvýší se o 500 jednotek
Jak snížíme pravděpodobnost chyby 2. druhu Beta?
Zvětšením hladiny významnosti ? a zvětšením vzorku
Kdy zamítneme hypotézu H0, když alfa je 0,1
0,08, pokud je touto hodnotou myšlena p-hodnota
Distribuční funkce F(x) může nabývat hodnot:
0<=F(x)<=1
Pravděpodobnost jevu jistého je
1
aká je hodnota opačného jevu k jevu A?
1 - P(A)
Spolehlivost odhadu značíme:
1 - alfa
Výdrž baterie je náhodná veličina X a hodnota jejího 90 procentního kvantilu je rovna 210.
90 procent baterií vydrží méně než 210 hodin
Hodnoty párového korelačního koeficientu leží v intervalu:
<-1 ; 1>
Ve výsečovém diagramu vyjadřuje velikost úhlu každé výseče:
Absolutní či relativní četnost
Máme kontingenční tabulku 3x3, testové kritérium vyjde 9.85. Můžeme na 5% hladině významnosti potvrdit závislost.
Ano, pomocí chí-testu dobré shody s 4 stupni volnosti.
Máme interval spolehlivost 95% a 90%, potom:
Interval 90% je užší než 95% (když se zvýší spolehlivost, rozšíří se interval a přesnost se zmenší)
Lineární závislost 2 veličin je vyjádřena v grafu přímkou rovnoběžnou s vodorovnou osou. Veličiny:
Jsou na sobě lineárně nezávislé
Studentovo rozdělení u intervalů spolehlivosti použijeme:
Když neznáme celkový rozptyl a n<30
Jestliže známe jeden řetězový index, co z něho můžeme vypočítat?
Meziroční tempo růstu
Poměr determinace u analýzy rozptylu, jak ho vypočítáme:
Meziskupinový součet čtverců / celkový součet čtverců
Testujeme hypotézu ... v kontingenční tabulce o rozměru (r=3; s=4)... a testové kritérium vyšlo G= - 12,34:
Nelze rozhodnout, zřejmě je chyba ve výpočtu testového kritéria (protože G nemůže být záporné číslo)
Je možné, aby se u symetrického rozdělení neshodoval průměr s mediánem?
Není to možné.
Je možné, aby u symetrického rozdělení vyšel průměr rozdílně než medián?
Není to možné.
Modus:
Nepatří mezi kvantily
Pokud jeden jev má pravděpodobnost 0,5 a druhý 0,2 a jejich sjednocení má hodnotu 0,7, pak tyto jevy jsou:
Neslučitelné
Pomocí chí-kvadrát testu dobré shody byla naměřena p-hodnota 0,045
Nezamítáme hypotézu na 1%, ale na 5% hladině ano
Obsahem nulové hypotézy u korelační analýzy je:
Nezávislost dvou kvantitativních proměnných
Jen jedna z následujících pravděpodobnostních funkcí je správná pro hodnoty 1,2,3.
P(1) = 0,2 ; P(2) = 0,4, P(3) = 0,4 (součet všech pravděpodobností musí být roven 1)
Na posouzení váhy lidí před a po dietě se použije
Párový t test
Bylo zkoumáno, zda cena žárovky a délka jejího svícení spolu závisí - spočteme to
Párovým korelačním koeficientem
Máme skupinu nájmů, průměr jednorázově vzroste o 1311 CZK, jak se změní variační rozpětí a rozptyl?
Rozptyl se nezmění, var. rozpětí nelze na základě uvedené informace odhadnout
Zjištěné četnosti zaznamenané uvnitř kontingenční tabulky se nazývají:
Sdružené
Korelační koeficient: r = - 0,8 + znázorněný graf, napsat, co platí
Silná nepřímá závislost
Při t-testu (b0/s(b0)) sa používá:
Studentovo rozdělení
Test dobré shody porovnává
Teoretická a skutečná data
Hodnota součinu sdružených výběrových regresních koeficientů bxy a byx je vždy:
V intervalu <0;1>
Průměrnou hodnotu časové řady "Počet zaměstnanců k poslednímu dni měsíce" zjištěnou v r. 1990 v lednu, březnu a pak od května každý měsíc. Vypočítáme:
Váženým chronologickým průměrem
Pokud zamítneme Ho: MÍnula =MÍjedna oboustranným testem, potom u jednoho z jednostranných testů při stejné hladině významnosti zamítáme hypotézu:
Vždy
Vícenásobný regresní model o 6 neznámých, 2 jsme vyřadili, koeficient determinace se:
Zmenší
Co říká alternativní hypotéza u analýzy rozptylu?
alespoň jedna střední hodnota se liší od ostatních
Pokud na hladině významnosti zamítnu nulovou hypotézu, která platí, pak se jedná o
chybu prvního druhu
Při nezamítnutí hypotézy, jež je na hladině významnosti 0,05 nesprávná, se dopustíme:
chyby druhého řádu
Při testování závislosti v kontingenční tabulce se dvě teoretické četnosti rovnají 1. V tom případě:
chí-kvadrát test nemůžeme použít, protože nejsou splněny předpoklady pro jeho užití
Když vyjde u regrese F-test "NEVÝZNAMNÝ", tak to znamená že:
daný model nepřijímáme
Z regresního modelu se čtyřmi vysvětlujícími proměnnými byly dvě proměnné odebrány jako málo důležité. Potom:
index determinace v menším modelu nemůže být větší než v modelu s více proměnnými
Kovariance nabývá hodnot
jakýchkoli reálných
Rozptyl dvou záporných různých čísel je
kladný
Proměnná obor studia je veličina:
kvalitativní
Co není vychýleno extrémními hodnotami základního souboru:
medián
Znám korelační koeficient r, jaký bude poměr determinace r2
nelze urcit
Součet odchylek od průměru je roven
nule
Komentujte následující regresně sdružené přímky: Y=5x-2 X=5-0,2y
podle znamének regresních koeficientů nemůže jít o regresně sdružené přímky
Z 30 hodnot byl vypočten aritmetický průměr 15 a nalezen medián 13,9. Dvě jednotky však byly opomenuty a je třeba je dodatečně zařadit do souboru. Hodnoty sledované proměnné jsou u nich 10 a 36. Opravené výsledky pak budou:
průměr = 15,5 ; medián = 13,9
K testu bylo vybráno 25 aut a naměřená spotřeba před a po výměně katalyzátorů. Pro prokázání zlepšení spotřeby po výměně použijeme:
párový t-test
Analýza rozptylu se využívá:
při měření závislosti proměnné kvantitativní na proměnné kategoriální
Co testujeme při analýze rozptylu
rovnost středních hodnot
Když se u regresní přímky všechny y zvětší o 2 a x se nezmění, co se stane?
směrnice přímky se nezmění a průsečík s osou y se změní o 2
Metoda nejmenších čtverců využívá jako kritérium:
součet čtverců reziduí
Pro interval spolehlivosti pro střední hodnotu platí:
středem intervalu je výběrový průměr
Nestrannost bodového odhadu spočívá v
střední hodnota je stejná jako odhadovaný parameter
Naměřili jsme směrodatnou odchylku 0
to je možné, pokud jsou všechny hodnoty stejné
Kdy používáme vážený chronologický průměr
u okamžikových časových řad, kdy mezi obdobími je různé rozmezí
Hypergeometrické rozdělení se užívá:
u pravděpodobnostního rozdělení závislých jevů
známe 99% interval, potom 95% bude
užší, bez výpočtu nelze určit o kolik
Medián může popsat polohu statistického souboru lépe než průměr, jestliže:
v souboru existují ojedinělé extrémy
Regresní koeficient
vyjadřuje změnu závisle proměnné při jednotkové změně nezávislé proměnné
Ve sloupkovém grafu vyčteme četnost ze:
výšky sloupku
Když se změní u testování alfa z 5% na 1% tak se KRITICKÝ OBOR:
zmenší
Zvětšením spolehlivosti se při stejném rozsahu výběru přesnost intervalového odhadu střední hodnoty normálního rozdělení:
zmenší
Pokud do modelu přidáme další proměnné, index determinace se:
zvětší se
10% kvantil normovaného normálního rozdělení je
záporný
Korelační analýza může být využita pro zkoumání:
závislosti dvou kvantitativních proměnných
Chronologický průměr využijeme u:
časových řad okamžikových
Jaké rozdělení má testové kritérium při analýze rozptylu?
F rozdělení (Fischerovo)
Rozdíl mezi F-testem a dílčím t-testem je:
F test - testuje vhodnost modelu jako celku, dílčí t testy - testují významnost jednotlivých proměnných v modelu
Chcete porovnat výkony pracovníků (tj. Počet vyrobených výrobků za směnu) ve třech směnách. Použijete:
F test v analýze rozptylu
Máme 3 různe zapisy distribuční funkce, ale jenom jeden z nich je spravně, urcit ktery:
F(0) = 0, F(1) = 0.7, F(2) = 1
Máme 4 druhy hnojiva a k nim výnosy na hektar. Pro srovnání průměrných výnosů použijeme:
F-test analýzy rozptylu
hceme porovnat průměrnou dobu cestování z místa A do místa B po třech různých trasách. Při splnění určitých podmínek požijete:
F-test v analýze rozptylu
Čím znázorníme rozdělení četností hodnot spojité veličiny?
Histogram
Kritický obor je:
Podmnožina oboru hodnot testového kritéria
Korelační koeficient se spočítá jako:
Podíl kovariance a součinu směrodatných odchylek (viz vzorce)
Co je to index determinace?
Poměr čtverců modelu a celkových čtverců
Hustota pravděpodobnosti je:
Pravděpodobnostní rozdělení spojité náhodné veličiny