Induktív statisztika
Becslőfüggvény
torzítatlan és minél kisebb a varianciája - ha mindekettő torzítatlan, akkor a kisebb varianciájút választjuk ( minimális varianca kritérium) - ha valamelyik torzított, akkor a legkisebb átlagos négyzetes hibájút
Standard hiba
A becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása nagysága függ: sokaság szórásától, mintanagyságtól szórás / gyök. mintaelemszám növelésével csökkentjük
Véletlen mintavétel fajtái
Eelemi: FAE: visszatevéses, véges, homogén mintából - feltétel: lista a sokaság elemeiről EV: visszatevés nélküli R. Rétegzett Csoportos: 1lépcsős többlépcsős
Rétegzett mintavétel
Először a sokaságot homogén rétegekbe soroljuk és a rétegekből EV mintát veszünk - mintavételi hibát csükkentsük - plusz egyes rétegekre lehet külön becslést készíteni
Egyszerű véletlen minta
Homogén, véges sokaság, visszatevés nélkül, minden n elemű minta kiválasztásának azonos valószínűséget biztosítva Hatásosabb, mint a FAE, - tehát kisebb a varianciája kiválasztott mintaelemek nem függnek egymástól
Nemvéletlen mintavétel
Hólabda Kvótán alapuló Önkényes Koncentrált
Véletlen mintavétel
Minden valószínűségi elem előre meghatározott valószínűséggel kerül bele a mintába
Mintavételi statisztikai hiba
Nem teljeskörű sokaság megfigyelés
Mintaátlag eloszlás
Normális eloszlás N - normális eloszlás n Nagy mintaelemszám - aszimptotikus normális eloszlás n Kis mintánál függ az sokaság eloszlásától
Ha egy változót pozitív konstanssal szorzunk, akkor
a változó eloszlásának típusa nem változik; átlaga és szórása is ugyanezzel a konstanssal szorzódik
független részminták rendszere
alkalmas minden legalább aszimptotikusan torzítatlan becslőfgv standard hibájának becslésére több részminta megfigyelése robposztus, tehát érzéketlen a kiinduló feltételekre
Mesterséges hibaszámítás
az út a hiba gyakorlati szimulálása nincs hibaképlet
Torzítás
becslőfgv várható értéke megegyezik a becsülni kívánt sokasági jellemzővel
jackknife
egy mintából mesterségesen csinál többet, robosztus, mintából egy -egy elemet elhagy
Konfidencia intervallum
intervallumbecslésnél 1-a valoszínűséggel esik ebbe az intervallumba, határok megadása
Nemmintavételi statisztikai hiba
kamu adatok basically - nehezen kezelhető
Indukció
n > N
kis minta
n< 30 - amugy kiválasztási arány n/N
bootstrap
szülő minta elemeiből választ visszatevésesen, új n elemű minta. ezek együttese n a négyzeten
1-a = 90 %
z0,95 - 1,65