Jogi adatgyűjtés és feldolgozás
osztályozási követelmények (2 db)
1. Az osztályozás teljes legyen: a sokaság mindegyik egyedét be kell illesztenünk valamelyik osztályba. 2. Az osztályozás átfedésmentes legyen: a sokaság minden egyedét pontosan egy osztályba illeszthetjük be.
számtani átlag fontosabb tulajdonságai (4 db)
1. Ha mindenegyes ismérvértéket ugyanazzal a nullától különböző A számmal megszorozzuk, akkor ezek átlaga is A-szorosa lesz az ismérvértékek átlagának. 2. Ha mindenegyes ismérvértékhez ugyanazt az A számot hozzáadjuk, akkor ezek átlaga is A-val lesz nagyobb (kisebb) az ismérvértékek átlagánál. 3. Minden ismérvérték számtani átlaggal való helyettesítésekor elkövetett előjeles hibák kiegyenlítik egymást, vagyis az egyes ismérvértékek számtani átlagtól való eltéréseinek összege 0. 4. Minden ismérvérték számtani átlaggal való helyettesítésekor elkövetett hibák négyzetösszege minimális lesz; és fordítva: a számtani átlag az a konstans, amely esetén a négyzetes hiba minimális. Ez az ún. négyzetes minimum tulajdonság.
statisztikai adatokkal szembeni követelmények (3db)
1. Pontosság: az adatok megfelelően pontosak legyenek. 2. Gyorsaság: gyorsan hozzájussunk az adatokhoz. 3. Gazdaságosság: alacsony költségek.
egyszerű véletlen mintavétel pontossága, megbízhatósága függ (3 féle)
1. a mintaelemszámtól (minél nagyobb mintát veszünk, annál megbízhatóbb következtetésekre jutunk) 2. az eredeti sokaság heterogenitásától 3.a mintavétel módjától
valószínűség típusai
1. az együttes bekövetkezés valószínűség 2. a peremvalószínűség (egy adott környezetben, hogy következik be egy konkrét esemény) 3. a feltételes valószínűséget (ha egy adott esemény már bekövetkezett, akkor milyen valószínűséggel következik be egy másik esemény)
statisztikai munka fázisai TERVEZÉS
1. cél meghatározása 2. meghatározni az adatgyűjtés gyakoriságát, idejét, helyét, módját
statisztikai sorok, táblák formai követelményei (5 db)
1. cím (tükrözze az adott táblában, sorban szereplő adatok körét és a csoportosító ismérvet) 2. az oszlopok és a sorok megnevezése, a mértékegységek megjelölése 3. "összesen" érték kiszámítása (ha van értelme) 4. az adatok forrása 5. esetleges módszertani megjegyzések a táblázat alján
statisztikai adatok összehasonlítása (2 fajta)
1. különbségképzés 2. hányados-képzés
pontbecslések módszerei (2 db)
1. legkisebb négyzetek 2. a maximum likelihood elve
statisztikai sorok típusai (5 db)
1. leíró sor 2. minőségi sor 3. mennyiségi sor 4. területi sor 5. idősor
diagramok fajtái
1. pontdiagram: két ismérv szerinti hovatartozást ábrázolunk vele 2. vonaldiagram: egyenes szakaszokból álló grafikus ábra 3. síkdiagram: gyakoriságokat ábrázolunk vele, területek segítségével (pl. oszlopvagy kördiagram).
3 módszer ahhoz, hogy egy bizonytalan eredményű jelenség vagy folyamat bekövetkezéséhez milyen valószínűség rendelhető
1. relatív gyakoriság vizsgálata 2.szubjektív értékítélet 3. matematikai szabályon alapuló számított valószínűség
nem-véletlen mintavétel csoportjai (4 féle)
1. szisztematikus mintavétel (lajstrom nélküli sokaságból) 2. kvóta szerinti minta (nincs teljes lajstrom, a sokaság bizonyos ismérvek szerinti megoszlását a kérdezőnek tartania kell) 3. koncentrált minta (a sokaság legnagyobb súllyal rendelkező elemeit választja ki) 4. önkényes minta (tipikus eset a szakértő megkérdezése)
középértékek csoportjai (2 db)
1. számított középérték (átlag) 2. helyzeti középérték
statisztikai munka fázisai (4 db)
1. tervezés 2. adatfelvétel 3. feldolgozás 4. elemzés
véletlen mintavétel módjai (4 féle)
1. visszatevéses egyszerű véletlen minta (azonos esély van, de nehéz értelmezni, ha egy minta 2x kerül be) 2. visszatevés nélküli egyszerű véletlen minta 3. rétegzett minta (részsokaságokra osztom a sokaságot, és abból tételesen külön-külön veszek részmintákat) 4. csoportos és többlépcsős minta (pl.: első lépcsőben csoportos minta (iskola kiválasztás), második lépésben pedig a pedagógusokat (többlépcsős))
mintavételi módok (2 db)
1. véletlen mintavétel 2. nemvéletlen mintavétel
különbségképzés
a kapott eredmény mértékegysége megegyezik az összehasonlított adatok mértékegységével
hányados-képzés
a kapott eredményt százalékban fejezzük ki
szóródás terjedelme
a legnagyobb és a legkisebb ismérvérték közötti különbség szórás a szóródás legfontosabb mérőszám
statisztikai sokaság
a megfigyelt egyedek összessége
kvantilis (+fajtái)
a meidán általánosítása 2 Medián 3 Tercilis 4 Kvartilis 5 Kvintilis 10 Decilis 100 Percentilis
reprezentativitás
a minta összetétele csak a véletlen hatások miatt tér el a sokaságtól, a vizsgált ismérvek szerinti összetétele követi a sokaságét
egyszerű véletlen mintavétel
a mintát valamilyen nyilvántartásból, regiszterből, teljes körű korábbi adatfelvételből választjuk ki az a regiszter, nyilvántartás, teljes körű felvétel a sokaság minden egységét egyszer és csakis egyszer tartalmazza
becslés (+leggyakorib paraméterei)
a sokaság egy paraméterének mintából való közelítése 1. a sokasági átlag 2. az értékösszeg 3. a szórás 4. arány
mintavétel
a sokaság egy részének kiválasztása
megkülönböztető ismérv
a sokaság egyedei más és más tulajdonsággal rendelkezhetnek
statisztikai tábla
a sokaság egyedeinek egyidejűleg nem egy, hanem több ismérv szerint történő felsorolása
minőségi ismérvek
a sokaság egységeinek számszerűen nem mérhető jellemzői
közös ismérv
a sokaság mindenegyes egyede ugyanazzal a tulajdonsággal rendelkezik
minta
a sokaság mintavétellel kiválasztott része
megoszlási viszonyszám
a sokaság valamely részének az egész sokasághoz viszonyított arányát mutatja meg azt fejezi ki, hogy a sokaság valamely része hány százalékát teszi ki az egész sokaságnak
grafikus ábrázolás
a statisztikai adatok reprezentálásának, szemléltetésének egyik eszköze
területi ismérv
a statisztikai egyedek térbeli jellemzői ismérvváltozata: területi egységek
időbeli ismérv
a statisztikai egységek időbeli jellemzői ismérvváltozata: időpontok, időszakok, évszámok, hónapok
relatív szórás
a szórás és a számtani átlag hányadosa ezt csak nemmnegatív értékekre értelmezzük, százalékban adjuk meg x=σ/v
volumen index
a termékek mennyiségének az együttes átlagos változása
módusz
a tipikus, a divatos, a leginkább jellemző értéket mutatja e körül sűrűsödnek, tömörülnek az ismérvértékek
statisztikai adat
a vizsgált statisztikai sokaság elemszáma, vagy valamely számszerű jellemzője
nem mintavételi hibák
a válaszadó akarattal vagy akaratlanul hibás választ ad
mintavételi hibák
abból származik, hogy a nem teljes sokaságot, hanem annak egy részét vizsgáljuk, azaz eredményeink függnek attól, éppen milyen mintát vettünk
imputálás
adott esetben kiegészítjük az adatokat
érték
az a közös nevező, amelyen a termékek gazdát cserélnek
négyzetes átlag
az a szám, melyet az egyes átlagolandó értékek helyére írva, azok négyzeteinek összege nem változik akkor használhatjuk, ha nem akarjuk figyelembe venni az átlagolandó értékek előjelét, és azt akarjuk, hogy az átlag a szélsőségesen nagy értékekre érzékenyen reagáljon. az ismérvértékek négyzetösszegeinek és sokaság elemszámának hányadosának négyzetgyöke
számtani átlag
az a szám, melyet az egyes átlagolandó értékek helyére írva, azok összege nem változik akkor használható, ha az ismérvértékek összegének van tárgyi értelme a sokaság xi ismérvértékei összegének és az elemei számának hányadosa
harmonikus átlag
az a szám, melyet az egyes átlagolandó értékek helyére írva, azok reciprokainak összege nem változik akkor használunk, ha az átlagolandó értékek reciprokaiból számított összeg értelmezhető a sokaság elemszámának és az ismérvértékek reciprokai összegének hányadosa
mértani átlag
az a szám, melyet az egyes átlagolandó értékek helyére írva, azok szorzata nem változik akkor használhatjuk, ha az ismérvértékek (átlagolandó értékek) szorzatának van értelme a sokaság xi ismérvértékei szorzatának N-edik gyöke
statisztikai munka fázisai FELDOLGOZÁS
az adatok ellenőrzése és helyesbítése, azok osztályozása, az eredmények táblába foglalása
medián
az az érték, aminél az összes előforduló ismérvérték legalább fele nem nagyobb, és legalább fele nem kisebb
mennyiségi ismérvek
az egyedek számszerű, mérhető jellemzői ismérvváltozatai az ismérvértékek
ismérv
az egyedek tulajdonságai, jellemzői
szóródás
az egyes ismérvértékeknek egymástól, illetve valamely nevezetes középértékétől való eltérése
gyakoriság
az egyes osztályokba, csoportokba tartozó egyedek száma
legkisebb négyzetek
az elméleti és mintabeli értékek valamilyen eltérés négyzetösszegét minimalizálja, ennek eredménye a becslőfüggvény
ismérvváltozat
az ismérvek lehetséges kimeneteleit
helyzeti középérték
az ismérvértékek közötti elhelyezkedésükkel adhatóak meg 1. módusz 2. medián
rangsor
az ismérvértékek rendezett (monoton növekvő, vagy csökkenő) felsorolása
szórás
az ismérvértékek számtani átlagtól vett különbségeinek négyzetes átlaga az egyes ismérvértékek átlagosan hány százalékkal térnek el az átlaguktól
számított középérték
az ismérvértékekből számíthatók ki 1. a számtani (aritmetikai) átlag 2. a harmonikus átlag 3. a mértani (geometriai) átlag 4. a négyzetes (kvadratikus) átlag
Mivel foglalkozik a statisztika?
az objektív valóság feltárása, számszerű jellemzése
láncviszonyszám
az összes időponthoz, időszakhoz tartotó adatot mindig a közvetlenül előtte álló időszak adatához viszonyítja
b-alapú bázisviszonyszám
az összes időponthoz, időszakhoz tartozó adatot mindig a B-edik időszak adatához viszonyítja
torzítatlanság
az összes lehetséges mintát kiválasztva és mindegyikből becsülve a sokasági paramétert, a becslések az elméleti paraméterek körül ingadozzanak
véletlen
azoknak a tényezőknek az összessége, amelyek a döntés során várt eredményeket befolyásolják, bizonytalanná teszik sztochasztikus
pontbecslések
becslőfüggvény egy konkrét mintából számított mértéke
sztochasztikus
bizonyos folyamatok nagy biztonsággal meghatározhatók
rétegzett minta
egy ismérv segítségével homogenizáljuk a részsokaságokat következtetéseket megbízhatósága a rétegek heterogenitásától függ
tartamidősor
egy mozgósokaság alakulását leíró statisztikai sort tartamidősor
következtető statisztika
egy részsokaságból következtetünk az egészre
állapotidősor
egy állósokaság időbeli alakulását leíró statisztikai sor
leíró statisztikai sor
egymással összefüggésben álló, különböző fajta adatok felsorolása
a minta reprezentativitása
ha a mintavételi jellemzők megegyeznek az alapsokasági jellemzőkkel
állósokaság
ha egy statisztikai sokaság egy időpontra vonatkoztatható állandóan változnak, így megragadásuk csak egy időpillanatban lehetsége
mozgósokaság
ha egy statisztikai sokaság egy időtartamra vonatkoztatható általában a folyamatok
folytonos sokaság
ha egy statisztikai sokaság egyedei csak méréssel különíthetőek el
diszkrét sokaság
ha egy statisztikai sokaság egyedei elkülöníthetőek
konzisztencia
ha nagyobb mintából egyre pontosabb becslést kapunk, és amennyiben n elég nagy, az eltérés minimális legyen mind a torzítás mértéke, mind a becslés varianciája tartson a 0-hoz
intervallumbecslés
ha nemcsak pontbecslést, hanem a mintavételi hibát is figyelembe vesszük
intenzitási viszonyszám
két különböző, valamilyen szempontból kapcsolódó sokaság adatainak hányadosa lehet egyenes vagy fordított lehet nyers vagy tisztított
viszonyszám
két statisztikai adat hányadosa (V=A/B) V: viszonyszám A: viszonyítás tárgya B: viszonyítás alanya (az A-t a B-hez viszonyítjuk)
alapadat
közvetlenül mérés, vagy számolás útján keletkezik
maximum likelihood
legnagyobb valószerűség elve
statisztikai munka fázisai ELEMZÉS
matematikai és logikai műveletek végzése (különböző mutatók kiszámítása, értelmezése, szöveges elemzések készítése, grafikus reprezentáció készítése)
származtatott adat
más adatokon való műveletvégzés eredményekét kapjuk
véletlen mintavétel
olyan kiválasztási eljárás, melynek során ismert vagy meghatározható a sokaság elemeinek mintába kerülési esélye előnye: önmagában reprezentatív mintát ad
középérték
olyan mutatószám, átlagos, közepes érték, amely a sokaság valamely tulajdonságát egy számmal fejezi ki a legkisebb és a legnagyobb ismérvérték között helyezkedik el
statisztikai munka fázisai ADATFELVÉTEL
statisztikai adatok begyűjtése lehet teljes (sokaság egészét, minden egyedét megfigyeljük) vagy részleges (csak egy részét vizsgáljuk a sokaságnak)
statisztikai sor
statisztikai adatok valamilyen szempont szerinti felsorolása
dinamikis viszonyszám
ugyanazon sokaság két különböző időponthoz, időszakhoz tartozó adatának hányadosa
koordinációs viszonyszám
ugyanazon statisztikai sokaság két részsokaságának egymáshoz viszonyított arányát fejezi ki
index
összetett mutatószám
ismérvek csoportjai
• területi ismérv • időbeli ismérv • minőségi ismérv • mennyiségi ismérv