Stat II. - A sokaság leírása egy változó alapján (1/2)
mennyiségi ismérv változatai
a kvantitatív változó értékei, a mérési skálának megfelelve intervallum- vagy arányskálán keletkező adatok. az ismérv értékei diszkrét vagy folytonos változóból származtatott értékek lehetnek
nyitott osztály
a legalsó és/vagy legfelső osztály "nyitva hagyjuk", ezáltal lehetővé tesszük a kiugró (extrém) értékek torzításmentes besorolását.
értékösszeg-sor
a mennyiségi sor ismérvértékeit, valamint az egyes ismérvértékek előfordulási gyakoriságait felhasználva állítható elő. tartalmazza a mennyiségi ismérvváltozatokat (-értékeket), diszkrét számértékek, vagy osztályközök formájában, valamint az ezekhez rendelhető értékek összegét.
kumulált sor
akkor kapjuk, ha a mennyiségi sorokat halmozottan összegezzük. természetesen ez a művelet kiterjeszthető minden mennyiségi sorra. ezt is ábrázolhatjuk hisztogram segítségével. az oszlopok itt "lépcsőzetesen" illeszkednek egymáshoz.
poligon
akkor nyerjük ezt, ha a hisztogram középpontjait összekötjük egyenes szakaszokkal. segítségével a nagyság szerinti eloszlásra hívhatjuk fel a figyelmet. gyakorisági sornak is elkészíthetjük ezt az ábráját.
hisztogram
az a grafikus ábra, amely derékszögű koordináta rendszerben hézag nélküli oszlopdiagram segítségével mutatja az osztályközös gyakorisági sorokat. oszlopainak területe arányos a gyakoriságokkal.
Pearson-féle A mutató
az eloszlás szimmetriájának vizsgálatára való centrális tendenciát mérő mutatószám. a mutató számlálója és így értke is 0, ha szimmetrikus a sokaság eloszlása, és különbözik 0-tól aszimmetria esetén. előjelét is értelmezhetjük, mivel pozitív előjel esetén jobb oldali, míg negatív előjel esetén bal oldali aszimmetriát találunk. a mutatónak nincs felső korlátja.
csúcsosság
az eloszlást jellemző görbe meredeksége a módusz környezetében.
osztály
az eredeti váltózóértékek helyett a belőlük képzett intervallumokat nevezzük így, hogy csökkentsük az ismérvváltozatok számát.
gyakorisági sor
az információk tömörítésének kézenfekvő módszere. 3 típusa van: egyszerű, osztályközös, osztályközéppel közelített. az azonos ismérvváltozattal rendelkező egyedeket meg kell számolni, és az ismérvváltozatok mellett azok számosságát, gyakoriságát kell feltüntetni. (egyben csoportosító sorok is)
Box-plot ábra
az ábra alapgondolata, hogy ha az interkvartilis terjedelmen belül a medián középen helyezkedik el, a kvantilisek eloszlása szimmetrikus. ha a felénél lejjebb, jobbra ferde, ha felénél feljebb, balra ferde az eloszlás. minél kisebb a terjedelem, annál kisebb a variancia. a totálisan kiugró (outlier) értékek az intervallumon kívül helyezkednek el. egy ábrában mutatja a mennyiségi eloszlások fontos jellemzőit: az átlagot, a kvartiliseket, a terjedelmet és az esetleges kiugró értékeket.
szórás
az átlagolandó értékek számtani átlagától való eltérésének négyzetes átlaga. a szóródás legfontosabb mérőszáma.
relatív értékösszeg
az értékösszegekből is kézenfekvően számíthatunk megoszlási viszonyszámokat, amiket így hívunk
felfelé kumulált gyakorisági sor
azt mutatja, hogy az adott osztályköz felső határának megfelelő, vagy annál kisebb ismérvértékek hányszor fordulnak elő.
ogiva
kumulált relatív gyakorisági görbe. kumulált értékeket ábrázol
koncentrációs tábla
ebben hasonlítjuk össze a vizsgált mennyiségi ismérv szerinti relatív gyakorisági és relatív értékösszeg-sort a relatív koncentráció elemzése során.
megoszlási viszonyszám
egy részsokaságot hasonlít az egészhez. a sokaság csoportosítását követően számíthatjuk. (pl. a Parlamentben a kormánypártok az összes szavazat 55%-ával rendelkeznek)
modális osztályköz
egyenlő hosszúságú osztályközök esetén azaz osztályköz, amelyhez a legnagyobb gyakoriság tartozik. a módusz ebben található.
normális eloszlás
egymóduszú, a móduszra nézve szimmetrikus elméleti eloszlás. központi szerepet tölt be a statisztikában. az összehasonlítás leggyakrabban azt vizsgálja, hogy az empirikus eloszlásunk szimmetrikusnak tekinthető-e, vagy a görbe valamelyik széle felé jobban elnyúlik.
Lorenz-görbe
egységoldalú négyzetben elhelyezett ábra, amely a kumulált relatív gyakoriságok függvényében ábrázolja a kumulált relatív értékösszegeket. szükség van a felfelé kumulált relatív gyakoriságok és a relatív értékösszegek adataira. amennyiben az egységeknek az értékösszegből való résesedése egyforma, a kumulált relatív gyakoriságok és a kumulált relatív értékösszegek rendre megegyeznek. mindez a koncentráció hiányára utal, ilyen esetben a görbe a négyzet átlójával egybeesik.
tökéletes szimmetria
esetében a számtani átlag, a medián és a módusz értéke megegyezik.
koncentráció
gazdasági-társadalmi jelenségekben megfigyelhető tömörülések, összpontosulások. mind a gazdasági folyamatokat, mint azok eredményeként létrejött állapotokat jellemzi. az egyenletes eloszlás ennek hiányát jelzi.
erős koncentráció
ha a sokaság nagy hányadához a teljes értékösszeg kis hányada tartozik, és ugyanakkor a sokaság kis hányadánál összpontosul a teljes értékösszeg nagy hányada.
relatív koncentráció
ha egy sokaságban a teljes értékösszeg jelentős része a sokaság egységeinek kis részénél összpontosul.
osztályközös gyakorisági sor
képzésének sarkalatos pontja az osztályok meghatározása. némely esetekben a változók jelege determinálja az osztályok meghatározását. (életkorokat pl. 10 éves intervallumokba szokás rendezni)
dummy változó
mindössze kétféle értéket vehet fel: pl. 1 érték valamilyen tulajdonság meglétét, 0 érték a tulajdonság hiányát jelöli. sajátos számtani átlaga és szórása van. további elnevezései: binomiális változó, fiktív változó, Bernoulli változó
kvalitatív változó
minőségi ismérvek. változatait nominális skálán mérjük, amik általában kifejezések, szimbólumok vagy kategóriás számértékek.
korrigálás
mivel a hisztogram oszlopai alapjának megváltoztatására nincs mód, ezért a magasságokat, így a gyakoriságokat szokás módosítani. a tipikus, tehát leggyakrabban előforduló osztályközökhöz viszonyítjuk az osztályközöket, és az így nyert arányszámokkal módosítjuk a magasságokat (gyakoriságokat).
ferdeség
olyan mutatószám, amely a normális eloszláshoz méri az aszimmetriát.
kumulálás
olyan művelet, melynek során a mennyiségi sorokat halmozottan összegezzük. felfelé és lefelé is megtehetjük.
bal oldali aszimmetria
olyan szimmetria, amelyben a görbe a csúcspontját valamilyen magas x értéknél veszi fel. ebben az esetben a változóértékek erősen korlátosak felülről. (gyakran emlegetett példája a halálozási gyakoriságok alaklása az életkorok függvényében)
jobb oldali aszimmetria
olyan szimmetria, amelyben a módusz értéke a legkisebb, ilyenkor a görbe csúcspontját valamilyen alacsony x értéknél veszi fel a magas x értékek felé haladva a gyakoriságok egyre kisebbek lesznek, a görbe hosszan elnyúlik. (jellemző a jövedelmek eloszlására)
súlyozott számtani átlag
olyan számtani átlag, amiben súlyoknak az egyes ismérvértékekhez tartozó gyakoriságokat tekintjük.
módusz
osztályközös gyakorisági sor esetében az az érték, amely körül az előforduló értékek legjobban sűrűsödnek, ahol a gyakorisági görbének maximuma van. az egzakt meghatározására itt nincs lehetőség.
empirikus sűrűségfüggvény
relatív gyakorisági poligon. ha az osztályközöket tetszőlegesen kicsivé sűríthetjük és elegendő a rendelkezésre álló megfigyelés, a poligon egyre jobban kisimul, közelít egy folytonos görbéhez (gyakorisági görbe)
relatív értékösszeg-sor
relatív értékösszegekből előállított statisztikai sor.
F-mutató
szimmetrikus eloszlás esetén, a mediánra szimmetrikus osztópontok, az alsó és felső kvartilis azonos távolságra helyezkedik el a mediántól. ennek a felismerésnek a felhasználásával készíthető egy olyan szimmetriát mérő szám, amely [-1;+1] zárt intervallumban helyezkedik el. pozitív előjel esetében jobb oldali, míg negatív előjel esetében bal oldali szimmetriát jelez.
relatív gyakoriság
így nevezzük a gyakoriságokból számított megoszlási viszonyszámokat.