met 102 kvantitativ

Ace your homework & exams now with Quizwiz!

Pearsons R

- Pearsons R: Standardisert mål på samvariasjon mellom to variabler En korrelasjonskoeffisient som viser i hvilken grad sammenhengen mellom to variabler kan fremstilles i form av en rettlinjet kurve i spredningsdiagrammet. Gir oss retningen og styrken på samvariasjon. Det er et standardisert mål og går fra -1 til 1.-1 perfekt nagativ korrelasjon - høye verdier på en variabel går med lave verdier på den andre.0 det er ingen samvariasjon mellom variablene.1 perfekt positiv korrelasjon - høye verdier på den ene går med høye verdier på den andre variabelen

intervallnivå

.Intervallnivå - verdier som kan kategoriseres, rangere og har lik avstand mellom seg, men har ikke et naturlig nullpunkt.

dummy-variabel/dikotom

0 eller 1 Regresjonsanalyse ikke bare begrenset til metriske variabler Den dikotome variabelen representerer et viktig unntak fra inndelingen ovenfor Kan legges på det målenivået vi måtte ønske Kun to verdier En slags av/på funksjon, der gruppen med en bestemt egenskap får den ene verdien og den andre gruppen får den andre verdien Eks Kvinner kan få variabelen 1 mens menn får verdien 0

justert R2

7% av variansen i avhengig variabel kan forklares av variansen i de uavhengige variablene. Et mål på hvor god modellen passer til dataen, og er forklaringsgraden. R2 vil egentlig alltid øke hvis du legger til en til uavhengig variabel, derfor kan det være misvisende å bare se på r2, ikke den justerte. R2: en standardisert variant av helningskoeffisienten, FORKLART VARIANS mer 'riktig' å se på enn bare R2. Forklart varians (r2) er et utrykk for den SAMLEDE forklaringskraften til alle uavhengige variablene. Kan sjekke om vi har utelatt en variabel som vi burde kontrollert for ved å se på justert r2.

konstantledd

A, angir den gjennomsnittlige verdien til Y når X er lik null. Der grafen kutter

additive indekser

Additive indekser (summere verdiene på variablene, slik at en enhets verdi på indeksen er lik summen av verdiene på indikatorene. lav velferd (alle som svarte 1-5), middels velferd (alle som svarte 6-10) osv osv.

univariat analyse

Analyse av EN variabel

kritikk ved signifikanstesting

At noe er statistisk signifikant betyr ikke nødvendigvis at det har noen forskningsmessig verdi. Statistisk signifikans sier KUN at effekten i utvalget samsvarer dårlig med 0 effekt på populasjonen, den sier ingenting om styrken til effekten. I store utvalg kan små (ubetydelige) effekter være statistisk signifikante.

avhengig variabel

Avhengig variabel (Y) - det vi ønsker å forklarer, påvirkes av forklaringsvariabelen(e)

Helningskoeffisienten/regresjonskoeffisienten

B, sier hvor mye Y i gjennomsnitt øker eller avtar for én enhets økning i X. Viser gjennomsnittlig endring i Y ved 1 enhets økning i X.Viktig å se på hvilken retning den går (positiv eller negativ)Hvor stor effekten er, kan være vanskelig å tolke og må sees ut ifra skalaen til variabelen. (Evt bruke standardiserte beta-koeffisienter).Se om helningsleddet er signifikant, p-verdi.

enhet

Begrep for det som blir undersøkt, både innenfor kvalitativ og kvantitativ analyse og på mikro, meso og makro-nivå i kvantitativ: Analyseenheter- De sosiale enhetene eller elementene i samfunnet som en studie tar utgangspunkt i.

validitet

Datamaterialets gyldighet for de problemstillingene som skal belyses. Er dataene relevante for det jeg har tenkt til å undersøke, og gir undersøkelsesopplegget meg relevante data? To typer validitet;Intern - er dataene egnet til å belyse problemstillingen?Hvor holdbare er slutningene om årsaksforhold?Ekstern - i hvilken grad kan resultatene fra én studie gjøres gjeldene for andre, ikke observerte tilfeller, kan de generaliseres?

datamatrise

Datamatrisen er en viktig forutsetning for enhver analyse, det er tre hovedelement i datamatrisen: Enheter (N), Variabler (V), Verdier.

frekvenser

Det antallet enheter som er registrert med en bestemt verdi

konfundering

Det kan være slik at både X og Y er forårsaket av en tredje variabel (Z)... Dette kalles konfundering. Z konfunderer her forholdet mellom X og Y. (når det blir SOMMER blir det mer is OG når det blir sommer blir det mer haiangrep.) ikke kausalitet mellom X og Y. Vi blir confused

restleddet

E= avviket mellom hva modellene predikerer og hvordan verden faktisk ser ut. Den er å betrakte som en tilfeldig forstyrrelse i den forstand at den ødelegger det som kunne ha vært en deterministisk sammenheng. En empirisk modell treffer aldri blink, og restleddet måler avstanden fra punktet vi faktisk treffer, til punktet vi burde ha truffet i en ideell verden. Representerer også effekten av målefeil foråsrsaket av unøyaktigheter i datainnsamlingen.

grafiske fremstillinger

En fremstilling av dataen vår ikke som tabell, men grafisk Gjør ofte lettere å lese Vi skiller mellom ulike typer av grafiske fremstillinger, for eksempel søylediagram, kake og linje. univariate fordelinger kan også beskrives ved hjelp av grafiske framstillinger. Figur ikke tabell. mange ulike. Tar vanligvis utgangspunkt i relative frekvenser (%)

null-hypoteser

En hypotese er vår alternative hypotese om at det ikke er en sammenheng mellom to variabler Vi beregner sannsynligheten for å trekke et utvalg med en bestemt estimat når vi antar at nullhypotesten stemmer. Vi ser for oss et parallelt univers: gjør vi funnene våre igjen hvis nullhypotesen stemmer, så forkaster vi den, og kan da si at vår H1 (alternativ hypotese) stemmer.

korrelasjonskoeffisient

En korrelasjonskoeffisient er et tall mellom −1 og 1 som oppsummerer graden av samsvar. Et eksempel er Pearsons R

parameter

En parameter er en tilsvarende egenskap (f eks gjennomsnitt eller koeffisient ved enhetene) for populasjonen.

substansiell signifikans

En substansiell signifikans er teoretisk og intuitivt meningsfull uavhengig om den er statistisk signifikant eller ikke. Sammenhengen er substansielt signifikant når den er sterk og har et rimelig fortegn. Statistisk signifikans er ingen garanti for noen av delene.

kontrollvariabel

En tredje// ++ variabel vi tar hensyn til for å fastslå om det er kausalitet eller kun sammenheng mellom noe. Uavhengig variabel (X) - påvirker eller forklarer den avhengige variabelen, forklaringsvariabel eller kontrollvariabel. I en bivariat vil du få opp at det er en sammenheng og kanskje til og med årsakssammenheng. Multiviariat kan du ha med flere og dermed KONTROLLERE FOR sommer som en tredje variabel, og da vil sammenhengen kollapset

variabel

En variabel er en egenskap ved enhetene som varierer

standardfeil

Enkelt fortalt er den utvalgenes snittavvik fra populasjonsverdien. En type standardavvik (standardavviket til utvalgsfordelingen) men ikke det samme som standardavvik.

estimat

Et estimat er en konkret egenskap (f eks gjennomsnitt eller koeffisient) ved enhetene i utvalget

forholdstallsnivå

Forholdstallsnivå - verdier som kan kategoriseres, rangeres, har lik avstand mellom seg og har et naturlig nullpunkt.

mål for sentraltendens

Forteller oss hva den typiske verdien for variabelen vår er

frihetsgrad

FrihetsgraderFrihetsgrader er antall verdier som fritt kan variere i en statistisk analyse. I en regresjonsanalyse er frihetsgrader gitt avdf = n - k - 1N= utvalgsstørrelsen, K=variabler, 1=konstantleddet Dersom det er mange variabler, har vi færre frihetsgrader - mer usikkerhet. Og derfor også konsekvenser for t-verdien og p-verdi. Dersom det er få variabler har vi flere frihetsgrader og mindre usikkerhet.Flere frihetsgrader = mindre usikkerhet = mer sannsynlig å få signifikante resultater.Jo flere variabler i analysen vår, jo færre frihetsgrader og jo vanskeligere blir det å få signifikante resultater.

generalisering

Generalisering er å trekke slutninger om et univers på grunnlag av utvalgsundersøkelse, enten gjennom statistisk- eller teoretisk generalisering. Statistisk generalisering: Statistisk generalisering vil si å bruke et utvalg til å si noe om en populasjon med minst mulig usikkerhet.Vi kan bruke statistisk generalisering for å bergene usikkerheten rundt et tall, eller testet om en sammenheng samsvarer med nullhypotesen.En egenskap ved en populasjon kalles en parameter, eks alder på studenter på UiB. Vi trekker et utvalg for å trekke antakelser om populasjonen. Et sannsynlighetsutvalg.

gjennomsnitt

Gjennomsnitt - mest typiske verdien, summen av alle verdiene delt på antall enheter.

BETA

Gjør ulike typer uavhengige variabler sine koeffisienter mer målbare : Standardiserer de Betakoeffisienter, som bruker standardavviket til variablene til å definere en felles referanseramme, ligger vanligvis mellom -1 og +1. Jo nærmere +1, jo sterkere positiv effekt og motsatt.

t-test

Hypotesetesting kan gjennomføres ved z-testen/t-testen og tilhørende p-verdi. Tommelfingerregel: Hvis det er over 2 i t-verdi pleier det å være statisisk signifikant (hvis vi forholder oss til 5% grense).

statistisk signifikans

I Samf: 0.05 -- 5% er statistisk signifikant Nullhypotese-signifikanstesting omhandler at vi har funnet en sammenheng i utvalget vårt, vi må så se om denne sammenhengen også finnes i populasjonen. Vi utfører da en signifikanstest som betyr å beregne sannsynligheten for at et estimat skyldes tilfaldigheter. Fem steg for hypotesetesting1. Hypoteseformulering2. Estimering3. Valg av signifikansnivå4. Testobservator (og kritisk verdi)5. Testens konklusjon Vi tillater oss med 5% signifikansnivå en 5% sjanse for at estimatet vårt skyldes tilfeldigheter

paneldata

I tillegg har vi data som varierer Både i tid og rom

kodebok

Inneholder en komplett oversikt over samtlige variabler og verdier i materialet. hjelper oss overføre data fra registeringsskjemaet til datamaterisen.

kausalitet

Kausalitet kjennetegnes ved årsaks relasjoner. Årsak kommer før virkning, virkningen opptrer nært årsaken både i tid og rom. I samfunnsvitenskapen sees aspektet med at hver gang årsaken opptrer vil også virkningen komme, som problematisk. Vi sier heller at «ting» har en viss tilbøyelighet til å skje når B blir påvirket av A.

kjikvadrattest

Kjikvadrattesten brukes for å se om noe er statistisk signifikant. Den gir oss en p-verdi (sannsynligheten for å se funnet vårt H1 dersom vi antar at H0 er riktig. P-verdien er mellom 0-1, jo nærmere 0 desto mindre sannsynlig er det at funnene våre skyldes tilfeldigheter.At noe er signifikant betyr ikke at den forårsaker resultatet, men vi ser en samvariasjon.

Konfidensintervall (Confidence interval)

Konfidensintervallet viser et intervall rundt helningsleddet (vårt beste gjett) hvor det er 95% sannsynlighet for at populasjonen ligger. Dette intervallet er standardisert fordi det baserer seg på signifikansnivå.

korrelasjonsanalyse

Korrelasjonsanalyse ønsker å undersøke forholdet mellom to variabler, vi kan finne ut hvordan ulike verdier på to variabler henger sammen. Nyttig å tenke i form av avhengig og uavhengig variabler. Fokuset er på spredningen av observasjoner i dataene. En ser på samvariasjonen mellom to variabler og den kan si noe om retningen, styrken og lineariteten mellom variabler.

kovarians

Kovarians: Ustandardisert mål på samvariasjon mellom to variabler - Pearsons R: Standardisert mål på samvariasjon mellom to variabler

median

Median - verdien som ligger i midten av datasettet når verdiene er rangert.

metode

Metode er systematiske og planmessige fremgangsmåter for å etablere pålitelig kunnskap og holdbare teorier innenfor et fagområde.

p-verdi

Minimumsverdien aka det laveste signifikansnivået knyttet til avvisning av null-hypotesen. Jo lavere p-verdi, jo lavere grunn til å akseptere nullhypotesen. Hvis p-verdien er lavere enn det valgte signifikansnivået (0.5 f eks), forkastes nullhypotesen. Er den 0.03, er det f eks 3 prosent sjanse for at tilfeldigheter kan ha forårsaket korrelasjonen.

modalprosent

Modalprosent er prosentandelen av enheten som befinner seg i den vanligste kategorien. Eks 11 elever, 6 jenter og 5 gutter. Modus er «jente» (de vi har flest av) prosentandelen finner vi ved 6/11=0,54.

modus

Modus/typetall - verdien som forekommer flest ganger.

kvartilavvik

Mål på spreding: Kvartilavvik er avstanden mellom kvartil 1 og kvartil 3, delt på 2.

standardavvik

Mål på spredning: Et mål på spredningen rundt et gjennomsnitt. Gjennomsnittet på hvor langt unna gjennomsnittet enhetene befinner seg. Standardavviket sier noe om hvor typisk den typiske verdien er, et lavt standardavvik -> lite variasjon rundt gjennomsnittet, høyt standardavvik -> mye variasjon rundt gjennomsnittet.For å finne standardavviket må vi først finne variansen, variansen viser den faktiske størrelsen for hvor langt unna datapunktene er fra gjennomsnittet. Dette er et ustandardisert mål og vanskelig å tolke, det er derfor vi bruker standardavviket.

nominalnivå

Nominalnivå - skiller mellom egenskaper, verdiene kan ikke rangeres på en naturlig måte, det er kun gjensidig utelukkende kategorier.

ordinalnivå

Ordinalnivå - verdier som kan kategoriseres og rangeres, men dert er ukjent avstand mellom verdiene

multivariat regresjon

Regresjon med FLERE enn en uavhengig variabel som vi tror/ønsker å vise at forklarer en avhengig variabel. Mer bein på skjelettet En multivariat regresjonsmodell knytter en avhengig variabel til FLERE forklaringsvariabler. EN slik modell har flere fordeler: mer fullstendig og dekkende bilde av fenomenene som studeres. I tillegg blir besrkivelsene av årsakssammenhenger mer presise, og dermed mer troverdige. Modeller med bare én forklarignsvariabel er nærmest per definisjon underspesifiserte, og kan gi misvisende resultater. Identifiserer effekten av én variabel samtidig som andre variabler holdes konstant, som kontrollert labratorieeksperimentet. Forklaringene isoleres fra andre forklaringer, og effektene tolkes uavhengig av andre effekter.

bivariat regresjonsanalyse

Regresjonsanalyse med to variabler: uavhengig og avhengig. Mens korrelasjonsananlyse kun avdekker samvariasjon mellom variabler, skiller regresjonsanalyse klart mellom variabler som forklarer og variabler som blir forklart. Begrensning: Forteller oss kun om det er samvariasjon/årsakssammenheng, men ikke nødvendigvis kausalitet. Dette trenger vi multivariat til. Her kan vi legge til kontrollvariabler i multi. EN opprinnelig bivariat effekt kan endre fullstendig karakter både hva angår styrke, signifikans og sågar fortegn når den analyseres på nytt i multi.

kovarians

Samvariasjon (IKKE det samme som kausalitet)

sentraltendens

Sentraltendens brukes for å finne den sentrale verdien til en variabel, dette kan gjøres på tre måter: Modus/typetall - verdien som forekommer flest ganger. Median - verdien som ligger i midten av datasettet når verdiene er rangert. Gjennomsnitt - mest typiske verdien, summen av alle verdiene delt på antall enheter.

statistiske mål

Sentraltendens og spredning

spredning

Spredning brukes for å finne ut hvor stor variasjon det er på en variabel, dette kan gjøres på fire måter: standardavvik, modalprodent, kvartilavvik og varians

Statistikk

Statistikk omhandler datainnsamling, operasjonalisering av variabler og analyse av dataene.

statistisk generalisering

Statistisk generalisering ser på sammenhenger mellom to variabler, og ønsker å generalisere denne sammenhengen fra et utvalg til resten av populasjonen. Ettersom kvalitative metoder for det meste behandler enkeltcaser og veldig få enheter, blir slik generalisering vanskelig.

sannsynlighetsfordeling

Statistisk generalisering tar utgangspunkt i hva som ville skjedd dersom vi hadde trukket et uendelig antall tilfeldige utvalg fra en kjent populasjon. Poenget er å benytte informasjonen om denne hypotetiske situasjonen til å kaste lys over analysen vi står ovenfor i praksis. Resultatene fra den gjentakende målingen av stadig nye utvalg fra den samme populasjonen = sannsynlighets fordeling. Denne fordelingen bygger en bro mellom den ukjente populasjonen og det kjente utvalget.

krysstabell

Tabeller over sammenhenger mellom variabler kalles kryss fordi de viser krysningspunkter mellom fordelingene for de ulike variablene. Tabellanalyse går ut på å sammenlikne betningede fordelinger. Prosentdifferansen er et mål for sammenhengenes styrke.

predikere

To predict

type 1 feil

Type 1: Vi forkaster H0 når den egentlig er riktig.

type 2 feil

Type 2: Vi beholder H0 når H1 er sann.

typologibaserte indekser

Typologibaserte indekser (logisk sammenslåing av typer. vi deler f eks befolkningen inn i to typer meninger)

uavhengig variabel

Uavhengig variabel (X) - påvirker eller forklarer den avhengige variabelen, forklaringsvariabel eller kontrollvariabel

reliabilitet

Uttrykk for hvor pålitelige data vi har, og hvor nøyaktig datainnsamlingen er foretatt. Graden av samsvar mellom ulike innsamlinger av data om samme fenomen basert på samme undersøkelsesopplegg. Det er to hovedtyper av reliabilitet;Stabilitet - samsvar mellom uavhengige datainnsamlinger om samme fenomen på ulike tidspunkt.Ekvivalens - likeverdighet, samsvar mellom uavhengige datainnsamlinger som samme fenomen på samme tidspunkt, og samsvar mellom data basert på ulike indikatorer i samme indeks.

målenivå

Variabler kan befinne seg på ulike målenivåer. Vi skiller mellom kategoriske: nominal og ordinal. og Metriske: Intervall og Forholdstallsnivå. Og DUMMY i tillegg. Hvilket målenivå sier noe om hvor presist variabelen kan måles, og dermed hvilke prosedyrer som kan benyttes

metriske variabler

Variabler som har verdier på TALL-nivå.

kategoriske variabler

Variabler som har verdier på TEKST-nivå. Kategorier

varians

Variansen viser den faktiske størrelsen for hvor langt unna datapunktene er fra gjennomsnittet.

verdi

Verdier er de ulike utfallene på en variabel

tabellananlyse

Vi analyserer kategoriske variabler, og bruker frekvensfordeling. Tabellanalyse fungerer når vi ikke analyserer mer enn to-tre variabler og det er få kategorier.Du kan bruke metriske variabler, men da må de kategoriseres.

prosentuering

Vi prosentuerer for å se den bivariate sammenhengen, det er derfor ikke likegyldig hvordan man prosentuerer. Dersom vi tror det er en årsakssammenheng mellom to variabler så prosentuerer vi etter forklaringsvariabelen. Vi ser på prosentdifferansen for å si noe om sammenhengensstyrke MER HER

uniform fordeling

alle verdiene har samme sannsynlighet for å dannes

univariat fordeling

en fordeling på en enkelt variabel eller på et enkelt indeks omtales ofte som en UNIVARIAT FORDELING.

testobservatør

en størrelse som måler i hvilken grad utvalgsresultatet avviker fra det forventede resultatet dersom nullhypotesen er korrekt.

omkoding

flere verdier på én og samme variabel slås sammen eller grupperes. f eks kun liten interesse, middels interesse og stor interesse, istedenfor 5 ulike verdier. Vi slår sammen flere verdier på samme variable slik at de grupperes. Dette vil forenkle det og gi det en bedre oversikt, men kan påvirke hvilke analysemetoder som kan brukes videre, og det gir en mindre detalsjert fremstilling av dataene.

deskriptiv/beskrivende statistikk

identifisere, beskrive og karakterisere faktiske mønstre i datamaterialet som undersøkes.

Utvalg

mindre andel av det fulle sette av tilsvarende enheter. De enhetene i en studie som faktisk blir undersøkt.

signifikansnivå

nivå som angir i hvilken grad vi er villige til å avvise nullhypotesen på feil grunnlag. Velger vi samfunnsvitenskapens 5 prosent signifikansnivå, er vi villige til å tolerere en feil beslutning (det vil si å avvise en nullhypotese selv om den er korrekt 5 av 100 ganger.

absolutte frekvenser

opptelling av enheter

relative frekvenser

prosent. alle enhetene utgjør da 100% til sammen

kumulative frekvenser

prosentandelen for en bestemt verdi pluss prosentandelene for alle lavere verdier.

populasjon/univers

sett med tilsvarende enheter av noe. Samlingen av alle enhetene som problemstillingen i en studie gjelder for.

indekskonstruksjon

slår sammen flere variabler til en ny indeks. De variablene som inngår i indeksen, kalles indikatorer. Vi skiller mellom ulike typer av indekser, for eksempel typologibaserte og additive indekser.

inferensiell/induktiv statistikk

trekker slutninger om bestemte forhold i universet basert på analyser av de tilsvarende forholdene i utvalget. TEORITESTING. it's ded

normalfordeling

utvalgskorrelasjonene fordeler seg rundt nullpunktet i en symmetrisk klokkeform.

operasjonalisering

Å gjøre noe målbart. Operasjonalisering av variabler vil si å gjøre noe målbart. Måten vi operasjonaliserer variabler kan ha stor innflytelse på resultatene vi kommer opp med, derfor viktig å tenke over hvordan du operasjonaliserer dem og du må veie fordeler og ulemper, samt ha gode grunner for å velge en bestemt type operasjonalisering. Eks vi ønsker å se på fattigdom, vi operasjonaliserer dette ved å se på inntekt eller tilgang til grunnleggende goder. Å benytte seg av indekser kan være en løsning. En indeks er en variabel som er satt sammen av flere variabler. En fordel med indeks er at man måler flere aspekter av kompliserte fenomen, en ulempe med indeks er at det blir mindre klart hva som måles og det er fremdeles et spørsmål om hvilke variabler som skal inkluderes og ikke.

tidsseriedata

ønsker du å undersøke en prosess over tid? longitudinell

tversnittdata

ønsker du å undersøke et sosialt fenomen på et tidspunkt?


Related study sets

Chapter 13 - Formation of Sales and Lease Contracts

View Set

Intro to Psychology-Chapter 6 & 8 practice tests!!!

View Set

True/False: Characteristics of Prokaryotic and Eukaryotic Cells

View Set

Nursing Fundamentals - Comprehensive Scenarios

View Set

Final Sophisticated Pricing strategies

View Set

Chapter 32. Gastrointestinal, Hepatobiliary, and Pancreatic Systems Function, Assessment, and Therapeutic Measures

View Set

TERMS: Understanding Marketing Basics

View Set