Egyszerű hipotézisek tesztelése Pearson-khi-négyzet teszttel MS EXCEL-ben. A Pearson-féle khi-négyzet teszt használatának feltételei és korlátozásai

A 19. század végéig a normál eloszlást tekintették az adatok variációjának egyetemes törvényének. K. Pearson azonban észrevette, hogy az empirikus frekvenciák nagymértékben eltérhetnek a normál eloszlástól. A kérdés az volt, hogyan lehet ezt bizonyítani. Nem csak grafikus összehasonlítást igényel, ami szubjektív, hanem szigorú mennyiségi indoklást is.

Így találták ki a kritériumot χ 2(khi-négyzet), amely az empirikus (megfigyelt) és az elméleti (várható) gyakoriságok közötti eltérés jelentőségét teszteli. Ez még 1900-ban történt, de a kritérium ma is használatos. Sőt, sokféle feladat megoldására lett adaptálva. Ez mindenekelőtt a nominális adatok elemzése, pl. azokat, amelyeket nem a mennyiség, hanem egy kategóriába való tartozás fejez ki. Például az autó osztálya, a kísérletben résztvevő neme, a növény típusa stb. A matematikai műveletek, mint az összeadás és a szorzás nem alkalmazhatók ilyen adatokra, csak a gyakoriságok számíthatók rájuk.

Jelöljük a megfigyelt frekvenciákat Ó (megfigyelve), várt - E (várható). Példaként vegyük a 60-szori kockadobás eredményét. Ha szimmetrikus és egyenletes, akkor annak a valószínűsége, hogy bármelyik oldal feljön, 1/6, ezért az egyes oldalak várható száma 10 (1/6∙60). A megfigyelt és a várt gyakoriságokat táblázatba írjuk és hisztogramot rajzolunk.

A nullhipotézis az, hogy a gyakoriságok konzisztensek, vagyis a tényleges adatok nem mondanak ellent a vártnak. Alternatív hipotézis, hogy a gyakorisági eltérések túlmutatnak a véletlenszerű ingadozásokon, vagyis az eltérések statisztikailag szignifikánsak. Ahhoz, hogy szigorú következtetést vonjunk le, szükségünk van.

  1. A megfigyelt és a várt gyakoriságok közötti eltérés általános mértéke.
  2. Ennek a mértéknek a megoszlása ​​azon hipotézis érvényessége mellett, hogy nincsenek különbségek.

Kezdjük a frekvenciák közötti távolsággal. Ha csak a különbséget vesszük O-E, akkor egy ilyen mérték az adatok skálájától (gyakoriságától) függ. Például 20 - 5 \u003d 15 és 1020 - 1005 \u003d 15. A különbség mindkét esetben 15. De az első esetben a várható gyakoriságok 3-szor kisebbek, mint a megfigyeltek, a második esetben pedig - csak 1,5%. Szükségünk van egy relatív mértékre, amely nem függ a skálától.

Figyeljünk a következő tényekre. Általánosságban elmondható, hogy a frekvenciák mérésére szolgáló fokozatok száma sokkal nagyobb lehet, így annak a valószínűsége, hogy egyetlen megfigyelés valamelyik kategóriába kerüljön, meglehetősen kicsi. Ha igen, akkor egy ilyen valószínűségi változó eloszlása ​​megfelel a ritka események törvényének, az úgynevezett Poisson törvénye. A Poisson törvényben, mint ismeretes, a matematikai elvárás és a variancia értéke megegyezik (paraméter λ ). Ezért a várható gyakoriság a nominális változó valamely kategóriája esetén Ei lesz a szimultán és annak szórása. Ezen túlmenően a Poisson-törvény nagyszámú megfigyeléssel általában normális. E két tényt kombinálva azt kapjuk, hogy ha igaz a megfigyelt és a várt gyakoriságok közötti egyezésre vonatkozó hipotézis, akkor nagyszámú megfigyeléssel, kifejezés

Lesz .

Fontos megjegyezni, hogy a normalitás csak kellően magas frekvencián jelenik meg. A statisztikában általánosan elfogadott, hogy a megfigyelések teljes számának (a gyakoriságok összegének) legalább 50-nek kell lennie, és a várható gyakoriságnak minden fokozatban legalább 5-nek kell lennie. Csak ebben az esetben a fent látható érték normál normálértékkel rendelkezik. terjesztés. Tegyük fel, hogy ez a feltétel teljesül.

A normál normál eloszlásban szinte minden érték ±3-on belül van (három szigma szabály). Így egy gradációra relatív frekvenciakülönbséget kaptunk. Általános intézkedésre van szükségünk. Nem lehet csak összeadni az összes eltérést – 0-t kapunk (találd ki, miért). Pearson javasolta ezen eltérések négyzeteinek összeadását.

Ezek a jelek kritérium χ 2 Pearson. Ha a gyakoriságok valóban megfelelnek a vártnak, akkor a kritérium értéke viszonylag kicsi lesz (mivel az eltérések többsége nulla közelében van). De ha a kritérium nagynak bizonyul, akkor ez a frekvenciák közötti jelentős különbségek mellett tanúskodik.

Egy kritérium akkor válik „nagygá”, ha ilyen vagy még nagyobb érték előfordulása valószínűtlenné válik. És egy ilyen valószínűség kiszámításához ismerni kell a kritérium eloszlását, amikor a kísérletet sokszor megismétlik, amikor a gyakorisági egyezés hipotézise helyes.

Mint látható, a khi-négyzet értéke a tagok számától is függ. Minél több van belőlük, annál nagyobbnak kell lennie a feltételnek, mert minden tag hozzá fog járulni a teljes összeghez. Ezért minden mennyiségre független feltételekkel, saját disztribúciója lesz. Kiderült, hogy χ 2 disztribúciók egész családja.

És elérkeztünk egy kínos pillanathoz. Mi az a szám független feltételek? Úgy tűnik, hogy bármely kifejezés (azaz eltérés) független. K. Pearson is így gondolta, de kiderült, hogy tévedett. Valójában a független tagok száma eggyel kevesebb lesz, mint a nominális változó gradációinak száma n. Miért? Mert ha van egy mintánk, amelyre a gyakoriságok összegét már kiszámoltuk, akkor az egyik gyakoriság mindig meghatározható a teljes szám és az összes többi összege közötti különbségként. Ezért a szórás valamivel kisebb lesz. Ronald Fisher 20 évvel azután vette észre ezt a tényt, hogy Pearson kidolgozta a kritériumát. Még az asztalokat is át kellett készíteni.

Ebből az alkalomból Fisher egy új fogalmat vezetett be a statisztikákba - a szabadság foka(szabadságfok), ami a független tagok száma az összegben. A szabadságfok fogalmának matematikai magyarázata van, és csak a normálhoz kapcsolódó eloszlásokban jelenik meg (Student, Fisher-Snedekor és maga a khi-négyzet).

Hogy jobban megértsük a szabadsági fokok jelentését, forduljunk a fizikai analóghoz. Képzeljünk el egy pontot, amely szabadon mozog a térben. 3 szabadságfoka van, mert a háromdimenziós tér bármely irányában mozoghat. Ha egy pont bármely felület mentén mozog, akkor már két szabadságfoka van (előre-hátra, jobbra-balra), bár továbbra is a háromdimenziós térben van. A rugó mentén mozgó pont ismét háromdimenziós térben van, de csak egy szabadságfokkal rendelkezik, mert előre vagy hátra mozoghat. Mint látható, az a tér, ahol az objektum található, nem mindig felel meg a valódi mozgásszabadságnak.

Körülbelül egy statisztikai ismérv megoszlása ​​is kisebb számú elemtől függhet, mint a kiszámításához szükséges összegzők. Általános esetben a szabadsági fokok száma kevesebb, mint a megfigyelések száma a rendelkezésre álló függőségek számával. Ez tiszta matematika, semmi varázslat.

Tehát az elosztás χ 2 eloszlások családja, amelyek mindegyike a szabadsági fokok paraméterétől függ. A khi-négyzet próba formális definíciója pedig a következő. terjesztés χ 2(khi-négyzet) -val k szabadsági fok a négyzetösszeg eloszlása k független standard normál valószínűségi változók.

Ezután áttérhetnénk magára a képletre, amely szerint a khi-négyzet eloszlásfüggvényt számoljuk, de szerencsére már régen ki van számolva nekünk minden. Az érdeklődés valószínűségének megállapításához használhatja a megfelelő statisztikai táblázatot vagy egy speciális szoftverben kész funkciót, amely akár Excelben is elérhető.

Érdekes látni, hogyan változik a khi-négyzet eloszlás alakja a szabadságfokok számától függően.

A szabadsági fok növekedésével a khi-négyzet eloszlás normális. Ezt magyarázza a centrális határeloszlás tétele, amely szerint nagyszámú független valószínűségi változó összege normális eloszlású. Nem mond semmit a négyzetekről.

Khi-négyzet hipotézis teszt

Elérkeztünk tehát a hipotézisek khi-négyzet módszerrel történő teszteléséhez. Általában a technika marad. Egy nullhipotézist állítanak fel, hogy a megfigyelt gyakoriságok megfelelnek a várt gyakoriságoknak (azaz nincs különbség köztük, mivel ugyanabból az általános sokaságból származnak). Ha ez a helyzet, akkor a szpred viszonylag kicsi lesz, a véletlenszerű ingadozások határain belül. A terjedés mértékét a khi-négyzet teszt határozza meg. Ezután vagy magát a kritériumot hasonlítjuk össze a kritikus értékkel (a megfelelő szignifikanciaszintre és szabadsági fokra), vagy helyesebben számítjuk ki a megfigyelt p-szintet, azaz. annak a valószínűsége, hogy a nullhipotézis érvényessége mellett a kritérium ilyen vagy még nagyobb értéket kapunk.

Mert Mivel minket a gyakoriságok egyezése érdekel, ezért a hipotézist elvetjük, ha a kritérium nagyobb, mint a kritikus szint. Azok. a kritérium egyoldalú. Néha (néha) azonban szükséges a balkezes hipotézis tesztelése. Például amikor az empirikus adatok nagyon hasonlítanak az elméleti adatokhoz. Ekkor a kritérium egy valószínűtlen régióba eshet, de már a bal oldalon. Az a tény, hogy természetes körülmények között valószínűtlen, hogy olyan frekvenciákat kapjunk, amelyek gyakorlatilag egybeesnek az elméletivel. Mindig van valami véletlenszerűség, ami hibát okoz. De ha nincs ilyen hiba, akkor talán meghamisították az adatokat. De ennek ellenére a jobbkezes hipotézist általában tesztelik.

Térjünk vissza a kockaproblémához. Számítsa ki a khi-négyzet próba értékét a rendelkezésre álló adatok alapján!

Most keressük meg a kritérium táblázatos értékét 5 szabadsági fokon ( k) és 0,05 szignifikanciaszint ( α ).

Azaz χ2 0,05; 5 = 11,1.

Hasonlítsuk össze a tényleges és a táblázatos értéket. 3,4( χ 2) < 11,1 (χ2 0,05; 5). A számított kritérium kisebbnek bizonyult, ami azt jelenti, hogy a gyakoriságok egyenlőségének (beleegyezésének) hipotézise nem utasítható el. Az ábrán a helyzet így néz ki.

Ha a számított érték a kritikus tartományba esik, akkor a nullhipotézist elvetjük.

Helyesebb lenne a p-szintet is kiszámolni. Ehhez meg kell találnia a táblázatban a legközelebbi értéket adott számú szabadsági fokhoz, és látnia kell a megfelelő szignifikanciaszintet. De ez a múlt század. Számítógépet használunk, különösen MS Excelt. Az Excelnek számos, a khi-négyzethez kapcsolódó függvénye van.

Az alábbiakban ezek rövid leírása olvasható.

XI2.OBR- bal oldalon a kritérium kritikus értéke adott valószínűséghez (mint a statisztikai táblázatokban)

chi2.ex.ph a kritérium kritikus értéke egy adott valószínűséghez a jobb oldalon. A függvény lényegében megduplázza az előzőt. De itt azonnal jelezheti a szintet α , ahelyett, hogy kivonnánk 1-ből. Így kényelmesebb, mert a legtöbb esetben a disztribúció jobb oldalára van szükség.

CH2.DIST– p-szint a bal oldalon (sűrűség számítható).

HI2.DIST.PH- p-szint a jobb oldalon.

HI2.TESZT– Khi-négyzet tesztet végez egyszerre két megadott frekvenciatartományon. A szabadsági fokok számát eggyel kevesebbre vesszük, mint az oszlopban lévő frekvenciák számát (ahogyan lennie kell), visszaadva a p-szintű értéket.

Egyelőre számoljuk ki kísérletünkhöz az 5 szabadságfok és az alfa 0,05 kritikus (táblázatos) értékét. Az Excel képlet így fog kinézni:

CH2.OBR(0,95;5)

chi2.inv.rx(0,05;5)

Az eredmény ugyanaz lesz - 11.0705. Ezt az értéket látjuk a táblázatban (1 tizedesjegyre kerekítve).

Végül kiszámítjuk a kritérium 5 szabadságfokának p-szintjét χ 2= 3.4. Szükségünk van a jobb oldali valószínűségre, ezért a függvényt RH (jobb farok) hozzáadásával vesszük fel.

CH2.DIST.RH(3,4;5) = 0,63857

Tehát 5 szabadságfokkal a kritériumérték megszerzésének valószínűsége χ 2= 3,4 és több, közel 64%-nak felel meg. Természetesen a hipotézist nem utasítják el (p-szint nagyobb, mint 5%), a gyakoriságok nagyon jó egyezést mutatnak.

És most nézzük meg a frekvenciaegyezésre vonatkozó hipotézist a CH2.TEST függvény segítségével.

Nincsenek táblázatok, nincsenek nehézkes számítások. A megfigyelt és várható gyakoriságú oszlopokat megadva a függvény argumentumaként, azonnal p-szintet kapunk. A szépség.

Képzeld el, hogy egy gyanús típussal kockáztatsz. A pontok eloszlása ​​1-től 5-ig változatlan marad, de 26 hatost dob ​​(az összes dobás száma 78 lesz).

A P-szint ebben az esetben 0,003-nak bizonyul, ami sokkal kisebb, mint 0,05. Komoly okok indokolják kétségbe vonni a kocka helyességét. Így néz ki ez a valószínűség egy khi-négyzet eloszlási diagramon.

Maga a khi-négyzet kritérium itt 17,8-nak bizonyul, ami természetesen több, mint a táblázatos (11,1).

Remélem, sikerült elmagyaráznom, mi az alkalmassági kritérium. χ 2(khi-négyzet) Pearson és hogyan tesztelik vele a statisztikai hipotéziseket.

Végül még egyszer egy fontos feltételről! A khi-négyzet teszt csak akkor működik megfelelően, ha az összes frekvencia száma meghaladja az 50-et, és az egyes fokozatok minimális várható értéke nem kevesebb, mint 5. Ha bármelyik kategóriában a várható gyakoriság kisebb, mint 5, de az összes frekvencia összege meghaladja az 5-öt. 50, akkor ezt a kategóriát a legközelebbivel kombináljuk úgy, hogy ezek összfrekvenciája meghaladja az 5-öt. Ha ez nem lehetséges, vagy a gyakoriságok összege kisebb, mint 50, akkor pontosabb hipotézisvizsgálati módszereket kell alkalmazni. Majd máskor beszélünk róluk.

Az alábbiakban egy videoklipet mutatunk be arról, hogyan tesztelhetünk egy hipotézist az Excel khi-négyzet tesztje segítségével.

  • Matematika
  • Ebben a cikkben a jellemzők, vagy, ahogy tetszik, a valószínűségi változók, változók közötti kapcsolatok vizsgálatáról fogunk beszélni. Különösen azt fogjuk elemezni, hogy a Khi-négyzet teszt segítségével hogyan lehet a jellemzők közötti függőség mértékét bevezetni, és összehasonlítani a korrelációs együtthatóval.

    Miért lehet erre szükség? Például, hogy megértsük, mely jellemzők függnek jobban a célváltozótól a hitelpontszámítás összeállításakor – az ügyfél nemteljesítésének valószínűségének meghatározása. Vagy, mint az én esetemben, hogy megértsük, milyen mutatókat kell használni egy kereskedési robot programozásához.

    Külön megjegyzem, hogy az adatok elemzéséhez a c# nyelvet használom. Lehet, hogy mindezt R-ben vagy Pythonban már megvalósították, de a c# használata számomra lehetővé teszi a téma részletes megértését, ráadásul ez a kedvenc programozási nyelvem.

    Kezdjük egy nagyon egyszerű példával, hozzunk létre négy oszlopot az Excelben véletlenszám-generátor segítségével:
    x=VÉLETLENSZERŰ (-100,100)
    Y =x*10+20
    Z =x*x
    T=VÉLETLENSZERŰ (-100,100)

    Mint látható, a változó Y lineárisan függ attól x; változó Z négyzetesen függ attól x; változók xés T független. Szándékosan választottam ezt, mert a függőség mértékét a korrelációs együtthatóval fogjuk összehasonlítani. Mint tudod, két valószínűségi változó között modulo 1, ha közöttük a legmerevebb típusú függés lineáris. Nulla korreláció van két független valószínűségi változó között, de a korrelációs együttható függetlensége nem következik a korrelációs együttható egyenlőségéből. Ezt később a változók példáján látni fogjuk. xés Z.

    A fájlt data.csv néven mentjük, és elindítjuk az első becsléseket. Először is számítsuk ki az értékek közötti korrelációs együtthatót. A kódot nem raktam be a cikkbe, a githubon ott van. Az összes lehetséges párra megkapjuk a korrelációt:

    Látható, hogy lineárisan függőre xés Y a korrelációs együttható 1. De azért xés Z egyenlő 0,01-gyel, bár a függőséget kifejezetten beállítottuk Z=x*x. Nyilvánvaló, hogy olyan intézkedésre van szükségünk, amely jobban „érzi” a függőséget. Mielőtt azonban rátérnénk a Khi-négyzet tesztre, nézzük meg, mi az a kontingenciamátrix.

    A kontingenciamátrix felépítéséhez a változóértékek tartományát intervallumokra bontjuk (vagy kategorizáljuk). Az ilyen particionálásnak számos módja van, míg nincs univerzális. Némelyikük intervallumokra van felosztva, hogy ugyanannyi változó essen bele, mások egyenlő hosszúságú intervallumokra vannak felosztva. Én személy szerint szeretem kombinálni ezeket a megközelítéseket. Úgy döntöttem, hogy ezt a módszert használom: kivonom a pontszámot a változóból. elvárásokat, akkor az eredményt elosztom a szórás becslésével. Más szavakkal, középre állítom és normalizálom a valószínűségi változót. A kapott értéket megszorozzuk egy tényezővel (ebben a példában ez egyenlő 1-gyel), ami után mindent egész számra kerekítünk. A kimenet egy int típusú változó, amely az osztályazonosító.

    Tehát vegyük a jeleinket xés Z, a fent leírt módon kategorizáljuk, majd kiszámoljuk az egyes osztályok számát és előfordulási valószínűségét, valamint a jellemzőpárok előfordulási valószínűségét:

    Ez egy mennyiségi mátrix. Itt a sorokban - a változó osztályok előfordulásának száma x, oszlopokban - a változó osztályok előfordulásának száma Z, cellákban - az osztálypárok egyidejű előfordulásának száma. Például a 0 osztály 865-ször fordul elő egy változónál x, 823-szor változó esetén Zés soha nem volt párja (0,0). Térjünk át a valószínűségekre úgy, hogy az összes értéket elosztjuk 3000-zel (a megfigyelések teljes száma):

    A jellemzők kategorizálása után kapott kontingencia mátrixot kapott. Itt az ideje, hogy átgondoljuk a kritériumot. Definíció szerint a valószínűségi változók függetlenek, ha az ezek által generált szigma-algebrák függetlenek. A szigma-algebrák függetlensége az események páronkénti függetlenségét jelenti tőlük. Két eseményt függetlennek nevezünk, ha együttes előfordulásának valószínűsége egyenlő ezen események valószínűségeinek szorzatával: Pij = Pi*Pj. Ezt a képletet fogjuk használni a kritérium megalkotásához.

    Null hipotézist: kategorizált jellemzők xés Z független. Ezzel egyenértékű: a kontingencia mátrix eloszlását kizárólag a változóosztályok előfordulási valószínűségei (sorok és oszlopok valószínűségei) adják meg. Vagy úgy: a mátrix cellái a sorok és oszlopok megfelelő valószínűségeinek szorzatai. A nullhipotézisnek ezt a megfogalmazását fogjuk használni a döntési szabály megalkotásához: jelentős eltérés a között Pijés Pi*Pj alapja lesz a nullhipotézis elvetésének.

    Legyen - a 0. osztály előfordulásának valószínűsége a változóban x. Összesen megvan n osztályok xés m osztályok Z. Kiderül, hogy a mátrix eloszlásának beállításához ezeket ismernünk kell nés m valószínűségek. De valójában, ha tudjuk n-1 valószínűsége x, akkor az utóbbit úgy kapjuk meg, hogy 1-ből kivonjuk a többiek összegét. Így ahhoz, hogy megtaláljuk a kontingenciamátrix eloszlását, tudnunk kell l=(n-1)+(m-1)értékeket. Vagy van nekünk l-dimenziós parametrikus tér, amelyből a vektor megadja a kívánt eloszlást. A khi-négyzet statisztika így fog kinézni:

    és Fisher tétele szerint Khi-négyzet eloszlásuk van n*m-l-1=(n-1)(m-1) szabadsági fokokat.

    Állítsuk a szignifikancia szintet 0,95-re (vagy az I. típusú hiba valószínűsége 0,05). Keressük meg a példából a Chi-négyzet eloszlás kvantilisét az adott szignifikanciaszintre és szabadságfokra (n-1) (m-1)=4*3=12: 21.02606982. Maga a khi-négyzet statisztika a változókra xés Z egyenlő: 4088.006631. Látható, hogy a függetlenségi hipotézist nem fogadják el. Célszerű figyelembe venni a Khi-négyzet statisztika és a küszöbérték arányát - ebben az esetben ez egyenlő Chi2Coeff=194,4256186. Ha ez az arány kisebb, mint 1, akkor a függetlenségi hipotézist elfogadjuk, ha nagyobb, akkor nem. Nézzük meg ezt az arányt az összes jellemzőpárra:

    Itt 1. tényezőés faktor2- jellemzők nevei
    src_cnt1és src_cnt2- az eredeti jellemzők egyedi értékeinek száma
    mod_cnt1és mod_cnt2- az egyedi jellemzőértékek száma a kategorizálás után
    chi2- Khi-négyzet statisztika
    chi2max- a Chi-négyzet statisztika küszöbértéke 0,95-ös szignifikanciaszinthez
    chi2Coeff- a khi-négyzet statisztika és a küszöbérték aránya
    korr- korrelációs együttható

    Látható, hogy függetlenek (chi2coeff<1) получились следующие пары признаков - (X,T), (Y, T) és ( Z,T), ami logikus, mivel a változó T véletlenszerűen generált. Változók xés Z függő, de kevésbé, mint lineárisan függő xés Y, ami szintén logikus.

    Az ezeket a mutatókat kiszámoló segédprogram kódját kiraktam a githubon, ugyanitt a data.csv fájlba. A segédprogram csv fájlt fogad be bemenetként, és kiszámítja az összes oszloppár közötti függőséget: PtProject.Dependency.exe data.csv


    Statisztikai tesztek kereszttáblákhoz - Khi-négyzet teszt

    A kereszttáblák statisztikai tesztjeinek lekéréséhez kattintson a Statisztika... gombra a Kereszttáblák párbeszédpanelen. Megnyílik a Crosstabs: Statistics párbeszédpanel (lásd: 11.9. ábra).

    Rizs. 11,9:

    A párbeszédpanel jelölőnégyzetei lehetővé teszik egy vagy több feltétel kiválasztását.

      Khi-négyzet teszt ( x 2)

      Összefüggések

      Rokonsági mérőszámok a nominális skálához kapcsolódó változókra

      Az ordinális skálához kapcsolódó változók rokonsági foka

      Az intervallumskálához kapcsolódó változók rokonsági foka

      Kappa együttható ( nak nek)

      A kockázat mértéke

      McNemar teszt

      Cochran és Mantel-Haenzel statisztikák

    Ezeket a teszteket a következő két rész tárgyalja, és mivel a khi-négyzet teszt nagy jelentőséggel bír a statisztikai számításokban, külön fejezetnek szenteljük.

    Khi-négyzet teszt ( x 2)

    A khi-négyzet teszt elvégzésekor a kontingenciatábla két változójának kölcsönös függetlenségét ellenőrizzük, és ennek köszönhetően közvetve mindkét változó függőségét kiderítjük. Két változót egymástól függetlennek mondunk, ha a cellákban megfigyelt gyakoriságok (f o) megegyeznek a várt gyakorisággal (fe).

    A khi-négyzet teszt SPSS segítségével történő futtatásához kövesse az alábbi lépéseket:

      Válassza a parancsmenüből Elemzés (Elemzés) Leíró statisztika (Leíró statisztika) Kereszttáblák... (Kontingenciatáblázatok)

      A Reset gombbal törölheti a lehetséges beállításokat.

      Változó mozgatása szex karakterláncok listájára és egy változóra Psziché- az oszlopok listájához.

      Kattintson a gombra Sejtek...(sejtek). A párbeszédpanelen az alapértelmezett Megfigyelt jelölőnégyzet mellett jelölje be a Várható és Szabványos jelölőnégyzetet. Erősítse meg választását a Folytatás gombbal.

      Kattintson a gombra Statisztika...(Statisztika). Megnyílik a fent leírt Crosstabs: Statistics párbeszédpanel.

      Jelölje be a Khi-négyzet jelölőnégyzetet. Kattintson a Folytatás gombra, majd a fő párbeszédpanelen kattintson az OK gombra.

    A következő vészhelyzeti táblázatot kapja meg.

    Nem * Mentális állapot Kontingencia táblázat

    Mentális kondíció Teljes
    Rendkívül instabil instabil fenntartható Nagyon stabil
    Padló Női Számol 16 18 9 1 44
    Várható gróf 7,9 16,6 17,0 2,5 44,0
    Std. Maradó 2,9 ,3 -1,9 -.9
    Férfi Számol 3 22 32 5 62
    Várható gróf 11,1 23,4 24,0 3,5 62,0
    Std. Maradó -2,4 -,3 1,6 ,8
    Teljes Számol 19 40 41 6 106
    Várható gróf 19,0 40,0 41,0 6,0 106,0

    Ezenkívül a khi-négyzet teszt eredményei megjelennek a megtekintő ablakban:

    Khi-négyzet tesztek

    érték df Asymp. Sig. (kétoldalas)
    (Aszimptotikus szignifikancia (kétfarkú))
    Pearson Chi-négyzet
    (Chi-négyzet Pearson szerint)
    22.455(a) 3 ,000
    Valószínűségi arány
    (valószínűségi arány)
    23,688 3 ,000
    Lineárisan-Lineáris asszociáció
    (Függőség lineáris-lineáris)
    20,391 1 ,000
    N az érvényes esetek közül
    (Engedélyezett esetek száma)
    106

    a. 2 cella (25,0%) várt száma kevesebb, mint 5. A minimális elvárt szám 2,49

    A khi-négyzet teszt kiszámításához három különböző megközelítést alkalmaznak:

    • Pearson-képlet;
    • hitelességi korrekció;
    • Mantel-Haenszel teszt.
    • Ha a kereszttábla négy mezőből áll (2 x 2 táblázat), és a várható valószínűség kisebb, mint 5, akkor ezen felül, Fisher pontos tesztje.

    Általában a Pearson-képletet használják a khi-négyzet teszt kiszámításához:

    Itt számítjuk ki a kontingenciatábla összes mezőjének standardizált maradékainak négyzeteinek összegét. Ezért a magasabb standardizált reziduális mezők nagyobb mértékben járulnak hozzá a khi-négyzet értékéhez, és ezáltal az értelmes eredményhez. A 8.9. szakaszban megadott szabály szerint a 2 (1,96) vagy annál nagyobb szabványos maradék jelentős eltérést jelez a megfigyelt és a várt gyakoriságok között egy adott táblázatcellában.

    Ebben a példában a Pearson-képlet adja meg a khi-négyzet teszt legjelentősebb értékét (o<0,0001). Если рассмотреть стандартизованные остатки в отдельных полях таблицы сопряженности, то на основе вышеприведенного правила можно сделать вывод, что эта значимость в основном определяется полями, в которых переменная Psziché azt jelenti, hogy „rendkívül instabil”. A nőknél ez az érték jelentősen megnő, a férfiaknál pedig csökken.

    A helyességét a A khi-négyzet tesztet két feltétel határozza meg:

    • várható frekvenciák< 5 должны встречаться не более чем в 20% полей таблицы;
    • a sorok és oszlopok összegének mindig nagyobbnak kell lennie nullánál.

    A vizsgált példában azonban ez a feltétel nem teljesül teljes mértékben. Ahogy a khi-négyzet teszttáblázat utáni megjegyzés is mutatja, a mezők 25%-ának várható gyakorisága kisebb, mint 5. Mivel azonban a megengedett 20%-os határt csak kis mértékben lépték túl, és ezek a mezők nagyon kis szabványos maradékuk miatt , nagyon kis arányban járulnak hozzá a chi teszt -négyzet értékéhez, ez a szabálysértés jelentéktelennek tekinthető.

    A Pearson-féle képlet alternatívája a khi-négyzet teszt kiszámításához a valószínűségi korrekció:

    Nagy mintaméret esetén a Pearson-képlet és a korrigált képlet nagyon közeli eredményeket adnak. Példánkban a valószínűséggel korrigált khi-négyzet teszt 23,688.

    Khi-négyzet A Pearson a legegyszerűbb teszt két kategorizált változó közötti kapcsolat szignifikanciájára. A Pearson-kritérium azon alapul, hogy a kétbemenetes táblázatban várt A "nincs kapcsolat a változók között" hipotézis alatti gyakoriságok közvetlenül számíthatók. Képzelje el, hogy 20 férfit és 20 nőt kérdeznek meg a szódaválasztásról (márka A vagy márka B). Ha nincs kapcsolat a preferencia és a nem között, akkor természetesen elvárni egyenlő márkaválasztás Aés márkák B minden nemhez.

    A statisztika jelentése chi-négyzet szignifikancia szintje pedig a megfigyelések teljes számától és a táblázat celláinak számától függ. pontban tárgyalt elveknek megfelelően , a megfigyelt gyakoriságok viszonylag kis eltérései a várttól jelentősnek bizonyulnak, ha nagy a megfigyelések száma.

    A kritérium használatának egyetlen jelentős korlátja van chi-négyzet(a megfigyelések véletlenszerű kiválasztásának nyilvánvaló feltételezésétől eltekintve), amely szerint a várható gyakoriságok nem lehetnek nagyon kicsik. Ez azért van, mert a kritérium chi-négyzet természeti ellenőrzések valószínűségek minden cellában; és ha a cellákban a várható gyakoriságok kicsik lesznek, például 5-nél kisebbek, akkor ezek a valószínűségek nem becsülhetők kellő pontossággal a rendelkezésre álló frekvenciák felhasználásával. További tárgyalásokért lásd Everitt (1977), Hays (1988) vagy Kendall és Stuart (1979).

    Khi-négyzet teszt (maximum likelihood módszer).legnagyobb valószínűségű khi-négyzet célja, hogy ugyanazt a hipotézist tesztelje a kereszttáblás kapcsolatokról, mint a teszt chi-négyzet Pearson. Számítása azonban a maximum likelihood módszerén alapul. A gyakorlatban képviselői statisztika chi-négyzet nagyságrendjében nagyon közel áll a szokásos Pearson-statisztikához chi-négyzet. E statisztikákkal kapcsolatban lásd Bishop, Fienberg és Holland (1975) vagy Fienberg (1977). fejezetben Napló Lineáris Elemzés ezeket a statisztikákat részletesebben tárgyaljuk.

    Yeats korrekció. Statisztikai közelítés chi-négyzet a cellákban kis számú megfigyelést tartalmazó 2x2-es táblázatoknál javítható, ha a várt és megfigyelt gyakoriságok közötti különbségek abszolút értékét 0,5-tel csökkentjük a négyzetesítés előtt (az ún. Yates korrekció). A becslést mérsékeltebbé tevő Yates-korrekciót általában akkor alkalmazzák, ha a táblázatok csak kis gyakoriságokat tartalmaznak, például amikor egyes várható gyakoriságok 10-nél kisebbek (további tárgyalásokért lásd Conover, 1974; Everitt, 1977; Hays, 1988). Kendall és Stuart, 1979 és Mantel, 1974).

    Fisher pontos tesztje. Ez a kritérium csak a 2x2-es asztalokra vonatkozik. A kritérium a következő érvelésen alapul. A táblázat határgyakoriságait figyelembe véve tegyük fel, hogy mindkét táblázatos változó független. Tegyük fel magunknak a kérdést: mekkora valószínűséggel kapjuk meg a táblázatban megfigyelt gyakoriságokat a megadott határértékek alapján? Kiderül, hogy ez a valószínűség kiszámítva pontosan a marginálisok alapján megszámolva az összes megépíthető táblát. Így a Fisher-kritérium kiszámítja pontos a megfigyelt gyakoriságok előfordulási valószínűsége nullhipotézis szerint (a táblázatos változók közötti asszociáció hiánya). Az eredménytáblázat egy- és kétoldalas szinteket is tartalmaz.

    McNemar khi-négyzete. Ez a feltétel akkor érvényes, ha a 2x2 táblázatban szereplő frekvenciák reprezentálnak függő minták. Például ugyanazon személyek megfigyelései a kísérlet előtt és után. Konkrétan a félév elején és végén matematikából a legalacsonyabb pontszámot elért hallgatók számát számolhatja meg, vagy a hirdetés előtt és után ugyanazokat a válaszadókat részesítette előnyben. Két értéket számítanak ki chi-négyzet: HIRDETÉSés IDŐSZÁMÍTÁSUNK ELŐTT. A/D khi-négyzet teszteli azt a hipotézist, hogy a frekvenciák a sejtekben Aés D(bal felső, jobb alsó) azonosak. B/C chi-négyzet teszteli a sejtekben lévő frekvenciák egyenlőségére vonatkozó hipotézist Bés C(jobb felső, bal alsó).

    Együttható Phi.phi-négyzet egy 2x2-es táblázat két változója közötti kapcsolat mértéke. Értékei eltérnek 0 (nincs függőség a változók között; chi-négyzet = 0.0 ) előtt 1 (abszolút kapcsolat a táblázatban szereplő két tényező között). Részletekért lásd Castellan és Siegel (1988, 232. o.).

    Tetrachor korreláció. Ezt a statisztikát csak a 2x2 kereszttáblákra számítják ki (és alkalmazzák). Ha egy 2x2-es táblázat két folytonos változó értékének két osztályra való (mesterséges) felosztásának eredményeként tekinthető, akkor a tetrachor korrelációs együttható lehetővé teszi e két változó közötti kapcsolat becslését.

    Konjugálási együttható. A kontingencia együttható statisztikai alapú chi-négyzet a kontingenciatáblázat jellemzői viszonyának mértéke (Pearson javaslata). Ennek az együtthatónak az előnye a szokásos statisztikákkal szemben chi-négyzet abban könnyebben értelmezhető, mert tartománya tól tartományba esik 0 előtt 1 (ahol 0 megfelel a táblázatban szereplő jelek függetlenségének esetének, és az együttható növekedése a kapcsolódás mértékének növekedését mutatja). A kontingencia együttható hátránya, hogy maximális értéke a táblázat méretétől "függ". Ez a tényező csak akkor érheti el az 1-et, ha az osztályok száma korlátlan (lásd Siegel, 1956, 201. o.).

    A kommunikációs intézkedések értelmezése. A fentebb tárgyalt asszociációs mérőszámok jelentős hátránya, hogy nehéz értelmezni őket a valószínűség vagy a "magyarázott variáció töredéke" általános fogalmaival, mint a korrelációs együttható esetében. r Pearson (lásd Korrelációk). Ezért nincs egyetlen általánosan elfogadott mérték vagy asszociációs együttható.

    Rang alapú statisztika. Sok, a gyakorlatban felmerülő problémában csak ben vannak méréseink sorrendi skála (lásd A statisztika elemi fogalmai). Ez különösen igaz a pszichológia, szociológia és más, az embertanulmányozáshoz kapcsolódó tudományterületek méréseire. Tegyük fel, hogy megkérdezett egy csoportot válaszadókkal, hogy megtudja, hogyan viszonyulnak bizonyos sportokhoz. A méréseket egy skálán ábrázolja a következő pozíciókkal: (1) mindig, (2) általában, (3) néhaés (4) soha. Nyilván a válasz néha érdeklődik a válaszadónál kisebb érdeklődést mutat általában érdeklődik stb. Így lehetséges a válaszadók érdeklődési fokának racionalizálása (rangsorolása). Ez az ordinális skála tipikus példája. Az ordinális skálán mért változóknak megvannak a saját típusú korrelációi, amelyek lehetővé teszik a függőségek értékelését.

    R Spearman. statisztika R Spearman ugyanúgy értelmezhető, mint a Pearson-korreláció ( r Pearson) az elmagyarázott varianciaarány tekintetében (de szem előtt tartva, hogy a Spearman-statisztikát rangokból számítják). Feltételezzük, hogy a változókat legalább ben mérjük sorrendi skála. Spearman rangkorrelációjának, erejének és hatékonyságának átfogó tárgyalása megtalálható például Gibbons (1985), Hays (1981), McNemar (1969), Siegel (1956), Siegel és Castellan (1988), Kendall (1948). ), Olds (1949) és Hotelling és Pabst (1936).

    Tau Kendall. Statisztika tau Kendall megfelelője R Spearman bizonyos alapfeltevések alapján. Az erejükkel is egyenértékű. Általában azonban az értékek R Spearman és tau A Kendall azért különbözik egymástól, mert mind belső logikájukban, mind számítási módjában különböznek. Siegel és Castellan (1988) a szerzők a következőképpen fejezték ki a két statisztika közötti kapcsolatot:

    1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

    Ami még fontosabb, Kendall statisztikái taués Spearman R eltérő értelmezésük van: míg a statisztika R Spearman a statisztika közvetlen analógjának tekinthető r Pearson rangok szerint számolva, Kendall statisztikája tau inkább azon alapul valószínűségek. Pontosabban azt ellenőrzik, hogy van-e különbség annak valószínűsége között, hogy a megfigyelt adatok két mennyiség esetén azonos sorrendben vannak, és annak valószínűsége között, hogy eltérő sorrendben vannak. Kendall (1948, 1975), Everitt (1977), valamint Siegel és Castellan (1988) nagyon részletesen tárgyalja tau Kendall. Általában a statisztikák két változatát számítják ki tau Kendall: tau bés tau c. Ezek az intézkedések csak az átfedő rangok kezelési módjában különböznek egymástól. A legtöbb esetben a jelentésük nagyon hasonló. Ha eltérések merülnek fel, akkor ez tűnik a legbiztonságosabb módnak a két érték közül a kisebb figyelembevétele.

    Sommer-együttható d: d(X|Y), d(Y|X). Statisztika d A Sommer a két változó közötti kapcsolat nem szimmetrikus mértéke. Ez a statisztika közel áll ehhez tau b(Lásd Siegel és Castellan, 1988, 303-310. o.).

    Gamma statisztikák. Ha sok egyező érték van az adatokban, a statisztika gamma előnyös R Spearman ill tau Kendall. A mögöttes feltételezések, statisztikák tekintetében gamma egyenértékű a statisztikákkal R Spearman vagy Tau Kendall. Értelmezése és számításai jobban hasonlítanak Kendall tau statisztikájához, mint Spearman R statisztikájához. Röviden, gamma is valószínűség; pontosabban annak a valószínűségének különbsége, hogy két változó rangsorrendje egyezik, mínusz annak a valószínűsége, hogy nem egyezik, osztva eggyel mínusz az egyezések valószínűsége. Szóval a statisztika gamma alapvetően egyenértékű tau Kendall, kivéve, hogy a véletleneket kifejezetten figyelembe veszik a normalizálás során. A statisztika részletes tárgyalása gamma megtalálható Goodman és Kruskal (1954, 1959, 1963, 1972), Siegel (1956) és Siegel és Castellan (1988).

    Bizonytalansági együtthatók. Ezek az arányok mérik információs kapcsolat tényezők (a táblázat sorai és oszlopai) között. koncepció információfüggőség a gyakorisági táblázatok elemzésének információelméleti megközelítéséből ered, ennek tisztázására a vonatkozó kézikönyvekben lehet hivatkozni (lásd Kullback, 1959; Ku és Kullback, 1968; Ku, Varner és Kullback, 1971; lásd még Bishop , Fienberg és Holland, 1975, 344-348. Statisztika S(Y, X) szimmetrikus, és egy változóban lévő információ mennyiségét méri Y változóhoz képest x vagy változóban x változóhoz képest Y. Statisztika S(X|Y)és S(Y|X) iránykapcsolatot fejez ki.

    Többdimenziós válaszok és dichotómiák. Az olyan változók, mint a többváltozós válaszok és a többváltozós dichotómiák olyan helyzetekben merülnek fel, amikor a kutatót nemcsak az események „egyszerű” gyakorisága érdekli, hanem ezeknek az eseményeknek néhány (gyakran strukturálatlan) minőségi tulajdonságai is. A többdimenziós változók (tényezők) természetét leginkább példákon keresztül érthetjük meg.

    • · Többváltozós válaszok
    • · Többdimenziós dichotómiák
    • Többváltozós válaszok és dichotómiák kereszttáblázata
    • Változók páros kereszttáblázata többváltozós válaszokkal
    • · Záró megjegyzés

    Többdimenziós válaszok. Képzelje el, hogy egy széleskörű marketingkutatás során arra kérte az ügyfeleket, hogy nevezzék meg a 3 legjobb üdítőt az ő szemszögükből. Egy tipikus kérdés így nézhet ki.

    A khi-négyzet teszt elvégzése során a kontingenciatábla két változójának kölcsönös függetlenségét ellenőrizzük, és ennek köszönhetően közvetett módon kiderül mindkét változó függősége. Két változót egymástól függetlennek mondunk, ha a cellákban megfigyelt gyakoriságok (f 0) egyeznek a várt gyakorisággal (fe).

    A khi-négyzet teszt SPSS segítségével történő futtatásához kövesse az alábbi lépéseket:

    • Válassza ki a parancsokat a menüből elemezni(Elemzés) > Leíró statisztika(Leíró statisztika) > Kereszttáblák…(Kontingens táblázatok)
    • gomb Visszaállítás(Reset) törölje a lehetséges beállításokat.
    • Helyezze át a nem változót egy sorlistába, a psziché változót pedig egy oszloplistába.
    • Kattintson a gombra Cellák…(sejtek). A párbeszédpanelen jelölje be az alapértelmezett jelölőnégyzet mellett Megfigyelt, további jelölőnégyzetek vártés szabványosított. Erősítse meg választását a gombbal Folytatni.
    • Kattintson a gombra Statisztika…(Statisztika).

    Megnyílik a fent leírt párbeszédpanel. Kereszttáblák: Statisztika.

    • Jelölje be a négyzetet Khi-négyzet(Chi-négyzet). Kattintson a gombra Folytatni, és a fő párbeszédpanelen - a rendben.

    A következő vészhelyzeti táblázatot kapja meg.

    Nem * Mentális állapot. Esetleges táblázat.

    Mentális kondíció Teljes
    Rendkívül instabil instabil fenntartható Nagyon stabil
    Padló női Számol 16 18 9 1 44
    Várható gróf 7.9 16.6 17.0 2.5 44.0
    Std. Maradó 2.9 0.3 -1.9 -0.9
    Férfi Számol 3 22 32 5 62
    Várható gróf 11.1 23.4 24.0 3.5 62.0
    Std. Maradó -2.4 -0.3 1.6 0.8
    Teljes Számol 19 40 41 6 106
    Várható gróf 19.0 40.0 41.0 6.0 106.0

    Ezenkívül a khi-négyzet teszt eredményei megjelennek a megtekintő ablakban:

    Khi-négyzet tesztek

    • a. 2 cella (25,0%) várt száma kevesebb, mint 5. A minimális elvárt szám 2,49

    A khi-négyzet teszt kiszámításához három különböző megközelítést alkalmaznak: a Pearson-képletet, a valószínűségi korrekciót és a Mantel-Haenszel-tesztet. Ha a kereszttáblának négy mezője van, és a várható valószínűség 5-nél kisebb, akkor a Fisher-féle pontos tesztet is végrehajtják.

    Pearson khi-négyzet tesztje

    Általában a Pearson-képletet használják a khi-négyzet teszt kiszámításához:

    Itt számítjuk ki a kontingenciatábla összes mezőjének standardizált maradékainak négyzeteinek összegét. Ezért a magasabb standardizált reziduális mezők nagyobb mértékben járulnak hozzá a khi-négyzet értékéhez, és ezáltal az értelmes eredményhez. A 8.7.2. szakaszban megadott szabály szerint a 2 vagy több szabványos maradék jelentős eltérést jelez a megfigyelt és a várt gyakoriságok között.

    Az általunk vizsgált példában a Pearson-képlet adja meg a khi-négyzet teszt legjelentősebb értékét (p<0.001). Если рассмотреть стандартизованные остатки в отдельных полях таблицы сопряженности, то на основе вышеприведенного правила можно сделать вывод, что эта значимость в основном определяется полями, в которых переменная psyche имеет значение "крайне неустойчивое". У женщин это значение сильно повышено, а у мужчин - понижено.

    A khi-négyzet teszt helyességét két feltétel határozza meg: először is a várható gyakoriságok< 5 должны встречаться не более чем в 20% полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.

    A vizsgált példában azonban ez a feltétel nem teljesül teljes mértékben. Ahogy a khi-négyzet teszttáblázat utáni megjegyzés is mutatja, a mezők 25%-ának várható gyakorisága 5-nél kisebb. Mivel azonban a megengedett 20%-os határt csak kis mértékben lépték túl, és ezek a mezők nagyon kis méretük miatt standardizáltak. maradék, nagyon kis arányban járulnak hozzá a khi-négyzet próba négyzet értékéhez, ez a szabálysértés jelentéktelennek tekinthető.

    valószínűség-korrigált khi-négyzet teszt

    A Pearson-féle képlet alternatívája a khi-négyzet teszt kiszámításához a valószínűségi korrekció:

    Nagy mintaméret esetén a Pearson-képlet és a korrigált képlet nagyon közeli eredményeket adnak. Példánkban a valószínűséggel korrigált khi-négyzet teszt 23,688.

    Mantel-Haensel teszt

    Ezen túlmenően a megnevezés alatti tartaléktáblázatban lineárisan-lineárisan("lineáristól-lineárisig") a Mantel-Haenszel teszt értéke (20.391) jelenik meg. A Mantel-Haenszel khi-négyzet tesztnek ez a formája a kereszttábla sorai és oszlopai közötti lineáris kapcsolat egy másik mérőszáma. Ezt a Pearson-korrelációs együttható és a megfigyelések számának szorzataként határozzuk meg:

    Az így kapott kritériumnak egy szabadságfoka van. A Mantel-Haenszel módszert mindig a párbeszédpanelen használjuk Kereszttáblák: Statisztika ellenőrizve Khi-négyzet. A névleges skálára vonatkozó adatok esetében azonban ez a kritérium nem alkalmazható.