Nivelul de semnificație statistică (p). Semnificație statistică: definiție, concept, semnificație, ecuații de regresie și testare de ipoteze

În orice situație științifică și practică a unui experiment (sondaj), cercetătorii nu pot studia toți oamenii (populația generală, populația), ci doar un anumit eșantion. De exemplu, chiar dacă examinăm un grup relativ mic de oameni, cum ar fi cei cu o anumită boală, este foarte puțin probabil să avem resursele sau nevoia să testăm fiecare pacient. În schimb, un eșantion din populație este de obicei testat, deoarece este mai convenabil și necesită mai puțin timp. În acest caz, de unde știm că rezultatele obținute din eșantion reprezintă întregul grup? Sau, pentru a folosi terminologia profesională, putem fi siguri că studiul nostru descrie corect întregul populatie, proba din care am folosit?

Pentru a răspunde la această întrebare, este necesar să se determine semnificația statistică a rezultatelor testului. Semnificația statistică (Nivel semnificativ, prescurtat Sig.), sau /7-nivel de semnificație (nivel p) - este probabilitatea ca un rezultat dat să reprezinte corect populația din care a fost studiat eșantionul. Rețineți că aceasta este numai probabilitate- este imposibil de spus cu certitudine absolută că acest studiu descrie corect întreaga populație. În cel mai bun caz, se poate concluziona doar din nivelul de semnificație că acest lucru este foarte probabil. Astfel, se ridică inevitabil următoarea întrebare: care ar trebui să fie nivelul de semnificație pentru a considera acest rezultat drept o caracterizare corectă a populației?

De exemplu, la ce valoare a probabilității ești dispus să spui că astfel de cote sunt suficiente pentru a-ți asuma un risc? Dacă șansele sunt 10 din 100 sau 50 din 100? Dar dacă această probabilitate este mai mare? Dar cote ca 90 din 100, 95 din 100 sau 98 din 100? Pentru o situație asociată cu risc, această alegere este destul de problematică, deoarece depinde de caracteristicile personale ale unei persoane.

În psihologie, se crede în mod tradițional că o șansă de 95 sau mai mult din 100 înseamnă că probabilitatea corectitudinii rezultatelor este suficient de mare pentru a fi generalizată la întreaga populație. Această cifră a fost stabilită în procesul activității științifice și practice - nu există nicio lege conform căreia ar trebui să fie aleasă ca ghid (și într-adevăr, în alte științe, uneori se aleg și alte valori ale nivelului de semnificație).

În psihologie, această probabilitate este tratată într-un mod oarecum neobișnuit. În loc de probabilitatea ca eșantionul să reprezinte o populație, probabilitatea ca eșantionul să fie nu reprezinta populatie. Cu alte cuvinte, este probabilitatea ca relația sau diferențele descoperite să fie aleatorii și nu o proprietate a populației. Astfel, în loc să spună că rezultatele unui studiu sunt corecte în proporție de 95 din 100, psihologii spun că există o șansă de 5 din 100 ca rezultatele să fie greșite (în mod similar, 40 din 100 de șanse în favoarea ca rezultatele să fie corecte înseamnă 60). din 100 de șanse în favoarea greșelii lor). Valoarea probabilității este uneori exprimată ca procent, dar mai des este scrisă ca o fracție zecimală. De exemplu, 10 șanse din 100 sunt reprezentate ca o fracție zecimală de 0,1; 5 din 100 este scris ca 0,05; 1 din 100 - 0,01. Cu această formă de înregistrare, valoarea limită este 0,05. Pentru ca un rezultat să fie considerat corect, nivelul său de semnificație trebuie să fie de mai jos acest număr (rețineți că aceasta este probabilitatea ca rezultatul necorespunzător descrie populația. Pentru a elimina terminologia, adăugăm că „probabilitatea unui rezultat greșit” (care se numește mai corect nivel de semnificație) notată de obicei prin litera latină R. Descrierea rezultatelor experimentului include de obicei o concluzie rezumată, cum ar fi „rezultatele au fost semnificative la nivel de semnificație (R(p) mai puțin de 0,05 (adică mai puțin de 5%).

Astfel, nivelul de semnificație ( R) indică probabilitatea ca rezultatele nu reprezinta populatia. Prin tradiție în psihologie, se crede că rezultatele reflectă în mod fiabil imaginea de ansamblu, dacă valoarea R mai puțin de 0,05 (adică 5%). Cu toate acestea, aceasta este doar o afirmație probabilistică și deloc o garanție necondiționată. În unele cazuri, această concluzie poate fi incorectă. De fapt, putem calcula cât de des se poate întâmpla acest lucru dacă ne uităm la magnitudinea nivelului de semnificație. La un nivel de semnificație de 0,05, în 5 din 100 de cazuri, rezultatele sunt probabil incorecte. 11a la prima vedere pare că acest lucru nu este prea des, dar dacă vă gândiți bine, atunci 5 șanse din 100 sunt la fel cu 1 din 20. Cu alte cuvinte, într-unul din 20 de cazuri rezultatul se va transforma a greșit. Astfel de șanse nu par deosebit de favorabile, iar cercetătorii ar trebui să se ferească de a se comite erori de primul fel. Acesta este numele erorii care apare atunci când cercetătorii cred că au găsit rezultate reale, dar de fapt nu există. Erorile opuse, constând în faptul că cercetătorii cred că nu au găsit un rezultat, dar de fapt există unul, se numesc erori de al doilea fel.

Aceste erori apar deoarece nu poate fi exclusă posibilitatea unei analize statistice incorecte. Probabilitatea de eroare depinde de nivelul de semnificație statistică a rezultatelor. Am observat deja că, pentru ca rezultatul să fie considerat corect, nivelul de semnificație trebuie să fie sub 0,05. Desigur, unele rezultate sunt mai mici și nu este neobișnuit să găsești rezultate de până la 0,001 (o valoare de 0,001 înseamnă că există o șansă de 1 la 1.000 ca rezultatele să fie greșite). Cu cât valoarea p este mai mică, cu atât este mai puternică încrederea noastră în corectitudinea rezultatelor.

În tabel. 7.2 arată interpretarea tradițională a nivelurilor de semnificație cu privire la posibilitatea de inferență statistică și justificarea deciziei privind prezența unei conexiuni (diferențe).

Tabelul 7.2

Interpretarea tradițională a nivelurilor de semnificație utilizate în psihologie

Pe baza experienței cercetării practice, se recomandă ca, pentru a evita erorile de primul și al doilea tip, atunci când se face concluzii responsabile, să se ia decizii cu privire la prezența diferențelor (legăturilor), cu accent pe nivel. R semnul n.

Test statistic(Test statistic - este un instrument pentru determinarea nivelului de semnificaţie statistică. Aceasta este o regulă de decizie care asigură că o ipoteză adevărată este acceptată și una falsă este respinsă cu mare probabilitate.

Criteriile statistice indică și metoda de calcul a unui anumit număr și acest număr în sine. Toate criteriile sunt utilizate cu un singur scop principal: a determina nivelul de semnificație datele pe care le analizează (adică, probabilitatea ca datele să reflecte efectul adevărat care reprezintă corect populația din care a fost extras eșantionul).

Unele criterii pot fi utilizate numai pentru date distribuite normal (și dacă caracteristica este măsurată pe o scară de interval) - aceste criterii sunt de obicei numite parametrice. Cu ajutorul altor criterii, puteți analiza datele cu aproape orice lege de distribuție - se numesc neparametric.

Criterii parametrice - criterii care includ parametrii de distribuție în formula de calcul, i.e. medii și varianțe (testul t al lui Student, testul F al lui Fisher etc.).

Criterii neparametrice - criterii care nu includ parametrii de distribuție în formula de calcul a distribuțiilor și se bazează pe frecvențe de operare sau pe ranguri (criteriu Q Rosenbaum, criteriu U Mana - Whitney

De exemplu, când spunem că semnificația diferențelor a fost determinată de testul t al lui Student, ne referim că metoda testului t al lui Student a fost folosită pentru a calcula valoarea empirică, care este apoi comparată cu valoarea tabelară (critică).

În funcție de raportul dintre valorile empirice (am calculat) și cele critice ale criteriului (tabelului), putem judeca dacă ipoteza noastră este confirmată sau infirmată. În majoritatea cazurilor, pentru a recunoaște diferențele ca fiind semnificative, este necesar ca valoarea empirică a criteriului să o depășească pe cea critică, deși există criterii (de exemplu, testul Mann-Whitney sau testul semnului) în care trebuie să aderăm la regula opusă.

În unele cazuri, formula de calcul a criteriului include numărul de observații din eșantionul de studiu, notat ca P. Folosind un tabel special, determinăm ce nivel de semnificație statistică a diferențelor corespunde unei valori empirice date. În majoritatea cazurilor, aceeași valoare empirică a criteriului se poate dovedi a fi semnificativă sau nesemnificativă, în funcție de numărul de observații din eșantionul de studiu ( P ) sau din așa-numitul numărul de grade de libertate , care este notat ca v (g>) sau ambele df (uneori d).

știind P sau numărul de grade de libertate, putem determina valorile critice ale criteriului folosind tabele speciale (cele principale sunt date în Anexa 5) și putem compara valoarea empirică obținută cu acestea. De obicei este scris astfel: n = 22 de valori critice ale criteriului sunt tSt = 2.07" sau "la v (d) = 2, valorile critice ale criteriului Studentului sunt = 4,30 "și așa-numitele.

De obicei, însă, se acordă preferință criteriilor parametrice, iar noi aderăm la această poziție. Sunt considerate a fi mai fiabile și pot oferi mai multe informații și analize mai profunde. În ceea ce privește complexitatea calculelor matematice, la utilizarea programelor de calculator, această complexitate dispare (dar unele altele apar, totuși, destul de depășite).

  • În acest manual nu ne ocupăm în detaliu problema statisticii
  • ipoteze (zero - R0 și alternativă - Hj) și decizii statistice, întrucât studenții la psihologie studiază acest lucru separat la disciplina „Metode matematice în psihologie”. În plus, trebuie remarcat faptul că la pregătirea unui raport de cercetare (proces sau teză, publicație), de obicei nu sunt date ipoteze statistice și soluții statistice. De obicei, la descrierea rezultatelor, este indicat un criteriu, sunt date statisticile descriptive necesare (medii, sigma, coeficienți de corelație etc.), valori empirice ale criteriilor, grade de libertate și neapărat nivelul de p-semnificație. Apoi se formulează o concluzie semnificativă în raport cu ipoteza testată, indicând (de obicei sub formă de inegalitate) nivelul de semnificație atins sau neatins.

Luați în considerare un exemplu tipic de aplicare a metodelor statistice în medicină. Creatorii medicamentului sugerează că acesta crește diureza proporțional cu doza luată. Pentru a testa această presupunere, ei oferă cinci voluntari doze diferite de medicament.

Conform rezultatelor observațiilor, este reprezentat un grafic al diurezei în funcție de doză (Fig. 1.2A). Dependența este vizibilă cu ochiul liber. Cercetătorii se felicită reciproc pentru descoperire, iar lumea pentru noul diuretic.

De fapt, datele ne permit să afirmăm în mod sigur doar că dependența diurezei de doză a fost observată la acești cinci voluntari. Faptul că această dependență se va manifesta la toți oamenii care vor lua medicamentul nu este altceva decât o presupunere.
WJ

Cu

zhenie. Nu se poate spune că este nefondat - altfel, de ce să experimentezi?

Dar acum medicamentul este pe piață. Din ce în ce mai mulți oameni îl iau în speranța de a-și crește diureza. Și ce vedem? Vedem Fig. 1.2B, care indică absența oricărei relații între doza de medicament și diureză. Cercurile negre reprezintă date din studiul original. Statistica are metode de estimare a probabilității de a obține un astfel de eșantion „nereprezentator”, în plus, confuz. Se dovedește că, în absența unei relații între diureză și doza de medicament, „dependența” rezultată ar fi observată în aproximativ 5 din 1000 de experimente. Deci, în acest caz, cercetătorii au avut doar ghinion. Chiar dacă ar aplica chiar și cele mai perfecte metode statistice, tot nu i-ar salva de eroare.

Acest exemplu fictiv, dar deloc departe de realitate, l-am citat nu pentru a sublinia inutilitatea
statistici. El vorbește despre altceva, despre natura probabilistică a concluziilor ei. Ca urmare a aplicării metodei statistice, nu obținem adevărul final, ci doar o estimare a probabilității unei anumite ipoteze. În plus, fiecare metodă statistică se bazează pe propriul model matematic și rezultatele sale sunt corecte în măsura în care acest model corespunde realității.

Mai multe despre FIABILITATE ȘI IMPORTANȚA STATISTICĂ:

  1. Diferențe semnificative statistic în indicatorii de calitate a vieții
  2. Agregat statistic. Semne de cont. Conceptul de cercetare continuă și selectivă. Cerințe pentru populația statistică și utilizarea documentelor contabile și de raportare
  3. ESEU. STUDIU AL FIABILITĂȚII CITURILOR TONOMETRELOR PENTRU MĂSURAREA PRESIUNII INTRAOCULARE PRIN PRIN PLOOPE2018, 2018

Ce crezi că-ți face „sufletul pereche” special, semnificativ? Are legătură cu personalitatea ei (sa) sau cu sentimentele tale pe care le ai pentru această persoană? Sau poate cu simplul fapt că studiile arată că ipoteza că plăcerea ta este aleatorie are o probabilitate mai mică de 5%? Dacă considerăm că ultima afirmație este de încredere, atunci site-urile de întâlniri de succes nu ar exista în principiu:

Atunci când faceți testări separate sau orice altă analiză a site-ului dvs., o înțelegere greșită a „semnificației statistice” poate duce la interpretarea greșită a rezultatelor și, prin urmare, la pași eronați în procesul de optimizare a conversiilor. Acest lucru este valabil pentru miile de alte teste statistice efectuate zilnic în orice industrie existentă.

Pentru a înțelege ce este „semnificația statistică”, trebuie să vă aprofundați în istoria acestui termen, să cunoașteți adevăratul său sens și să înțelegeți cum această „nouă” înțelegere veche vă va ajuta să interpretați corect rezultatele cercetării dumneavoastră.

Un pic de istorie

Deși omenirea folosește statistica pentru a rezolva probleme de multe secole, înțelegerea modernă a semnificației statistice, testarea ipotezelor, randomizarea și chiar proiectarea experimentelor (Design of Experiments (DOE)) a început să prindă contur abia la începutul secolului al XX-lea. și este indisolubil legat de numele lui Sir Ronald Fisher (Sir Ronald Fisher, 1890-1962):

Ronald Fisher a fost un biolog și statistician evoluționist care a avut o pasiune deosebită pentru studiul evoluției și selecției naturale în regnurile animal și vegetal. De-a lungul ilustrei sale cariere, a dezvoltat și popularizat multe instrumente statistice utile pe care le folosim și astăzi.

Fisher a folosit tehnicile pe care le-a dezvoltat pentru a explica procese din biologie, cum ar fi dominanța, mutația și variația genetică. Putem aplica astăzi aceleași instrumente pentru a optimiza și îmbunătăți conținutul resurselor web. Faptul că aceste instrumente de analiză pot fi folosite pentru a lucra cu obiecte care nici măcar nu existau la momentul creării lor pare destul de surprinzător. Este la fel de surprinzător că oamenii obișnuiau să efectueze cele mai complexe calcule fără calculatoare sau computere.

Pentru a descrie rezultatele unui experiment statistic ca având o mare probabilitate de a fi adevărate, Fisher a folosit cuvântul semnificație.

De asemenea, una dintre cele mai interesante dezvoltări ale lui Fisher este ipoteza „fiului sexual”. Conform acestei teorii, femeile preferă bărbații promiscui (mergătoare), deoarece acest lucru va permite fiilor născuți din acești bărbați să aibă aceeași predispoziție și să producă mai mulți descendenți ai lor (rețineți că aceasta este doar o teorie).

Dar nimeni, chiar și oamenii de știință geniali, nu este imun de a face greșeli. Defectele lui Fisher îi enervează pe specialiști până astăzi. Dar amintiți-vă cuvintele lui Albert Einstein: „Cel care nu a greșit niciodată nu a creat nimic nou”.

Înainte de a trece la următorul punct, amintiți-vă că semnificația statistică este o situație în care diferența dintre rezultatele testării este atât de mare încât această diferență nu poate fi explicată prin influența unor factori aleatori.

Care este ipoteza ta?

Pentru a înțelege ce înseamnă „semnificativ statistic”, trebuie mai întâi să înțelegeți ce este „testarea ipotezei”, deoarece cei doi termeni sunt strâns legați.
O ipoteză este doar o teorie. Odată ce ați dezvoltat o teorie, va trebui să stabiliți o procedură pentru a colecta suficiente dovezi și, de fapt, să colectați aceste dovezi. Există două tipuri de ipoteze.

Mere sau portocale - care este mai bine?

Ipoteza nulă

De regulă, în acest loc mulți se confruntă cu dificultăți. Trebuie să ții cont de faptul că ipoteza nulă nu este ceva ce trebuie dovedit, cum ar fi, de exemplu, să demonstrezi că o anumită modificare pe site va duce la o creștere a conversiei, ci invers. Ipoteza nulă este o teorie care spune că dacă faci vreo modificare a site-ului, nu se va întâmpla nimic. Iar scopul cercetătorului este să infirme această teorie, nu să o demonstreze.

Dacă ne întoarcem la experiența detectării infracțiunii, unde anchetatorii emit și ipoteza cine este făptuitorul, ipoteza nulă ia forma așa-numitei prezumții de nevinovăție, conceptul că învinuitul este prezumat nevinovat până la probarea vinovăției în instanță.

Dacă ipoteza nulă este că două obiecte sunt egale în proprietățile lor și încercați să demonstrați că unul dintre ele este încă mai bun (de exemplu, A este mai bun decât B), trebuie să renunțați la ipoteza nulă în favoarea alternativei. unu. De exemplu, comparați unul sau altul instrument de optimizare a conversiilor unul cu celălalt. În ipoteza nulă, ambele au același efect asupra țintei (sau nu au niciun efect). În alternativă, efectul unuia dintre ele este mai bun.

Ipoteza dvs. alternativă poate conține o valoare numerică, cum ar fi B - A > 20%. În acest caz, ipoteza nulă și alternativa pot lua următoarea formă:

Un alt nume pentru o ipoteză alternativă este o ipoteză de cercetare, deoarece cercetătorul este întotdeauna interesat să demonstreze această ipoteză particulară.

Semnificația statistică și valoarea „p”.

Să ne întoarcem la Ronald Fisher și la conceptul său de semnificație statistică.

Acum că aveți ipoteza nulă și alternativa, cum puteți demonstra una și infirma pe cealaltă?

Deoarece statisticile, prin însăși natura lor, implică studierea unei anumite populații (eșantion), nu poți fi niciodată 100% sigur de rezultatele pe care le obții. Un exemplu clar: rezultatele alegerilor diferă adesea de rezultatele sondajelor preliminare și chiar ale grupurilor de ieșire.

Dr. Fisher a vrut să creeze o linie de demarcație care să vă spună dacă experimentul dvs. a fost un succes sau nu. Așa a apărut indicele de încredere. Fiabilitatea este nivelul pe care îl luăm pentru a spune ceea ce considerăm „semnificativ” și ce nu este. Dacă „p”, indicele de încredere, este de 0,05 sau mai puțin, atunci rezultatele sunt semnificative.

Nu-ți face griji, chiar nu este atât de confuz pe cât pare.

Distribuția de probabilitate gaussiană. La margini - valori mai puțin probabile ale variabilei, în centru - cele mai probabile. Scorul p (zona umbrită în verde) este probabilitatea ca un rezultat observat să apară întâmplător.

O distribuție normală de probabilitate (distribuția Gauss) este o reprezentare a tuturor valorilor posibile ale unei anumite variabile pe un grafic (în figura de mai sus) și a frecvențelor acestora. Dacă îți faci cercetarea corect și apoi trasezi toate răspunsurile pe care le primești pe un grafic, vei obține exact acea distribuție. Conform distribuției normale, veți obține un procent mare de răspunsuri similare, iar opțiunile rămase vor fi situate la marginile graficului (așa-numitele „cozi”). O astfel de distribuție a cantităților se găsește adesea în natură, motiv pentru care este numită „normală”.

Folosind o ecuație bazată pe eșantionul și rezultatele testelor, puteți calcula ceea ce se numește „statistică de testare” care vă spune cât de mult au deviat rezultatele. De asemenea, vă va spune cât de aproape sunteți ca ipoteza nulă să fie adevărată.

Pentru a vă menține capul în jos, utilizați calculatoare online pentru a calcula semnificația statistică:

Un exemplu de astfel de calculatoare

Litera „p” reprezintă probabilitatea ca ipoteza nulă să fie adevărată. Dacă numărul este mic, aceasta ar indica o diferență între grupurile de testare, în timp ce ipoteza nulă ar fi că acestea sunt aceleași. Grafic, aceasta va arăta ca și cum statistica dvs. de testare este mai aproape de una dintre cozile distribuției dvs. de clopot.

Dr. Fischer a decis să stabilească pragul de încredere pentru rezultate la p ≤ 0,05. Cu toate acestea, această afirmație este, de asemenea, controversată, deoarece duce la două dificultăți:

1. În primul rând, faptul că ați dovedit greșită ipoteza nulă nu înseamnă că ați demonstrat ipoteza alternativă. Toată această semnificație înseamnă doar că nu poți dovedi nici A, nici B.

2. În al doilea rând, dacă valoarea p este egală cu 0,049, aceasta va însemna că probabilitatea ipotezei nule va fi de 4,9%. Acest lucru poate însemna că, în același timp, rezultatele testelor dvs. pot fi atât valide, cât și false în același timp.

Puteți utiliza sau nu valoarea p, dar apoi va trebui să calculați probabilitatea ipotezei nule în fiecare caz individual și să decideți dacă este suficient de mare pentru a nu face modificările pe care le-ați planificat și testat.

Cel mai obișnuit scenariu pentru efectuarea unui test statistic astăzi este stabilirea unui prag de semnificație de p ≤ 0,05 înainte de a rula testul propriu-zis. Nu uitați să examinați cu atenție valoarea p atunci când verificați rezultatele.

Erori 1 și 2

A trecut atât de mult timp încât erorile care pot apărea la utilizarea unei măsuri de semnificație statistică și-au primit chiar propriile nume.

Eroare 1 (Erori de tip 1)

După cum sa menționat mai sus, o valoare p de 0,05 înseamnă că există o șansă de 5% ca ipoteza nulă să fie adevărată. Dacă nu o faci, faci greșeala numărul 1. Rezultatele spun că noul tău site web a crescut ratele de conversie, dar există o șansă de 5% să nu fie.

Eroare 2 (Erori de tip 2)

Această eroare este opusul erorii 1: acceptați ipoteza nulă atunci când este falsă. De exemplu, rezultatele testelor vă spun că modificările aduse site-ului nu au adus nicio îmbunătățire, în timp ce modificările au fost. Ca rezultat: ratați ocazia de a vă crește performanța.

Această eroare este frecventă în testele cu dimensiuni insuficiente ale eșantionului, așa că rețineți că, cu cât eșantionul este mai mare, cu atât rezultatul este mai fiabil.

Concluzie

Poate că niciun termen printre cercetători nu este la fel de popular ca semnificația statistică. Atunci când rezultatele testelor nu sunt considerate semnificative din punct de vedere statistic, consecințele variază de la o creștere a ratelor de conversie până la prăbușirea companiei.

Și din moment ce specialiștii în marketing folosesc acest termen atunci când își optimizează resursele, trebuie să știi ce înseamnă cu adevărat. Condițiile de testare se pot schimba, dar dimensiunea eșantionului și criteriile de succes sunt întotdeauna importante. Tine minte asta.

Înainte de a colecta și de a studia datele, psihologii experimentali decid de obicei cum vor fi analizate datele statistic. Adesea, cercetătorul stabilește nivelul de semnificație, definit ca statistică, mai mare ( sau mai jos) care conține valori care ne permit să considerăm influența factorilor ca nealeatorie. Cercetătorii prezintă de obicei acest nivel sub forma unei expresii probabilistice.

În multe experimente psihologice, poate fi exprimat ca „ nivelul 0,05" sau " nivelul 0,01". Aceasta înseamnă că rezultatele aleatorii vor apărea doar cu o frecvență 0,05 (1 din timpul) sau 0,01 (1 din 100 de ori). Rezultatele analizei statistice a datelor care îndeplinesc un criteriu predeterminat ( fie 0,05, 0,01 sau chiar 0,001), sunt denumite mai jos ca fiind semnificative statistic.

Trebuie remarcat faptul că rezultatul poate să nu fie semnificativ statistic, dar să fie totuși de un anumit interes. Adesea, mai ales în timpul studiilor preliminare sau experimentelor cu un număr mic de subiecți sau cu un număr limitat de observații, rezultatele pot să nu atingă nivelul de semnificație statistică, dar sugerează că în studiile ulterioare cu controale mai precise și cu mai multe observații, acestea vor devin mai de încredere... În același timp, experimentatorul trebuie să fie foarte atent în dorința sa de a schimba intenționat condițiile experimentului pentru a obține rezultatul dorit cu orice preț.

Într-un alt exemplu de plan 2x2 Ji a folosit două tipuri de subiecte și două tipuri de sarcini pentru a studia efectul cunoștințelor speciale asupra memorării informațiilor.

În studiul meu Ji a studiat memorarea numerelor și a pieselor de șah ( variabila A) copii pe fotolii RECARO Young Sport si adulti ( variabila B), adică conform planului 2x2. Copiii aveau 10 ani și se pricepeau la șah, în timp ce adulții erau noi în joc. Prima sarcină a fost să memorezi poziția pieselor pe tablă așa cum ar fi în timpul jocului normal și să o restabilim după ce piesele au fost îndepărtate. O altă parte a acestei sarcini a fost memorarea unei serii standard de numere, așa cum se face de obicei atunci când se determină IQ.

Se dovedește că cunoștințele speciale, cum ar fi capacitatea de a juca șah, facilitează reținerea informațiilor legate de acest domeniu, dar nu au un efect mare asupra memorării numerelor. Adulții, nu prea experimentați în înțelepciunea jocului antic, memorează mai puține cifre, dar în memorarea numerelor au mai mult succes.

În corpul raportului Ji dă analiză statistică, confirmând matematic rezultatele prezentate.

Designul 2x2 este cel mai simplu dintre toate modelele factoriale. Creșterea numărului de factori sau a nivelurilor de factori individuali complică foarte mult aceste planuri.