Ceea ce caracterizează dispersia intragrup. Așteptările matematice și varianța unei variabile aleatoare

Dacă populația este împărțită în grupuri în funcție de trăsătura studiată, atunci pentru această populație se pot calcula următoarele tipuri de dispersie: total, grup (intragrup), media grupului (media intragrup), intergrup.

Inițial, calculează coeficientul de determinare, care arată ce parte din variația totală a trăsăturii studiate este variația intergrup, i.e. datorita gruparii:

Raportul de corelație empirică caracterizează strânsoarea legăturii dintre semnele de grupare (factoriale) și efective.

Raportul de corelație empirică poate lua valori de la 0 la 1.

Pentru a evalua apropierea relației pe baza raportului de corelație empirică, puteți utiliza relațiile Chaddock:

Exemplul 4 Există următoarele date despre performanța muncii de către organizațiile de proiectare și sondaj de diferite forme de proprietate:

Defini:

1) varianța totală;

2) dispersii de grup;

3) media dispersiilor de grup;

4) dispersie intergrup;

5) variația totală pe baza regulii de adunare a variațiilor;


6) coeficient de determinare și corelație empirică.

Trageți propriile concluzii.

Soluţie:

1. Să determinăm volumul mediu de muncă prestat de întreprinderile cu două forme de proprietate:

Calculați varianța totală:

2. Definiți mediile de grup:

milioane de ruble;

mln rub.

Variante de grup:

;

3. Calculați media variațiilor grupului:

4. Determinați varianța intergrup:

5. Calculați variația totală pe baza regulii de adăugare a variațiilor:

6. Determinați coeficientul de determinare:

.

Astfel, cantitatea de muncă efectuată de organizațiile de proiectare și sondaj cu 22% depinde de forma de proprietate a întreprinderilor.

Raportul de corelație empirică se calculează prin formula

.

Valoarea indicatorului calculat indică faptul că dependența cantității de muncă de forma de proprietate a întreprinderii este mică.

Exemplul 5În urma unui sondaj asupra disciplinei tehnologice a site-urilor de producție, s-au obținut următoarele date:

Determinați coeficientul de determinare

Principalii indicatori generalizatori ai variației statisticilor sunt dispersia și abaterea standard.

Dispersia ea medie aritmetică abaterile pătrate ale fiecărei valori caracteristice de la media totală. Varianta se numește de obicei pătratul mediu al abaterilor și se notează  2 . În funcție de datele inițiale, varianța poate fi calculată din media aritmetică, simplă sau ponderată:

 dispersie neponderată (simple);

 varianţa ponderată.

Deviație standard este o caracteristică generalizantă a dimensiunilor absolute variatii trăsătură în agregat. Se exprimă în aceleași unități ca și semnul (în metri, tone, procente, hectare etc.).

Abaterea standard este rădăcina pătrată a varianței și se notează cu :

 abaterea standard neponderată;

 abaterea standard ponderată.

Abaterea standard este o măsură a fiabilității mediei. Cu cât abaterea standard este mai mică, cu atât media aritmetică reflectă mai bine întreaga populație reprezentată.

Calculul abaterii standard este precedat de calculul varianței.

Procedura de calcul a variației ponderate este următoarea:

1) determinați media ponderată aritmetică:

2) calculați abaterile opțiunilor de la medie:

3) la pătrat abaterea fiecărei opțiuni de la medie:

4) înmulțiți abaterile pătrate cu greutăți (frecvențe):

5) rezumați lucrările primite:

6) suma rezultată se împarte la suma greutăților:

Exemplul 2.1

Calculați media ponderată aritmetică:

Valorile abaterilor de la medie și pătratele lor sunt prezentate în tabel. Să definim varianța:

Abaterea standard va fi egală cu:

Dacă datele sursă sunt prezentate ca un interval seria de distribuție , apoi trebuie mai întâi să determinați valoarea discretă a caracteristicii și apoi să aplicați metoda descrisă.

Exemplul 2.2

Să arătăm calculul varianței pentru seria de intervale pe datele privind distribuția suprafeței însămânțate a fermei colective în funcție de producția de grâu.

Media aritmetica este:

Să calculăm varianța:

6.3. Calculul dispersiei conform formulei pentru datele individuale

Tehnica de calcul dispersie complex, iar pentru valori mari de opțiuni și frecvențe pot fi greoaie. Calculele pot fi simplificate folosind proprietățile de dispersie.

Dispersia are următoarele proprietăți.

1. O scădere sau creștere a ponderilor (frecvențelor) unei caracteristici variabile de un anumit număr de ori nu modifică dispersia.

2. Scăderea sau creșterea valorii fiecărei caracteristici cu aceeași valoare constantă DAR dispersia nu se modifică.

3. Scăderea sau creșterea valorii fiecărei caracteristici de un anumit număr de ori k respectiv reduce sau mărește varianța în k de 2 ori deviație standard  în k o singura data.

4. Varianța unei caracteristici în raport cu o valoare arbitrară este întotdeauna mai mare decât varianța relativă la media aritmetică prin pătratul diferenței dintre valorile medii și arbitrare:

În cazul în care un DAR 0, atunci ajungem la următoarea egalitate:

adică, varianța unei caracteristici este egală cu diferența dintre pătratul mediu al valorilor caracteristicii și pătratul mediei.

Fiecare proprietate poate fi utilizată singură sau în combinație cu altele atunci când se calculează varianța.

Procedura de calcul a varianței este simplă:

1) determina medie aritmetică :

2) la pătrat media aritmetică:

3) la pătrat abaterea fiecărei variante a seriei:

X i 2 .

4) găsiți suma pătratelor opțiunilor:

5) împărțiți suma pătratelor opțiunilor la numărul lor, adică determinați pătratul mediu:

6) determinați diferența dintre pătratul mediu al caracteristicii și pătratul mediei:

Exemplul 3.1 Avem următoarele date despre productivitatea lucrătorilor:

Să facem următoarele calcule:

Dispersia unei variabile aleatoare este o măsură a răspândirii valorilor acestei variabile. Varianta mică înseamnă că valorile sunt grupate aproape una de alta. O variație mare indică o împrăștiere puternică a valorilor. Conceptul de dispersie a unei variabile aleatoare este folosit în statistică. De exemplu, dacă comparați varianța valorilor a două cantități (cum ar fi rezultatele observațiilor pacienților de sex masculin și feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată atunci când construiești modele statistice, deoarece variația mică poate fi un semn că depășești valorile.

Pași

Calcularea variației eșantionului

  1. Înregistrați valorile eșantionului.În cele mai multe cazuri, doar eșantioane din anumite populații sunt disponibile pentru statisticieni. De exemplu, de regulă, statisticienii nu analizează costul menținerii populației tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu pe mașină, dar cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea în 6 zile, luate în ordine aleatorie. Eșantionul are următoarea formă: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație și nu un eșantion de valori, treceți la secțiunea următoare.
  2. Notați formula pentru calcularea varianței eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea dispersiei este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) este dispersia. Dispersia se măsoară în unități pătrate.
    • x i (\displaystyle x_(i))- fiecare valoare din eșantion.
    • x i (\displaystyle x_(i)) trebuie să scădeți x̅, să-l pătrați și apoi să adăugați rezultatele.
    • x̅ – medie eșantion (medie eșantion).
    • n este numărul de valori din eșantion.
  3. Calculați media eșantionului. Este notat cu x̅. Media eșantionului este calculată ca o medie aritmetică normală: se adună toate valorile din eșantion și apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, dispersia este mare.
  4. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))- fiecare valoare din eșantion. Fiecare rezultat obținut indică măsura în care o anumită valoare se abate de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    • În exemplul nostru:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Corectitudinea rezultatelor obținute este ușor de verificat, deoarece suma lor trebuie să fie egală cu zero. Acest lucru este legat de determinarea valorii medii, deoarece valorile negative (distanțele de la valoarea medie la valori mai mici) sunt complet compensate de valori pozitive (distanțele de la valoarea medie la valori mai mari).
  5. După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Aceasta înseamnă că varianța medie este întotdeauna zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va duce la obținerea de numere pozitive care, atunci când sunt adunate, nu vor aduna niciodată până la 0.

    • În exemplul nostru:
      (x 1 (\displaystyle x_(1))-X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Ați găsit pătratul diferenței - x̅) 2 (\displaystyle ^(2)) pentru fiecare valoare din eșantion.
  6. Calculați suma diferențelor pătrate. Adică, găsiți partea formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))-X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice eșantion este doar o mică parte din populația generală de valori. Dacă luați un eșantion diferit și faceți aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai bună a varianței populației, care este ceea ce căutați. Împărțirea la n - 1 a devenit obișnuită, deci este inclusă în formula de calcul a varianței eșantionului.

    • În exemplul nostru, eșantionul include 6 valori, adică n = 6.
      Varianta eșantionului = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, deci varianța este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de valoare este destul de dificil de utilizat; în astfel de cazuri, se utilizează abaterea standard, care este egală cu rădăcina pătrată a varianței. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), iar abaterea standard a eșantionului ca s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calculul variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiați vârsta rezidenților din regiunea Leningrad, atunci populația include vârsta tuturor locuitorilor acestei regiuni. În cazul lucrului cu un agregat, se recomandă să creați un tabel și să introduceți valorile agregatului în acesta. Luați în considerare următorul exemplu:

      • Există 6 acvarii într-o anumită cameră. Fiecare acvariu conține următorul număr de pești:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Notați formula de calcul a varianței populației. Deoarece populația include toate valorile unei anumite cantități, următoarea formulă vă permite să obțineți valoarea exactă a varianței populației. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- varianța populației (a se citi „sigma pătrat”). Dispersia se măsoară în unități pătrate.
      • x i (\displaystyle x_(i))- fiecare valoare în agregat.
      • Σ este semnul sumei. Adică pentru fiecare valoare x i (\displaystyle x_(i)) scădeți μ, pătrați și apoi adăugați rezultatele.
      • μ este media populației.
      • n este numărul de valori din populația generală.
    3. Calculați media populației. Când se lucrează cu populația generală, valoarea medie a acesteia este notată ca μ (mu). Media populației este calculată ca medie aritmetică obișnuită: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      • Rețineți că mediile nu sunt întotdeauna calculate ca medie aritmetică.
      • În exemplul nostru, media populației: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Scădeți media populației din fiecare valoare din populație. Cu cât valoarea diferenței este mai aproape de zero, cu atât valoarea particulară este mai aproape de media populației. Găsiți diferența dintre fiecare valoare din populație și media acesteia și veți avea o primă privire asupra distribuției valorilor.

      • În exemplul nostru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Pătrați fiecare rezultat pe care îl obțineți. Valorile diferențelor vor fi atât pozitive, cât și negative; dacă puneți aceste valori pe o linie numerică, atunci ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este bun pentru calcularea varianței, deoarece numerele pozitive și negative se anulează reciproc. Prin urmare, pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      • În exemplul nostru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pentru fiecare valoare a populației (de la i = 1 la i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n)) este ultima valoare din populație.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

Soluţie.

Ca măsură a dispersiei valorilor unei variabile aleatoare, folosim dispersie

Dispersia (cuvântul dispersie înseamnă „împrăștiere”) este măsura dispersiei valorilor unei variabile aleatoare despre așteptările sale matematice. Dispersia este așteptarea matematică a abaterii pătrate a unei variabile aleatoare de la așteptarea ei matematică

Dacă variabila aleatoare este discretă cu un set infinit, dar numărabil de valori, atunci

dacă seria din partea dreaptă a egalității converge.

Proprietăți de dispersie.

  • 1. Dispersia unei valori constante este zero
  • 2. Varianta sumei variabilelor aleatoare este egala cu suma variatiilor
  • 3. Un factor constant poate fi scos din semnul varianței la pătrat

Varianta diferenței variabilelor aleatoare este egală cu suma varianțelor

Această proprietate este o consecință a celei de-a doua și a treia proprietăți. Varianțele pot doar să se adună.

Varianta este calculată în mod convenabil printr-o formulă care este ușor de obținut folosind proprietățile varianței

Dispersia este întotdeauna pozitivă.

Dispersia are dimensiune pătratul dimensiunii variabilei aleatoare în sine, ceea ce nu este întotdeauna convenabil. Prin urmare, cantitatea

Deviație standard(deviația standard sau standard) a unei variabile aleatoare se numește valoarea aritmetică a rădăcinii pătrate a varianței sale

Aruncă două monede în valori de 2 și 5 ruble. Dacă moneda cade cu stema, atunci se acordă zero puncte, iar dacă este un număr, atunci numărul de puncte este egal cu valoarea monedei. Aflați așteptările matematice și varianța numărului de puncte.

Soluţie. Să găsim mai întâi distribuția variabilei aleatoare X - numărul de puncte. Toate combinațiile - (2; 5), (2; 0), (0; 5), (0; 0) - sunt la fel de probabile și legea distribuției:

Valorea estimata:

Găsim dispersia prin formula

de ce calculăm

Exemplul 2

Găsiți probabilitatea necunoscută R, așteptarea matematică și varianța unei variabile aleatoare discrete date de un tabel de distribuție a probabilității

Găsim așteptarea și varianța matematică:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Pentru a calcula dispersia, folosim formula (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Exemplul 3 Doi sportivi egali susțin un turneu care durează fie până la prima victorie a unuia dintre ei, fie până când s-au jucat cinci jocuri. Probabilitatea de a câștiga într-un singur joc pentru fiecare dintre sportivi este de 0,3, iar probabilitatea de egalitate este de 0,4. Găsiți legea distribuției, așteptările matematice și varianța numărului de jocuri jucate.

Soluţie. Valoare aleatoare X- numărul de jocuri jucate, ia valori de la 1 la 5, adică

Să stabilim probabilitățile de finalul meciului. Meciul se va încheia în primul set dacă unul dintre sportivi a câștigat. Probabilitatea de a câștiga este

R(1) = 0,3+0,3 =0,6.

Dacă a existat o remiză (probabilitatea unei remi este 1 - 0,6 = 0,4), atunci meciul continuă. Meciul se va încheia în al doilea joc, dacă primul a fost egal și cineva a câștigat al doilea. Probabilitate

R(2) = 0,4 0,6=0,24.

În mod similar, meciul se va încheia în al treilea joc dacă au fost două egaluri la rând și din nou cineva a câștigat

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

A cincea parte în orice variantă este ultima.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Să rezumăm totul într-un tabel. Legea distribuției variabilei aleatoare „număr de jocuri câștigate” are forma

Valorea estimata

Dispersia se calculează prin formula (19.4)

Distribuții discrete standard.

Distribuție binomială. Să fie implementată schema experimentului Bernoulli: n experimente independente identice, în fiecare dintre ele un eveniment A poate apărea cu probabilitate constantă pși nu va apărea cu o probabilitate

(vezi prelegerea 18).

Numărul de apariții ale evenimentului Aîn aceste n experimente există o variabilă aleatoare discretă X, ale căror posibile valori sunt:

0; 1; 2; ... ;m; ... ; n.

Probabilitatea de apariție m evenimentele A dintr-o serie anume din n experimentele cu și legea distribuției unei astfel de variabile aleatoare este dată de formula Bernoulli (vezi prelegerea 18)

Caracteristicile numerice ale unei variabile aleatorii X distribuite conform legii binomiale:

În cazul în care un n este mare (), apoi, la, formula (19.6) intră în formulă

și funcția Gaussiană tabelată (tabelul de valori al funcției Gauss este dat la sfârșitul cursului 18).

În practică, adesea nu probabilitatea în sine este importantă. m evenimente Aîntr-o anumită serie n experiențe și probabilitatea ca evenimentul DAR va apărea cel puțin

ori și nu mai multe ori, adică probabilitatea ca X să ia valorile

Pentru a face acest lucru, trebuie să însumăm probabilitățile

În cazul în care un n este mare (), apoi, la, formula (19.9) trece în formula aproximativă

funcţie tabelată. Tabelele sunt date la sfârșitul Lecției 18.

Când utilizați tabele, rețineți că

Exemplul 1. Mașina, apropiindu-se de intersecție, poate continua să se deplaseze pe oricare dintre cele trei drumuri: A, B sau C cu aceeași probabilitate. Cinci mașini se apropie de intersecție. Aflați numărul mediu de mașini care vor merge pe drumul A și probabilitatea ca trei mașini să meargă pe drumul B.

Soluţie. Numărul de mașini care trec pe fiecare dintre drumuri este o variabilă aleatorie. Dacă presupunem că toate mașinile care se apropie de intersecție fac o călătorie independent unele de altele, atunci această variabilă aleatorie este distribuită conform legii binomiale cu

n= 5 și p = .

Prin urmare, numărul mediu de mașini care vor urma drumul A este conform formulei (19,7)

iar probabilitatea dorită la

Exemplul 2 Probabilitatea de defectare a dispozitivului în fiecare test este de 0,1. Se fac 60 de teste ale aparatului. Care este probabilitatea ca aparatul să se defecteze: a) de 15 ori; b) de cel mult 15 ori?

A. Deoarece numărul de teste este 60, folosim formula (19.8)

Conform tabelului 1 din anexa la cursul 18, găsim

b. Folosim formula (19.10).

Conform tabelului 2 din anexa la cursul 18

  • - 0,495
  • 0,49995

distribuția Poisson) legea fenomenelor rare).În cazul în care un n grozav, și R mic (), în timp ce produsul etc păstrează o valoare constantă, pe care o notăm cu l,

apoi formula (19.6) trece în formula Poisson

Legea distribuției Poisson are forma:

În mod evident, definiția legii lui Poisson este corectă, deoarece principala proprietate a seriei de distribuţie

îndeplinită, pentru că suma rândurilor

Extinderea într-o serie de funcții este scrisă între paranteze pt

Teorema. Așteptările matematice și varianța unei variabile aleatoare distribuite conform legii Poisson coincid și sunt egale cu parametrul acestei legi, i.e.

Dovada.

Exemplu. Pentru a-și promova produsele pe piață, compania pune pliante în cutiile poștale. Experiența anterioară arată că în aproximativ un caz din 2.000 urmează o comandă. Găsiți probabilitatea ca cel puțin o comandă să fie primită după plasarea a 10.000 de fluturași, numărul mediu de comenzi primite și variația numărului de comenzi primite.

Soluţie. Aici

Probabilitatea ca cel puțin un ordin să sosească, o găsim prin probabilitatea evenimentului opus, i.e.

Flux aleatoriu de evenimente. Un flux de evenimente este o secvență de evenimente care au loc în momente aleatorii. Exemple tipice de fluxuri sunt defecțiunile în rețelele de calculatoare, apelurile la centralele telefonice, un flux de cereri pentru reparații de echipamente etc.

curgere evenimente se numește staționar, dacă probabilitatea de a atinge unul sau altul număr de evenimente pe un interval de timp de lungime depinde numai de lungimea intervalului și nu depinde de locația intervalului de timp pe axa timpului.

Condiția de staționaritate este satisfăcută de fluxul de aplicații, ale căror caracteristici probabilistice nu depind de timp. În special, un flux staționar este caracterizat de o densitate constantă (număr mediu de cereri pe unitatea de timp). În practică, există adesea fluxuri de aplicații care (cel puțin pentru o perioadă limitată de timp) pot fi considerate staționare. De exemplu, fluxul de apeluri la o centrală telefonică din oraș în intervalul de timp de la 12 la 13 ore poate fi considerat staționar. Același flux pe parcursul întregii zile nu mai poate fi considerat staționar (noaptea densitatea apelurilor este mult mai mică decât în ​​timpul zilei).

curgere evenimentele se numesc flux fara efect, dacă pentru orice segmente de timp care nu se suprapun numărul de evenimente care se încadrează pe unul dintre ele nu depinde de numărul de evenimente care se încadrează pe celelalte.

Condiția fără efecte secundare, care este cea mai esențială pentru cel mai simplu flux, înseamnă că revendicările intră în sistem independent una de cealaltă. De exemplu, fluxul de pasageri care intră în stația de metrou poate fi considerat un flux fără efecte secundare, deoarece motivele care au determinat sosirea unui pasager individual în acel moment și nu altul, de regulă, nu sunt legate de motive similare pentru alte pasagerii. Cu toate acestea, condiția absenței unui efect secundar poate fi ușor încălcată din cauza apariției unei astfel de dependențe. De exemplu, fluxul de pasageri care părăsesc o stație de metrou nu mai poate fi considerat un flux fără efecte secundare, deoarece timpii de ieșire a pasagerilor care sosesc cu același tren depind unul de celălalt.

curgere evenimente se numește comun, dacă probabilitatea de a lovi două sau mai multe evenimente într-un interval de timp mic t este neglijabilă în comparație cu probabilitatea de a lovi un eveniment (în acest sens, legea lui Poisson se numește legea evenimentelor rare).

Condiția de ordinaritate înseamnă că aplicațiile vin pe rând, și nu în perechi, tripleți etc. abaterea varianței distribuția Bernoulli

De exemplu, fluxul de clienți care intră într-un salon de coafură poate fi considerat aproape obișnuit. Dacă într-un flux extraordinar aplicațiile vin doar în perechi, doar în tripleți etc., atunci debitul extraordinar poate fi ușor redus la unul obișnuit; pentru aceasta este suficient să luăm în considerare fluxul de perechi, triple etc., în loc de un flux de aplicații individuale.Va fi mai dificil dacă fiecare aplicație se poate dovedi aleatoriu a fi dublă, triplă etc. Atunci trebuie deja se confruntă cu un flux de evenimente nu omogene, ci eterogene.

Dacă fluxul de evenimente are toate cele trei proprietăți (adică este staționar, obișnuit și nu are efect secundar), atunci se numește cel mai simplu flux (sau staționar Poisson). Denumirea „Poisson” se datorează faptului că, în condițiile de mai sus, numărul de evenimente care se încadrează pe orice interval de timp fix va fi distribuit pe legea lui Poisson

Iată numărul mediu de evenimente A care apar pe unitatea de timp.

Această lege este uniparametrică, adică necesită un singur parametru pentru a fi cunoscut. Se poate demonstra că așteptările matematice și varianța din legea lui Poisson sunt numeric egale:

Exemplu. Lăsați la mijlocul zilei de lucru, numărul mediu de solicitări este de 2 pe secundă. Care este probabilitatea ca 1) să nu fie primite cereri într-o secundă, 2) 10 cereri să fie primite în două secunde?

Soluţie. Deoarece validitatea aplicării legii lui Poisson este dincolo de orice îndoială și parametrul acestuia este setat (= 2), soluția problemei se reduce la aplicarea formulei Poisson (19.11)

1) t = 1, m = 0:

2) t = 2, m = 10:

Legea numerelor mari. Baza matematică pentru faptul că valorile unei variabile aleatoare sunt grupate în jurul unor valori constante este legea numerelor mari.

Din punct de vedere istoric, prima formulare a legii numerelor mari a fost teorema lui Bernoulli:

„Cu o creștere nelimitată a numărului de experimente identice și independente n, frecvența de apariție a evenimentului A converge în probabilitate cu probabilitatea sa”, i.e.

unde este frecvența de apariție a evenimentului A în n experimente,

În ceea ce privește semnificația, expresia (19.10) înseamnă că, cu un număr mare de experimente, frecvența de apariție a unui eveniment A poate înlocui probabilitatea necunoscută a acestui eveniment și, cu cât numărul de experimente este mai mare, cu atât p* este mai aproape de p. Un fapt istoric interesant. K. Pearson a aruncat o monedă de 12000 de ori și stema lui a căzut de 6019 ori (frecvență 0,5016). Când a aruncat aceeași monedă de 24.000 de ori, a primit 12.012 picături de stemă, adică. frecventa 0,5005.

Cea mai importantă formă a legii numerelor mari este teorema lui Cebyshev: cu o creștere nelimitată a numărului de independenți, având o varianță finită și efectuate în aceleași condiții de experimente, media aritmetică a valorilor observate ale unei variabile aleatoare converge în probabilitate cu așteptarea sa matematică. În formă analitică, această teoremă poate fi scrisă după cum urmează:

Teorema lui Cebyshev, pe lângă semnificația sa teoretică fundamentală, are și o aplicație practică importantă, de exemplu, în teoria măsurătorilor. După n măsurători ale unei cantităţi X, obțineți diferite valori nepotrivite X 1, X 2, ..., xn. Pentru valoarea aproximativă a valorii măsurate X luați media aritmetică a valorilor observate

în care, cu cât sunt efectuate mai multe experimente, cu atât rezultatul va fi mai precis. Cert este că varianța valorii scade odată cu creșterea numărului de experimente efectuate, deoarece

D(X 1) = D(X 2)=…= D(xn) D(X) , apoi

Relația (19.13) arată că chiar și cu o inexactitate mare a instrumentelor de măsură (valoare mare), prin creșterea numărului de măsurători, este posibil să se obțină un rezultat cu o precizie arbitrar de mare.

Folosind formula (19.10), se poate găsi probabilitatea ca frecvența statistică să se abate de la probabilitate cu cel mult

Exemplu. Probabilitatea unui eveniment în fiecare încercare este de 0,4. Câte teste ar trebui efectuate pentru a ne aștepta, cu o probabilitate nu mai mică de 0,8, ca frecvența relativă a unui eveniment să devieze de la probabilitatea modulo mai mică de 0,01?

Soluţie. Prin formula (19.14)

prin urmare, conform tabelului, există două aplicații

Prin urmare, n 3932.

Să calculăm înDOMNIȘOARĂEXCELAvarianţa şi abaterea standard a probei. De asemenea, calculăm varianța unei variabile aleatoare dacă distribuția ei este cunoscută.

Mai întâi luați în considerare dispersie, apoi deviație standard.

Varianta eșantionului

Varianta eșantionului (varianța eșantionului,probăvarianţă) caracterizează răspândirea valorilor în matrice relativ la .

Toate cele 3 formule sunt echivalente din punct de vedere matematic.

Din prima formulă se vede că varianța eșantionului este suma abaterilor pătrate ale fiecărei valori din matrice de la medieîmpărțit la dimensiunea eșantionului minus 1.

dispersie mostre se folosește funcția DISP(), ing. numele VAR, adică VARIANCE. De la MS EXCEL 2010, se recomandă utilizarea analogului său DISP.V() , ing. numele VARS, adică Varianta eșantionului. In plus, incepand de la versiunea MS EXCEL 2010, exista o functie DISP.G (), ing. Numele VARP, adică VARIANCE populației care calculează dispersie pentru populatie. Întreaga diferență se reduce la numitor: în loc de n-1 ca DISP.V() , DISP.G() are doar n în numitor. Înainte de MS EXCEL 2010, funcția VARP() a fost utilizată pentru a calcula varianța populației.

Varianta eșantionului
=PĂTRAT(Eșantion)/(NUMĂR (Eșantion)-1)
=(SUMSQ(Eșantion)-COUNT(Eșantion)*MEDIE(Eșantion)^2)/ (NUMĂR (Eșantion)-1)- formula uzuală
=SUMA((Eșantion -MEDIE(Eșantion))^2)/ (NUMĂR (Eșantion)-1) –

Varianta eșantionului este egal cu 0 numai dacă toate valorile sunt egale între ele și, în consecință, sunt egale Valoarea medie. De obicei, cu cât valoarea este mai mare dispersie, cu atât este mai mare răspândirea valorilor în matrice.

Varianta eșantionului este o estimare punctuala dispersie distribuția variabilei aleatoare din care probă. Despre clădire intervale de încredere la evaluare dispersie poate fi citit in articol.

Varianta unei variabile aleatoare

A calcula dispersie variabilă aleatoare, trebuie să o știți.

Pentru dispersie variabila aleatoare X folosește adesea notația Var(X). Dispersia este egal cu pătratul abaterii de la medie E(X): Var(X)=E[(X-E(X)) 2 ]

dispersie calculat prin formula:

unde x i este valoarea pe care o poate lua variabila aleatoare și μ este valoarea medie (), p(x) este probabilitatea ca variabila aleatoare să ia valoarea x.

Dacă variabila aleatoare are , atunci dispersie calculat prin formula:

Dimensiune dispersie corespunde pătratului unității de măsură a valorilor inițiale. De exemplu, dacă valorile din eșantion sunt măsurători ale greutății piesei (în kg), atunci dimensiunea varianței ar fi kg 2 . Acest lucru poate fi dificil de interpretat, prin urmare, pentru a caracteriza răspândirea valorilor, o valoare egală cu rădăcina pătrată a dispersiedeviație standard.

Unele proprietăți dispersie:

Var(X+a)=Var(X), unde X este o variabilă aleatoare și a este o constantă.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Această proprietate de dispersie este utilizată în articol despre regresia liniară.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), unde X și Y sunt variabile aleatoare, Cov(X;Y) este covarianța acestor variabile aleatoare.

Dacă variabilele aleatoare sunt independente, atunci acestea covarianta este 0 și, prin urmare, Var(X+Y)=Var(X)+Var(Y). Această proprietate a varianței este utilizată în rezultat.

Să arătăm că pentru mărimi independente Var(X-Y)=Var(X+Y). Într-adevăr, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Această proprietate a varianței este utilizată pentru a reprezenta grafic.

Deviația standard a eșantionului

Deviația standard a eșantionului este o măsură a cât de larg sunt împrăștiate valorile din eșantion în raport cu .

Prin definitie, deviație standard este egal cu rădăcina pătrată a dispersie:

Deviație standard nu ține cont de mărimea valorilor în prelevarea de probe, ci doar gradul de împrăștiere a valorilor în jurul lor mijloc. Să luăm un exemplu pentru a ilustra acest lucru.

Să calculăm abaterea standard pentru 2 eșantioane: (1; 5; 9) și (1001; 1005; 1009). În ambele cazuri, s=4. Este evident că raportul dintre abaterea standard și valorile matricei este semnificativ diferit pentru eșantioane. Pentru astfel de cazuri, utilizați Coeficientul de variație(Coeficient de variație, CV) - raport deviație standard la medie aritmetic, exprimat ca procent.

În MS EXCEL 2007 și versiuni anterioare pentru calcul Deviația standard a eșantionului se folosește funcția =STDEV(), ing. numele STDEV, adică deviație standard. Începând cu MS EXCEL 2010, se recomandă utilizarea analogului său = STDEV.B () , ing. numele STDEV.S, adică Exemplu de deviare standard.

În plus, începând de la versiunea MS EXCEL 2010, există o funcție STDEV.G () , ing. numele STDEV.P, adică Deviația standard a populației care calculează deviație standard pentru populatie. Întreaga diferență se reduce la numitor: în loc de n-1 ca STDEV.V() , STDEV.G() are doar n în numitor.

Deviație standard poate fi calculat și direct din formulele de mai jos (vezi fișierul exemplu)
=SQRT(SQUADROTIV(Eșantion)/(COUNT(Eșantion)-1))
=SQRT((SUMSQ(Eșantion)-COUNT(Eșantion)*MEDIE(Eșantion)^2)/(NUMĂR (Eșantion)-1))

Alte măsuri de dispersie

Funcția SQUADRIVE() calculează cu umm de abateri pătrate ale valorilor de la lor mijloc. Această funcție va returna același rezultat ca și formula =VAR.G( Probă)*VERIFICA( Probă) , Unde Probă- o referință la un interval care conține o matrice de valori ale eșantionului (). Calculele în funcția QUADROTIV() se fac după formula:

Funcția SROOT() este, de asemenea, o măsură a dispersării unui set de date. Funcția SIROTL() calculează media valorilor absolute a abaterilor valorilor de la mijloc. Această funcție va returna același rezultat ca și formula =SUMPRODUS(ABS(Eșantion-MEDIE(Eșantion)))/COUNT(Eșantion), Unde Probă- o referință la un interval care conține o serie de valori ale eșantionului.

Calculele în funcția SROOTKL () se fac după formula: