Čo charakterizuje vnútroskupinovú disperziu. Matematické očakávanie a rozptyl náhodnej premennej

Ak je populácia rozdelená do skupín podľa študovaného znaku, potom možno pre túto populáciu vypočítať nasledujúce typy rozptylu: celkový, skupinový (vnútroskupinový), skupinový priemer (priemer z vnútroskupiny), medziskupinový.

Na úvod vypočíta koeficient determinácie, ktorý ukazuje, akú časť celkovej variácie skúmaného znaku tvorí medziskupinová variácia, t.j. kvôli zoskupeniu:

Empirický korelačný pomer charakterizuje tesnosť spojenia medzi zoskupením (faktoriálne) a efektívnymi znakmi.

Empirický korelačný pomer môže nadobúdať hodnoty od 0 do 1.

Na posúdenie blízkosti vzťahu na základe empirického korelačného pomeru môžete použiť Chaddockove vzťahy:

Príklad 4 K dispozícii sú nasledujúce údaje o výkone práce projektovými a prieskumnými organizáciami rôznych foriem vlastníctva:

Definuj:

1) celkový rozptyl;

2) skupinové disperzie;

3) priemer skupinových disperzií;

4) medziskupinová disperzia;

5) celkový rozptyl založený na pravidle sčítania rozptylov;


6) koeficient determinácie a empirická korelácia.

Urobte si vlastné závery.

Riešenie:

1. Určme priemerný objem práce vykonanej podnikmi dvoch foriem vlastníctva:

Vypočítajte celkový rozptyl:

2. Definujte skupinové priemery:

milión rubľov;

mln rub.

Skupinové odchýlky:

;

3. Vypočítajte priemer skupinových rozptylov:

4. Určite medziskupinový rozptyl:

5. Vypočítajte celkový rozptyl na základe pravidla pre sčítanie rozptylov:

6. Určte koeficient determinácie:

.

Množstvo práce vykonanej projekčnými a prieskumnými organizáciami teda o 22% závisí od formy vlastníctva podnikov.

Empirický korelačný pomer sa vypočíta podľa vzorca

.

Hodnota vypočítaného ukazovateľa naznačuje, že závislosť množstva práce od formy vlastníctva podniku je malá.

Príklad 5 Výsledkom prieskumu technologickej disciplíny výrobných miest boli získané údaje:

Určte koeficient determinácie

Hlavnými zovšeobecňujúcimi ukazovateľmi odchýlky v štatistike sú rozptyl a štandardná odchýlka.

Disperzia to aritmetický priemer štvorcové odchýlky každej hodnoty znaku od celkového priemeru. Rozptyl sa zvyčajne nazýva stredná štvorec odchýlok a označuje sa  2 . V závislosti od počiatočných údajov možno rozptyl vypočítať z aritmetického priemeru, jednoduchého alebo váženého:

 nevážená (jednoduchá) disperzia;

 vážený rozptyl.

Smerodajná odchýlka je zovšeobecňujúca charakteristika absolútnych rozmerov variácie črta v súhrne. Vyjadruje sa v rovnakých jednotkách ako znamienko (v metroch, tonách, percentách, hektároch atď.).

Smerodajná odchýlka je druhá odmocnina rozptylu a označuje sa :

 nevážená štandardná odchýlka;

 vážená štandardná odchýlka.

Smerodajná odchýlka je mierou spoľahlivosti priemeru. Čím menšia je štandardná odchýlka, tým lepšie aritmetický priemer odráža celú reprezentovanú populáciu.

Výpočtu smerodajnej odchýlky predchádza výpočet rozptylu.

Postup výpočtu váženého rozptylu je nasledujúci:

1) určte aritmetický vážený priemer:

2) vypočítajte odchýlky možností od priemeru:

3) druhá mocnina odchýlky každej možnosti od priemeru:

4) vynásobte druhé mocniny odchýlok váhami (frekvenciami):

5) zhrňte prijaté práce:

6) výsledná suma sa vydelí súčtom váh:

Príklad 2.1

Vypočítajte aritmetický vážený priemer:

Hodnoty odchýlok od priemeru a ich štvorcov sú uvedené v tabuľke. Definujme rozptyl:

Štandardná odchýlka sa bude rovnať:

Ak sú zdrojové údaje prezentované ako interval distribučná séria , potom musíte najprv určiť diskrétnu hodnotu prvku a potom použiť opísanú metódu.

Príklad 2.2

Ukážme výpočet rozptylu pre intervalový rad na údajoch o rozdelení osiatej plochy JZD podľa výnosu pšenice.

Aritmetický priemer je:

Vypočítajme rozptyl:

6.3. Výpočet rozptylu podľa vzorca pre jednotlivé údaje

Technika výpočtu disperzia zložité a pre veľké hodnoty možností a frekvencií môžu byť ťažkopádne. Výpočty je možné zjednodušiť pomocou disperzných vlastností.

Disperzia má nasledujúce vlastnosti.

1. Zníženie alebo zvýšenie váh (frekvencií) premenného znaku o určitý počet krát nemení rozptyl.

2. Zníženie alebo zvýšenie hodnoty každej funkcie o rovnakú konštantnú hodnotu ALE rozptyl sa nemení.

3. Zníženie alebo zvýšenie hodnoty každej funkcie o určitý počet krát k respektíve znižuje alebo zvyšuje rozptyl v k 2 krát smerodajná odchýlka  v k raz.

4. Rozptyl znaku vo vzťahu k ľubovoľnej hodnote je vždy väčší ako rozptyl vo vzťahu k aritmetickému priemeru o druhú mocninu rozdielu medzi priemernými a ľubovoľnými hodnotami:

Ak ALE 0, potom dospejeme k nasledujúcej rovnosti:

t.j. rozptyl znaku sa rovná rozdielu medzi strednou druhou mocninou hodnôt funkcie a druhou mocninou priemeru.

Každá vlastnosť môže byť použitá samostatne alebo v kombinácii s inými pri výpočte rozptylu.

Postup výpočtu rozptylu je jednoduchý:

1) určiť aritmetický priemer :

2) odmocnina aritmetického priemeru:

3) druhá mocnina odchýlky každého variantu série:

X i 2 .

4) nájdite súčet štvorcov možností:

5) vydeľte súčet štvorcov možností ich počtom, t. j. určte priemerný štvorec:

6) určte rozdiel medzi strednou druhou mocninou znaku a druhou mocninou priemeru:

Príklad 3.1 Máme nasledujúce údaje o produktivite pracovníkov:

Urobme nasledujúce výpočty:

Disperzia náhodnej premennej je mierou šírenia hodnôt tejto premennej. Malý rozptyl znamená, že hodnoty sú zoskupené blízko seba. Veľký rozptyl naznačuje silný rozptyl hodnôt. V štatistike sa používa koncept rozptylu náhodnej premennej. Ak napríklad porovnáte rozptyl hodnôt dvoch veličín (ako sú výsledky pozorovaní pacientov mužského a ženského pohlavia), môžete otestovať význam niektorej premennej. Rozptyl sa používa aj pri zostavovaní štatistických modelov, pretože malý rozptyl môže byť znakom toho, že preháňate hodnoty.

Kroky

Vzorový výpočet rozptylu

  1. Zaznamenajte hodnoty vzoriek. Vo väčšine prípadov sú štatistikom dostupné len vzorky určitých populácií. Napríklad štatistici spravidla neanalyzujú náklady na udržiavanie populácie všetkých áut v Rusku - analyzujú náhodnú vzorku niekoľkých tisíc áut. Takáto vzorka pomôže určiť priemerné náklady na auto, ale s najväčšou pravdepodobnosťou bude výsledná hodnota ďaleko od skutočnej.

    • Napríklad, analyzujme počet žemlí predaných v kaviarni za 6 dní v náhodnom poradí. Vzorka má nasledujúci tvar: 17, 15, 23, 7, 9, 13. Toto je vzorka, nie populácia, pretože nemáme údaje o žemliach predaných za každý deň, kedy je kaviareň otvorená.
    • Ak ste dostali populáciu a nie vzorku hodnôt, preskočte na ďalšiu časť.
  2. Napíšte vzorec na výpočet rozptylu vzorky. Disperzia je miera šírenia hodnôt určitej veličiny. Čím bližšie je hodnota rozptylu k nule, tým bližšie sú hodnoty zoskupené. Pri práci so vzorkou hodnôt použite na výpočet rozptylu nasledujúci vzorec:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) je disperzia. Disperzia sa meria v štvorcových jednotkách.
    • x i (\displaystyle x_(i))- každá hodnota vo vzorke.
    • x i (\displaystyle x_(i)) musíte odčítať x̅, odmocniť ho a potom pridať výsledky.
    • x̅ – výberový priemer (výberový priemer).
    • n je počet hodnôt vo vzorke.
  3. Vypočítajte priemer vzorky. Označuje sa ako x̅. Priemer vzorky sa vypočíta ako normálny aritmetický priemer: spočítajte všetky hodnoty vo vzorke a potom vydeľte výsledok počtom hodnôt vo vzorke.

    • V našom príklade pridajte hodnoty vo vzorke: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Teraz vydeľte výsledok počtom hodnôt vo vzorke (v našom príklade je ich 6): 84 ÷ 6 = 14.
      Priemer vzorky x̅ = 14.
    • Priemer vzorky je centrálna hodnota, okolo ktorej sú distribuované hodnoty vo vzorke. Ak sa hodnoty vo vzorke zhlukujú okolo priemeru vzorky, potom je rozptyl malý; inak je rozptyl veľký.
  4. Odpočítajte priemer vzorky od každej hodnoty vo vzorke. Teraz vypočítajte rozdiel x i (\displaystyle x_(i))- x̅, kde x i (\displaystyle x_(i))- každá hodnota vo vzorke. Každý získaný výsledok udáva, do akej miery sa konkrétna hodnota odchyľuje od priemeru vzorky, teda ako ďaleko je táto hodnota od priemeru vzorky.

    • V našom príklade:
      x 1 (\displaystyle x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x = 13 - 14 = -1
    • Správnosť získaných výsledkov sa dá ľahko overiť, pretože ich súčet sa musí rovnať nule. Súvisí to s určením priemernej hodnoty, pretože záporné hodnoty (vzdialenosti od priemernej hodnoty k menším hodnotám) sú úplne kompenzované kladnými hodnotami (vzdialenosti od priemernej hodnoty k väčším hodnotám).
  5. Ako je uvedené vyššie, súčet rozdielov x i (\displaystyle x_(i))- x̅ sa musí rovnať nule. To znamená, že stredný rozptyl je vždy nula, čo nedáva žiadnu predstavu o rozložení hodnôt nejakej veličiny. Ak chcete vyriešiť tento problém, umocnite každý rozdiel x i (\displaystyle x_(i))- X. Výsledkom bude, že získate iba kladné čísla, ktoré po sčítaní nikdy nebudú mať nulu.

    • V našom príklade:
      (x 1 (\displaystyle x_(1))-X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Našli ste druhú mocninu rozdielu - x̅) 2 (\displaystyle ^(2)) pre každú hodnotu vo vzorke.
  6. Vypočítajte súčet druhých mocnín rozdielov. To znamená, nájdite časť vzorca, ktorá je napísaná takto: ∑[( x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))]. Znamienko Σ tu znamená súčet druhých mocnín rozdielov pre každú hodnotu x i (\displaystyle x_(i)) vo vzorke. Už ste našli štvorcové rozdiely (x i (\displaystyle (x_(i))-X) 2 (\displaystyle ^(2)) pre každú hodnotu x i (\displaystyle x_(i)) vo vzorke; teraz len pridajte tieto štvorce.

    • V našom príklade: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Výsledok vydeľte n - 1, kde n je počet hodnôt vo vzorke. Pred časom štatistici na výpočet rozptylu vzorky jednoducho vydelili výsledok číslom n; v tomto prípade dostanete stred druhej mocniny rozptylu, čo je ideálne na popísanie rozptylu danej vzorky. Ale pamätajte, že každá vzorka je len malou časťou všeobecnej populácie hodnôt. Ak vezmete inú vzorku a urobíte rovnaké výpočty, dostanete iný výsledok. Ako sa ukázalo, delenie číslom n – 1 (a nie len n) poskytuje lepší odhad rozptylu populácie, o čo vám ide. Delenie n - 1 sa stalo samozrejmosťou, preto je zahrnuté vo vzorci na výpočet výberového rozptylu.

    • V našom príklade vzorka obsahuje 6 hodnôt, teda n = 6.
      Ukážkový rozptyl = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Rozdiel medzi rozptylom a štandardnou odchýlkou. Všimnite si, že vzorec obsahuje exponent, takže rozptyl sa meria v štvorcových jednotkách analyzovanej hodnoty. Niekedy je taká hodnota dosť ťažko ovládateľná; v takýchto prípadoch sa používa smerodajná odchýlka, ktorá sa rovná druhej odmocnine rozptylu. Preto sa výberový rozptyl označuje ako s 2 (\displaystyle s^(2)) a štandardná odchýlka vzorky ako s (\displaystyle s).

    • V našom príklade je štandardná odchýlka vzorky: s = √33,2 = 5,76.

    Výpočet rozptylu populácie

    1. Analyzujte nejaký súbor hodnôt. Sada obsahuje všetky hodnoty uvažovanej veličiny. Napríklad, ak študujete vek obyvateľov regiónu Leningrad, potom počet obyvateľov zahŕňa vek všetkých obyvateľov tohto regiónu. V prípade práce s agregátom sa odporúča vytvoriť tabuľku a zadať do nej hodnoty agregátu. Zvážte nasledujúci príklad:

      • V určitej miestnosti je 6 akvárií. Každé akvárium obsahuje nasledujúci počet rýb:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Napíšte vzorec na výpočet rozptylu populácie. Keďže populácia zahŕňa všetky hodnoty určitého množstva, nasledujúci vzorec vám umožňuje získať presnú hodnotu rozptylu populácie. Na odlíšenie rozptylu populácie od rozptylu vzorky (čo je len odhad) používajú štatistici rôzne premenné:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- rozptyl populácie (čítaj ako "sigma na druhú"). Disperzia sa meria v štvorcových jednotkách.
      • x i (\displaystyle x_(i))- každá hodnota v súhrne.
      • Σ je znak súčtu. Teda pre každú hodnotu x i (\displaystyle x_(i)) odčítajte μ, umocnite ho a potom pridajte výsledky.
      • μ je priemer populácie.
      • n je počet hodnôt vo všeobecnej populácii.
    3. Vypočítajte priemer populácie. Pri práci s bežnou populáciou sa jeho priemerná hodnota označuje ako μ (mu). Priemer populácie sa vypočíta ako zvyčajný aritmetický priemer: spočítajte všetky hodnoty v populácii a potom vydeľte výsledok počtom hodnôt v populácii.

      • Majte na pamäti, že priemery nie sú vždy vypočítané ako aritmetický priemer.
      • V našom príklade populácia znamená: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Od každej hodnoty v populácii odpočítajte priemer populácie.Čím bližšie je hodnota rozdielu k nule, tým bližšie je konkrétna hodnota k priemeru populácie. Nájdite rozdiel medzi každou hodnotou v populácii a jej priemerom a získate prvý pohľad na rozdelenie hodnôt.

      • V našom príklade:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Odmocnite každý výsledok, ktorý získate. Rozdielové hodnoty budú kladné aj záporné; ak umiestnite tieto hodnoty na číselnú os, budú ležať vpravo a vľavo od priemeru populácie. Toto nie je dobré na výpočet rozptylu, pretože kladné a záporné čísla sa navzájom rušia. Preto umocnite každý rozdiel, aby ste získali výlučne kladné čísla.

      • V našom príklade:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) pre každú hodnotu populácie (od i = 1 do i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), kde x n (\displaystyle x_(n)) je posledná hodnota v populácii.
      • Ak chcete vypočítať priemernú hodnotu získaných výsledkov, musíte nájsť ich súčet a vydeliť ho n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Teraz napíšme vyššie uvedené vysvetlenie pomocou premenných: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n a získajte vzorec na výpočet rozptylu populácie.

Riešenie.

Ako mieru rozptylu hodnôt náhodnej premennej používame disperzia

Disperzia (slovo disperzia znamená "rozptyl") je miera rozptylu hodnôt náhodnej premennej o jeho matematickom očakávaní. Disperzia je matematické očakávanie druhej mocniny odchýlky náhodnej premennej od jej matematického očakávania.

Ak je náhodná premenná diskrétna s nekonečnou, ale spočítateľnou množinou hodnôt, potom

ak rad na pravej strane rovnosti konverguje.

Disperzné vlastnosti.

  • 1. Disperzia konštantnej hodnoty je nulová
  • 2. Rozptyl súčtu náhodných premenných sa rovná súčtu rozptylov
  • 3. Konštantný faktor možno odobrať zo znamienka druhej mocniny rozptylu

Rozptyl rozdielu náhodných premenných sa rovná súčtu rozptylov

Táto vlastnosť je dôsledkom druhej a tretej vlastnosti. Rozdiely sa môžu len sčítať.

Rozptyl sa pohodlne vypočíta podľa vzorca, ktorý sa dá ľahko získať pomocou vlastností rozptylu

Rozptyl je vždy pozitívny.

Disperzia má rozmerštvorec rozmeru samotnej náhodnej premennej, čo nie je vždy vhodné. Preto množstvo

Smerodajná odchýlka(štandardná odchýlka alebo štandard) náhodnej premennej sa nazýva aritmetická hodnota druhej odmocniny jej rozptylu

Hoďte dve mince v nominálnych hodnotách 2 a 5 rubľov. Ak minca padne spolu s erbom, pridelí sa nula bodov a ak ide o číslo, počet bodov sa rovná hodnote mince. Nájdite matematické očakávanie a rozptyl počtu bodov.

Riešenie. Najprv nájdime rozdelenie náhodnej premennej X - počet bodov. Všetky kombinácie - (2; 5), (2; 0), (0; 5), (0; 0) - sú rovnako pravdepodobné a distribučný zákon:

Očakávaná hodnota:

Disperziu nájdeme podľa vzorca

prečo počítame

Príklad 2

Nájdite neznámu pravdepodobnosť R, matematické očakávanie a rozptyl diskrétnej náhodnej premennej daný tabuľkou rozdelenia pravdepodobnosti

Nájdeme matematické očakávanie a rozptyl:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Na výpočet rozptylu použijeme vzorec (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Príklad 3 Dvaja rovnocenní športovci organizujú turnaj, ktorý trvá buď do prvého víťazstva jedného z nich, alebo do odohrania piatich zápasov. Pravdepodobnosť výhry v jednej hre pre každého zo športovcov je 0,3 a pravdepodobnosť remízy 0,4. Nájdite distribučný zákon, matematické očakávanie a rozptyl počtu odohraných hier.

Riešenie. Náhodná hodnota X- počet odohraných hier, nadobúda hodnoty od 1 do 5, t.j.

Stanovme si pravdepodobnosti konca zápasu. Zápas sa skončí v prvom sete, ak jeden z pretekárov vyhrá. Pravdepodobnosť výhry je

R(1) = 0,3+0,3 =0,6.

Ak bola remíza (pravdepodobnosť remízy je 1 - 0,6 = 0,4), zápas pokračuje. Zápas sa skončí v druhej hre, ak bola prvá remíza a niekto vyhral druhú. Pravdepodobnosť

R(2) = 0,4 0,6=0,24.

Podobne sa zápas skončí v tretej hre, ak boli dve remízy za sebou a opäť niekto vyhral

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Piata strana v ľubovoľnom variante je posledná.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Zhrňme si všetko do tabuľky. Zákon rozdelenia náhodnej premennej „počet vyhraných hier“ má podobu

Očakávaná hodnota

Disperzia sa vypočíta podľa vzorca (19.4)

Štandardné diskrétne distribúcie.

Binomické rozdelenie. Nechajte implementovať schému Bernoulliho experimentu: n identické nezávislé experimenty, v každom z nich udalosť A sa môže objaviť s konštantnou pravdepodobnosťou p a s pravdepodobnosťou sa neobjaví

(pozri prednášku 18).

Počet výskytov udalosti A v týchto n experimentoch existuje diskrétna náhodná premenná X, ktorého možné hodnoty sú:

0; 1; 2; ... ;m; ... ; n.

Pravdepodobnosť vzhľadu m udalosti A v konkrétnej sérii od n experimenty a distribučný zákon takejto náhodnej veličiny je daný Bernoulliho vzorcom (pozri prednášku 18)

Číselné charakteristiky náhodnej premennej X rozdelené podľa binomického zákona:

Ak n je veľký (), potom, at, vzorec (19.6) prechádza do vzorca

a tabuľková Gaussova funkcia (tabuľka hodnôt Gaussovej funkcie je uvedená na konci prednášky 18).

V praxi často nie je dôležitá samotná pravdepodobnosť. m diania A v konkrétnej sérii n skúsenosti a pravdepodobnosť, že udalosť ALE sa objaví minimálne

krát a viac krát, t.j. pravdepodobnosť, že X nadobudne hodnoty

Aby sme to dosiahli, musíme spočítať pravdepodobnosti

Ak n je veľký (), potom, at, vzorec (19.9) prechádza do približného vzorca

tabuľková funkcia. Tabuľky sú uvedené na konci prednášky 18.

Pri používaní tabuliek majte na pamäti

Príklad 1. Auto, ktoré sa blíži ku križovatke, môže pokračovať v pohybe po ktorejkoľvek z troch ciest: A, B alebo C s rovnakou pravdepodobnosťou. Ku križovatke sa blíži päť áut. Nájdite priemerný počet áut, ktoré pôjdu po ceste A a pravdepodobnosť, že tri autá pôjdu po ceste B.

Riešenie. Počet áut prechádzajúcich na každej z ciest je náhodná veličina. Ak predpokladáme, že všetky autá, ktoré sa blížia ku križovatke, cestujú nezávisle od seba, potom sa táto náhodná premenná rozdelí podľa binomického zákona s

n= 5 a p = .

Preto priemerný počet áut, ktoré pôjdu po ceste A, je podľa vzorca (19.7)

a požadovaná pravdepodobnosť pri

Príklad 2 Pravdepodobnosť zlyhania zariadenia v každom teste je 0,1. Vykonalo sa 60 testov zariadenia. Aká je pravdepodobnosť, že zariadenie zlyhá: a) 15-krát; b) nie viac ako 15-krát?

a. Keďže počet testov je 60, použijeme vzorec (19.8)

Podľa tabuľky 1 prílohy k prednáške 18 nachádzame

b. Používame vzorec (19.10).

Podľa tabuľky 2 prílohy k prednáške 18

  • - 0,495
  • 0,49995

Poissonovo rozdelenie) zákon zriedkavých javov). Ak n skvelé a R málo (), zatiaľ čo produkt atď drží konštantnú hodnotu, ktorú označíme l,

potom vzorec (19.6) prechádza do Poissonovho vzorca

Poissonov zákon o rozdelení má tvar:

Je zrejmé, že definícia Poissonovho zákona je správna, pretože hlavná vlastnosť distribučnej série

splnené, pretože riadková suma

Rozšírenie v sérii funkcií je napísané v zátvorkách pre

Veta. Matematické očakávanie a rozptyl náhodnej premennej rozloženej podľa Poissonovho zákona sa zhodujú a rovnajú sa parametru tohto zákona, t.j.

Dôkaz.

Príklad. Na propagáciu svojich produktov na trhu spoločnosť vypisuje do schránok letáky. Doterajšie skúsenosti ukazujú, že približne v jednom prípade z 2000 nasleduje objednávka. Zistite pravdepodobnosť prijatia aspoň jednej objednávky po umiestnení 10 000 letákov, priemerný počet prijatých objednávok a rozptyl počtu prijatých objednávok.

Riešenie. Tu

Pravdepodobnosť, že príde aspoň jedna objednávka, zistíme cez pravdepodobnosť opačnej udalosti, t.j.

Náhodný prúd udalostí. Prúd udalostí je sled udalostí vyskytujúcich sa v náhodných časoch. Typickými príkladmi tokov sú poruchy v počítačových sieťach, hovory na telefónnych ústredniach, tok požiadaviek na opravu zariadení atď.

Prietok udalosti sa nazývajú stacionárne, ak pravdepodobnosť zasiahnutia jedného alebo druhého počtu udalostí na časovom intervale dĺžky závisí len od dĺžky intervalu a nezávisí od umiestnenia časového intervalu na časovej osi.

Stacionárnu podmienku spĺňa tok aplikácií, ktorých pravdepodobnostné charakteristiky nezávisia od času. Najmä stacionárny tok sa vyznačuje konštantnou hustotou (priemerný počet požiadaviek za jednotku času). V praxi často existujú toky aplikácií, ktoré (aspoň na obmedzený čas) možno považovať za stacionárne. Za stacionárny možno považovať napríklad tok hovorov na mestskej telefónnej ústredni v časovom intervale od 12 do 13 hodín. Rovnaký tok počas celého dňa už nemožno považovať za stacionárny (v noci je hustota hovorov oveľa menšia ako cez deň).

Prietok udalosti sa nazývajú prúd bez efektu, ak pre žiadne neprekrývajúce sa časové úseky počet udalostí pripadajúcich na jeden z nich nezávisí od počtu udalostí pripadajúcich na ostatné.

Podmienka bez následkov, ktorá je najvýznamnejšia pre najjednoduchší tok, znamená, že nároky vstupujú do systému nezávisle od seba. Napríklad tok cestujúcich vstupujúcich do stanice metra možno považovať za tok bez následkov, pretože dôvody, ktoré spôsobili príchod jednotlivého cestujúceho v danom momente a nie iného, ​​spravidla nesúvisia s podobnými dôvodmi pre iné cestujúcich. Avšak podmienka neprítomnosti následného účinku môže byť ľahko porušená v dôsledku objavenia sa takejto závislosti. Napríklad tok cestujúcich opúšťajúcich stanicu metra už nemožno považovať za tok bez následných účinkov, pretože časy odchodov cestujúcich prichádzajúcich tým istým vlakom sú navzájom závislé.

Prietok udalosti sa nazývajú obyčajný, ak je pravdepodobnosť zasiahnutia dvoch alebo viacerých udalostí v malom časovom intervale t zanedbateľná v porovnaní s pravdepodobnosťou zasiahnutia jednej udalosti (v tomto smere sa Poissonov zákon nazýva zákon zriedkavých udalostí).

Podmienka obyčajnosti znamená, že aplikácie prichádzajú po jednej, a nie v pároch, trojiciach atď. odchýlka rozptylu Bernoulliho distribúcia

Napríklad tok zákazníkov vstupujúcich do kaderníckeho salónu možno považovať za takmer obyčajný. Ak pri mimoriadnom prietoku prichádzajú aplikácie len v pároch, iba v trojiciach atď., potom sa dá mimoriadny prietok ľahko zredukovať na obyčajný; na to stačí namiesto prúdu jednotlivých aplikácií uvažovať tok párov, trojíc atď.. Ťažšie to bude, ak sa každá aplikácia môže náhodne ukázať ako dvojitá, trojitá atď. vysporiadať sa s prúdom nie homogénnych, ale heterogénnych udalostí.

Ak má tok udalostí všetky tri vlastnosti (t. j. je stacionárny, obyčajný a nemá žiadny následný efekt), potom sa nazýva najjednoduchší (alebo stacionárny Poissonov) tok. Názov „Poisson“ je spôsobený skutočnosťou, že za vyššie uvedených podmienok bude počet udalostí spadajúcich do akéhokoľvek pevného časového intervalu rozdelený na Poissonov zákon

Tu je priemerný počet udalostí A objavujúce sa za jednotku času.

Tento zákon je jednoparametrický, t.j. vyžaduje, aby bol známy iba jeden parameter. Dá sa ukázať, že matematické očakávanie a rozptyl v Poissonovom zákone sú číselne rovnaké:

Príklad. V strede pracovného dňa je priemerný počet žiadostí 2 za sekundu. Aká je pravdepodobnosť, že 1) nebudú prijaté žiadne požiadavky za sekundu, 2) 10 žiadostí bude prijatých za dve sekundy?

Riešenie. Keďže platnosť aplikácie Poissonovho zákona je nepochybná a jeho parameter je nastavený (= 2), riešenie úlohy sa redukuje na aplikáciu Poissonovho vzorca (19.11)

1) t = 1, m = 0:

2) t = 2, m = 10:

Zákon veľkých čísel. Matematickým základom skutočnosti, že hodnoty náhodnej premennej sú zoskupené okolo niektorých konštantných hodnôt, je zákon veľkých čísel.

Historicky prvou formuláciou zákona veľkých čísel bola Bernoulliho veta:

„Pri neobmedzenom zvyšovaní počtu identických a nezávislých experimentov n frekvencia výskytu udalosti A konverguje v pravdepodobnosti k jej pravdepodobnosti“, t.j.

kde je frekvencia výskytu udalosti A v n experimentoch,

Výraz (19.10) v podstate znamená, že pri veľkom počte experimentov sa frekvencia výskytu udalosti A môže nahradiť neznámu pravdepodobnosť tejto udalosti a čím väčší je počet experimentov, tým je p* bližšie k p. Zaujímavý historický fakt. K. Pearson hodil mincou 12 000-krát a jeho erb padol 6019-krát (frekvencia 0,5016). Pri 24 000 hode tou istou mincou dostal 12 012 kvapiek erbu, t.j. frekvencia 0,5005.

Najdôležitejšou formou zákona veľkých čísel je Čebyševova veta: s neobmedzeným nárastom počtu nezávislých, s konečným rozptylom a vykonaných za rovnakých podmienok experimentov, aritmetický priemer pozorovaných hodnôt náhodnej premennej konverguje v pravdepodobnosti k jej matematickému očakávaniu. V analytickej forme možno túto vetu napísať takto:

Čebyševova veta má okrem zásadného teoretického významu aj dôležité praktické uplatnenie, napríklad v teórii meraní. Po n meraniach nejakej veličiny X, získate rôzne nezhodné hodnoty X 1, X 2, ..., xn. Pre približnú hodnotu nameranej hodnoty X vezmite aritmetický priemer pozorovaných hodnôt

pričom čím viac experimentov sa vykoná, tým presnejší bude výsledok. Faktom je, že rozptyl hodnoty klesá so zvyšujúcim sa počtom vykonaných experimentov, od r

D(X 1) = D(X 2)=…= D(xn) D(X), potom

Vzťah (19.13) ukazuje, že aj pri vysokej nepresnosti meracích prístrojov (veľká hodnota), zvýšením počtu meraní, je možné získať výsledok s ľubovoľne vysokou presnosťou.

Pomocou vzorca (19.10) je možné nájsť pravdepodobnosť, že štatistická frekvencia sa od pravdepodobnosti neodchyľuje o viac ako

Príklad. Pravdepodobnosť udalosti v každom pokuse je 0,4. Koľko testov by sa malo vykonať, aby sa s pravdepodobnosťou nie menšou ako 0,8 očakávalo, že relatívna frekvencia udalosti sa bude odchyľovať od modulo pravdepodobnosti menšej ako 0,01?

Riešenie. Podľa vzorca (19.14)

preto sú podľa tabuľky dve aplikácie

v dôsledku toho n 3932.

Poďme počítať vPANIEXCELrozptyl a štandardná odchýlka vzorky. Vypočítame aj rozptyl náhodnej premennej, ak je známe jej rozdelenie.

Najprv zvážte disperzia, potom smerodajná odchýlka.

Ukážkový rozptyl

Ukážkový rozptyl (vzorový rozptyl,vzorkarozptyl) charakterizuje rozšírenie hodnôt v poli vzhľadom na .

Všetky 3 vzorce sú matematicky ekvivalentné.

Z prvého vzorca je vidieť, že vzorový rozptyl je súčet štvorcových odchýlok každej hodnoty v poli od priemeru delené veľkosťou vzorky mínus 1.

disperzia vzorky používa sa funkcia DISP(), inž. názov VAR, t.j. VARIance. Od MS EXCEL 2010 sa odporúča používať jeho analóg DISP.V() , eng. názov VARS, t.j. Vzorový rozptyl. Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia DISP.G (), eng. Názov VARP, t.j. VARIANCIA populácie, ktorá počíta disperzia pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako DISP.V() má DISP.G() v menovateli len n. Pred MS EXCEL 2010 sa na výpočet rozptylu populácie používala funkcia VARP().

Ukážkový rozptyl
=SQUARE(Ukážka)/(POČET(Vzorka)-1)
=(SUMSQ(vzorka)-POCET(vzorka)*priemer (vzorka)^2)/ (POCET(vzorka)-1)- obvyklý vzorec
=SUM((Vzorka -PREMERNÝ(Vzorka))^2)/ (POČET(Vzorka)-1) –

Ukážkový rozptyl sa rovná 0 iba vtedy, ak sú všetky hodnoty navzájom rovnaké, a preto sú rovnaké stredná hodnota. Zvyčajne platí, že čím je hodnota väčšia disperzia, tým väčšie je rozšírenie hodnôt v poli.

Ukážkový rozptyl je bodový odhad disperzia rozdelenie náhodnej premennej, z ktorého vzorka. O stavbe intervaly spoľahlivosti pri hodnotení disperzia si môžete prečítať v článku.

Rozptyl náhodnej premennej

Kalkulovať disperzia náhodná premenná, musíte to vedieť.

Pre disperzia náhodná premenná X často používa označenie Var(X). Disperzia sa rovná štvorcu odchýlky od priemeru E(X): Var(X)=E[(X-E(X)) 2 ]

disperzia vypočítané podľa vzorca:

kde x i je hodnota, ktorú môže mať náhodná premenná a μ je priemerná hodnota (), p(x) je pravdepodobnosť, že náhodná premenná nadobudne hodnotu x.

Ak má náhodná premenná , potom disperzia vypočítané podľa vzorca:

Rozmer disperzia zodpovedá druhej mocnine mernej jednotky pôvodných hodnôt. Napríklad, ak sú hodnoty vo vzorke merania hmotnosti dielu (v kg), potom by bol rozmer rozptylu kg 2 . To môže byť ťažké interpretovať, a preto charakterizovať šírenie hodnôt, hodnotu rovnajúcu sa druhej odmocnine z disperziasmerodajná odchýlka.

Niektoré vlastnosti disperzia:

Var(X+a)=Var(X), kde X je náhodná premenná a a je konštanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X))2 ]=E=E(X2)-E(2*X*E(X))+(E(X))2=E(X2)- 2*E(X)*E(X)+(E(X))2 =E(X2)-(E(X))2

Táto disperzná vlastnosť sa využíva v článok o lineárnej regresii.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), kde X a Y sú náhodné premenné, Cov(X;Y) je kovariancia týchto náhodných premenných.

Ak sú náhodné premenné nezávislé, potom ich kovariancia je 0, a teda Var(X+Y)=Var(X)+Var(Y). Táto vlastnosť rozptylu sa používa vo výstupe.

Ukážme, že pre nezávislé veličiny Var(X-Y)=Var(X+Y). Skutočne, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X) + (- 1) 2 Var (Y) \u003d Var (X) + Var (Y) \u003d Var (X + Y). Táto vlastnosť rozptylu sa používa na vykreslenie .

Štandardná odchýlka vzorky

Štandardná odchýlka vzorky je mierou toho, do akej miery sú hodnoty vo vzorke rozptýlené vo vzťahu k ich .

Podľa definície, smerodajná odchýlka sa rovná druhej odmocnine z disperzia:

Smerodajná odchýlka nezohľadňuje veľkosť hodnôt v vzorkovanie, ale iba stupeň rozptylu hodnôt okolo nich stredná. Na ilustráciu si uveďme príklad.

Vypočítajme smerodajnú odchýlku pre 2 vzorky: (1; 5; 9) a (1001; 1005; 1009). V oboch prípadoch s=4. Je zrejmé, že pomer štandardnej odchýlky k hodnotám poľa je pre vzorky výrazne odlišný. Pre takéto prípady použite Variačný koeficient(Variačný koeficient, CV) - pomer smerodajná odchýlka k priemeru aritmetika, vyjadrené v percentách.

V MS EXCEL 2007 a starších verziách na výpočet Štandardná odchýlka vzorky používa sa funkcia =STDEV(), inž. názov STDEV, t.j. smerodajná odchýlka. Od MS EXCEL 2010 sa odporúča používať jeho analóg = STDEV.B () , eng. názov STDEV.S, t.j. Ukážka štandardnej odchýlky.

Okrem toho je od verzie MS EXCEL 2010 k dispozícii funkcia STDEV.G () , eng. názov STDEV.P, t.j. Populácia štandardná odchýlka, ktorá počíta smerodajná odchýlka pre populácia. Celý rozdiel spočíva v menovateli: namiesto n-1 ako STDEV.V() má STDEV.G() v menovateli len n.

Smerodajná odchýlka možno vypočítať aj priamo zo vzorcov nižšie (pozri súbor s príkladom)
=SQRT(SQUADROTIV(Vzorka)/(POČET(Vzorka)-1))
=SQRT((SUMSQ(vzorka)-POČET(vzorka)*PREMERNÝ(vzorka)^2)/(POČET (vzorka)-1))

Iné rozptylové opatrenia

Funkcia SQUADRIVE() počíta s umm štvorcových odchýlok hodnôt od ich stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =VAR.G( Ukážka)*KONTROLA( Ukážka) , kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt (). Výpočty vo funkcii QUADROTIV() sa vykonávajú podľa vzorca:

Funkcia SROOT() je tiež mierou rozptylu množiny údajov. Funkcia SIROTL() vypočítava priemer absolútnych hodnôt odchýlok hodnôt od stredná. Táto funkcia vráti rovnaký výsledok ako vzorec =SÚČETNÝ PRODUKT(ABS(vzorka-priemer (vzorka)))/POČET (vzorka), kde Ukážka- odkaz na rozsah obsahujúci pole vzorových hodnôt.

Výpočty vo funkcii SROOTKL () sa vykonávajú podľa vzorca: