Mi jellemzi a csoporton belüli diszperziót. Valószínűségi változó matematikai elvárása és varianciája

Ha a populációt a vizsgált tulajdonság szerint csoportokra osztjuk, akkor erre a sokaságra a következő típusú szórások számíthatók: teljes, csoport (csoporton belüli), csoportátlag (csoporton belüli átlag), csoportközi.

Kezdetben a determinációs együtthatót számolja ki, amely megmutatja, hogy a vizsgált tulajdonság teljes variációjának mekkora része a csoportok közötti variáció, azaz. csoportosítás miatt:

Az empirikus korrelációs arány a csoportosító (faktoriális) és az effektív jelek közötti kapcsolat szorosságát jellemzi.

Az empirikus korrelációs arány 0 és 1 közötti értékeket vehet fel.

A kapcsolat szorosságának az empirikus korrelációs arány alapján történő értékeléséhez használhatja a Chaddock-relációkat:

4. példa A különböző tulajdonformájú tervező és felmérési szervezetek által végzett munkavégzésről a következő adatok állnak rendelkezésre:

Határozza meg:

1) teljes variancia;

2) csoportos diszperziók;

3) a csoportos diszperziók átlaga;

4) csoportok közötti diszperzió;

5) teljes variancia az eltérések összeadásának szabálya alapján;


6) determinációs együttható és empirikus korreláció.

Vonja le saját következtetéseit.

Megoldás:

1. Határozzuk meg a két tulajdonformájú vállalkozások által végzett átlagos munkamennyiséget:

Számítsa ki a teljes szórást:

2. Határozza meg a csoportátlagokat:

millió rubel;

millió dörzsölje.

Csoport eltérések:

;

3. Számítsa ki a csoportvarianciák átlagát:

4. Határozza meg a csoportok közötti varianciát:

5. Számítsa ki a teljes szórást az eltérések összeadási szabálya alapján:

6. Határozza meg a determinációs együtthatót:

.

Így a tervező és felmérő szervezetek által végzett munka mennyisége 22%-ban függ a vállalkozások tulajdonformájától.

Az empirikus korrelációs hányadost a képlet számítja ki

.

A számított mutató értéke azt jelzi, hogy a munka mennyiségének a vállalkozás tulajdoni formától való függősége kicsi.

5. példa A termelési telephelyek technológiai fegyelmének felmérése eredményeként a következő adatokat kaptuk:

Határozza meg a determinációs együtthatót!

A statisztikai eltérések fő általánosító mutatói a szórás és a szórás.

Diszperzió azt számtani átlaga az egyes jellemzőértékek négyzetes eltérései a teljes átlagtól. A szórást általában az eltérések középnégyzetének nevezik, és  2 -vel jelöljük. A kiindulási adatoktól függően a variancia kiszámítható egyszerű vagy súlyozott számtani átlaggal:

 súlyozatlan (egyszerű) diszperzió;

 súlyozott variancia.

Szórás abszolút dimenziók általánosító jellemzője variációk tulajdonság összességében. Ugyanazokban a mértékegységekben van kifejezve, mint az előjel (méterben, tonnában, százalékban, hektárban stb.).

A szórás a variancia négyzetgyöke, és -val jelöljük:

 súlyozatlan szórás;

 súlyozott szórás.

A szórás az átlag megbízhatóságának mértéke. Minél kisebb a szórás, annál jobban tükrözi a számtani átlag a teljes reprezentált sokaságot.

A szórás számítását megelőzi a szórás számítása.

A súlyozott variancia kiszámításának eljárása a következő:

1) határozza meg a számtani súlyozott átlagot:

2) számítsa ki az opciók átlagtól való eltérését:

3) négyzetre emelje az egyes opciók átlagtól való eltérését:

4) szorozzuk meg az eltérések négyzetét a súlyokkal (gyakoriságokkal):

5) foglalja össze a beérkezett munkákat:

6) a kapott összeget elosztjuk a súlyok összegével:

2.1. példa

Számítsa ki a számtani súlyozott átlagot:

Az átlagtól való eltérések értékeit és azok négyzeteit a táblázat tartalmazza. Határozzuk meg az eltérést:

A szórása egyenlő lesz:

Ha a forrásadatokat intervallumként jelenítjük meg terjesztési sorozat , akkor először meg kell határoznia a jellemző diszkrét értékét, majd alkalmaznia kell a leírt módszert.

2.2. példa

Mutassuk meg a szórás számítását a kolhoz vetésterületének búzatermés szerinti megoszlására vonatkozó adatok intervallumsoraihoz.

A számtani átlag a következő:

Számítsuk ki a szórást:

6.3. A diszperzió kiszámítása az egyedi adatok képletével

Számítástechnika diszperzió összetettek, és nagy lehetőségek és frekvenciák esetén nehézkesek lehetnek. A számítások leegyszerűsíthetők a diszperziós tulajdonságok segítségével.

A diszperzió a következő tulajdonságokkal rendelkezik.

1. Egy változó jellemző súlyának (frekvenciájának) bizonyos számú csökkenése vagy növekedése nem változtatja meg a diszperziót.

2. Minden jellemző értékének csökkentése vagy növelése azonos állandó értékkel DE a diszperzió nem változik.

3. Minden jellemző értékének csökkentése vagy növelése bizonyos számú alkalommal k rendre csökkenti vagy növeli a szórást k 2 alkalommal szórás  be k egyszer.

4. Egy jellemző tetszőleges értékhez viszonyított szórása mindig nagyobb, mint a számtani középhez viszonyított szórása az átlagos és tetszőleges értékek közötti különbség négyzetével:

Ha egy DE 0, akkor a következő egyenlőséghez jutunk:

azaz egy jellemző szórása egyenlő a jellemző értékeinek átlagnégyzete és az átlag négyzete közötti különbséggel.

Mindegyik tulajdonság használható önmagában vagy másokkal kombinálva a variancia kiszámításakor.

A variancia kiszámításának folyamata egyszerű:

1) határozza meg számtani átlaga :

2) négyzetre emelje a számtani átlagot:

3) négyzetre emelje a sorozat egyes változatainak eltérését:

x én 2 .

4) keresse meg az opciók négyzetösszegét:

5) osszuk el az opciók négyzetösszegét a számukkal, azaz határozzuk meg az átlagos négyzetet:

6) határozza meg a különbséget a jellemző négyzete és az átlag négyzete között:

Példa 3.1 A dolgozók termelékenységéről a következő adatok állnak rendelkezésünkre:

Végezzük el a következő számításokat:

Egy valószínűségi változó diszperziója a változó értékeinek terjedésének mértéke. A kis szórás azt jelenti, hogy az értékek közel vannak egymáshoz. A nagy szórás az értékek erős szórását jelzi. A statisztikában a valószínűségi változó szórásának fogalmát használják. Például, ha összehasonlítja két mennyiség értékének szórását (például férfi és női betegek megfigyelésének eredményeit), akkor tesztelheti néhány változó jelentőségét. A szórást statisztikai modellek készítésekor is használják, mivel a kis szórás az értékek túlillesztésének jele lehet.

Lépések

Minta variancia számítás

  1. Jegyezze fel a mintaértékeket. A legtöbb esetben csak bizonyos populációk mintái állnak a statisztikusok rendelkezésére. Például a statisztikusok általában nem elemzik az összes oroszországi autó lakosságának fenntartásának költségeit - több ezer autóból álló véletlenszerű mintát elemeznek. Egy ilyen minta segít meghatározni az autónkénti átlagos költséget, de valószínűleg a kapott érték messze lesz a valóditól.

    • Például elemezzük, hogy egy kávézóban 6 nap alatt hány zsemle került eladott véletlenszerű sorrendben. A minta a következő formátumú: 17, 15, 23, 7, 9, 13. Ez egy minta, nem egy populáció, mert nincs adatunk a kávézó minden egyes nyitva tartási napjára eladott zsemléről.
    • Ha egy populációt kap, és nem értékek mintáját, ugorjon a következő szakaszra.
  2. Írja fel a minta variancia kiszámításának képletét! A diszperzió valamely mennyiség értékeinek terjedésének mértéke. Minél közelebb van a diszperziós érték a nullához, annál közelebb vannak az értékek csoportosításához. Ha értékek mintájával dolgozik, használja a következő képletet az eltérés kiszámításához:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) a diszperzió. A diszperziót négyzetegységben mérjük.
    • x i (\displaystyle x_(i))- minden érték a mintában.
    • x i (\displaystyle x_(i)) ki kell vonni x̅-et, négyzetre kell állítani, majd össze kell adni az eredményeket.
    • x̅ – minta átlag (minta átlag).
    • n a mintában lévő értékek száma.
  3. Számítsa ki a minta átlagát! Ezt x̅-ként jelöljük. A minta átlagát a normál számtani átlaghoz hasonlóan számítjuk ki: összeadjuk a mintában lévő összes értéket, majd az eredményt elosztjuk a mintában lévő értékek számával.

    • Példánkban adja hozzá a mintában szereplő értékeket: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Most ossza el az eredményt a mintában lévő értékek számával (példánkban 6): 84 ÷ 6 = 14.
      Mintaátlag x̅ = 14.
    • A minta átlaga az a központi érték, amely körül a mintában lévő értékek eloszlanak. Ha a mintacsoportban a minta körüli értékek átlagosak, akkor a szórás kicsi; egyébként nagy a diszperzió.
  4. Vonja le a minta átlagát a minta minden értékéből. Most számolja ki a különbséget x i (\displaystyle x_(i))- x̅, hol x i (\displaystyle x_(i))- minden érték a mintában. Minden eredmény azt jelzi, hogy egy adott érték mekkora eltérést mutat a minta átlagától, vagyis milyen messze van ez az érték a minta átlagától.

    • Példánkban:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • A kapott eredmények helyessége könnyen ellenőrizhető, mivel összegüknek nullának kell lennie. Ez az átlagérték meghatározásához kapcsolódik, mivel a negatív értékeket (az átlagértéktől a kisebb értékektől való távolságot) teljesen ellensúlyozzák a pozitív értékek (az átlagértéktől a nagyobb értékektől való távolságok).
  5. Mint fentebb említettük, a különbségek összege x i (\displaystyle x_(i))- x̅ egyenlőnek kell lennie nullával. Ez azt jelenti, hogy az átlagos szórás mindig nulla, ami nem ad fogalmat valamely mennyiség értékeinek terjedéséről. A probléma megoldásához minden különbséget négyzetre emeljen x i (\displaystyle x_(i))- x. Ez azt eredményezi, hogy csak pozitív számokat kap, amelyeket összeadva soha nem lesz 0.

    • Példánkban:
      (x 1 (\displaystyle x_(1))-x) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Megtalálta a különbség négyzetét - x̅) 2 (\displaystyle ^(2)) a minta minden egyes értékéhez.
  6. Számítsa ki a különbségek négyzetes összegét! Vagyis keresse meg a képletnek azt a részét, amely így van írva: ∑[( x i (\displaystyle x_(i))-x) 2 (\displaystyle ^(2))]. Itt a Σ előjel az egyes értékek négyzetes különbségeinek összegét jelenti x i (\displaystyle x_(i)) a mintában. Már megtalálta a négyzetes különbségeket (x i (\displaystyle (x_(i))-x) 2 (\displaystyle ^(2)) minden egyes értékhez x i (\displaystyle x_(i)) a mintában; most add hozzá ezeket a négyzeteket.

    • Példánkban: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Az eredményt osszuk el n - 1-gyel, ahol n a mintában lévő értékek száma. Néhány évvel ezelőtt a statisztikusok a minta szórásának kiszámításához egyszerűen elosztották az eredményt n-nel; ebben az esetben megkapjuk a variancia négyzetének átlagát, ami ideális egy adott minta szórásának leírására. De ne feledje, hogy bármely minta csak egy kis része az általános értékek sokaságának. Ha más mintát vesz és ugyanazokat a számításokat végzi, más eredményt kap. Mint kiderült, ha n - 1-gyel osztja (nem csak n-gyel), jobb becslést ad a sokaság szórására, amit keres. Az n - 1-gyel való osztás általánossá vált, ezért szerepel a mintavarianciát számoló képletben.

    • Példánkban a minta 6 értéket tartalmaz, azaz n = 6.
      Minta variancia = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. A szórás és a szórás különbsége. Ne feledje, hogy a képlet exponenst tartalmaz, így a variancia mérése az elemzett érték négyzetegységében történik. Néha egy ilyen értéket meglehetősen nehéz működtetni; ilyen esetekben a szórást használjuk, amely megegyezik a variancia négyzetgyökével. Ezért a minta szórását így jelöljük s 2 (\displaystyle s^(2)), és a minta szórása mint s (\displaystyle s).

    • Példánkban a minta szórása: s = √33,2 = 5,76.

    Populációs variancia számítás

    1. Elemezzen néhány értékkészletet. A készlet tartalmazza a vizsgált mennyiség összes értékét. Például, ha a leningrádi régió lakosainak életkorát tanulmányozza, akkor a lakosság tartalmazza a régió összes lakosának életkorát. Aggregátummal végzett munka esetén ajánlatos egy táblázatot létrehozni, és abba beírni az aggregátum értékeit. Tekintsük a következő példát:

      • Egy bizonyos helyiségben 6 akvárium található. Minden akvárium a következő számú halat tartalmazza:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5) = 15)
        x 6 = 18 (\displaystyle x_(6) = 18)
    2. Írja fel a populáció variancia kiszámításának képletét! Mivel a sokaság egy bizonyos mennyiség összes értékét tartalmazza, a következő képlet lehetővé teszi a sokaság szórásának pontos értékét. A statisztikusok különböző változókat használnak, hogy megkülönböztessék a populáció-varianciát a minta varianciájától (ami csak becslés):

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- populációs variancia (szigma négyzetként értelmezve). A diszperziót négyzetegységben mérjük.
      • x i (\displaystyle x_(i))- minden egyes érték az összesítésben.
      • Σ az összeg előjele. Vagyis minden értékre x i (\displaystyle x_(i)) vonja ki a μ-t, négyzetezze, majd adja össze az eredményeket.
      • μ a népesség átlaga.
      • n az értékek száma az általános sokaságban.
    3. Számítsa ki a népesség átlagát! Ha az általános populációval dolgozunk, az átlagos értékét μ-ként (mu) jelöljük. A sokaság átlagát a szokásos számtani átlagként számítjuk ki: összeadjuk a sokaság összes értékét, majd az eredményt elosztjuk a sokaság értékeinek számával.

      • Ne feledje, hogy az átlagokat nem mindig számtani átlagként számítják ki.
      • Példánkban a sokaság jelentése: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Vonja le a sokaság átlagát a sokaság minden értékéből. Minél közelebb van a különbség értéke a nullához, annál közelebb van az adott érték a sokaság átlagához. Keresse meg a különbséget a sokaság egyes értékei és az átlaga között, és először megtekintheti az értékek eloszlását.

      • Példánkban:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Négyzet alakú minden kapott eredményt. A különbségek pozitívak és negatívak is; ha ezeket az értékeket egy számegyenesbe helyezi, akkor a népesség átlagától jobbra és balra helyezkednek el. Ez nem jó a variancia számításához, mivel a pozitív és negatív számok kioltják egymást. Ezért minden különbséget négyzetre emelve, hogy kizárólag pozitív számokat kapjon.

      • Példánkban:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) minden populációértékre (i = 1-től i = 6-ig):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), ahol x n (\displaystyle x_(n)) az utolsó érték a populációban.
      • A kapott eredmények átlagértékének kiszámításához meg kell találnia az összegüket, és el kell osztania n-nel: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Most írjuk le a fenti magyarázatot változók segítségével: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n, és kapjunk egy képletet a sokaság szórásának kiszámításához.

Megoldás.

Egy valószínűségi változó értékeinek diszperziójának mértékeként használjuk diszperzió

A diszperzió (a diszperzió szó jelentése "szórás") az egy valószínűségi változó értékeinek szóródásának mértéke annak matematikai elvárásáról. A diszperzió egy valószínűségi változó matematikai elvárásától való négyzetes eltérésének matematikai elvárása

Ha a valószínűségi változó diszkrét végtelen, de megszámlálható értékkészlettel, akkor

ha az egyenlőség jobb oldalán lévő sorozatok összefolynak.

Diszperziós tulajdonságok.

  • 1. Egy állandó érték szórása nulla
  • 2. A valószínűségi változók összegének szórása egyenlő a szórások összegével
  • 3. A variancia négyzetének előjeléből kivehető egy állandó tényező

A valószínűségi változók különbségének szórása egyenlő a szórások összegével

Ez a tulajdonság a második és harmadik tulajdonság következménye. Az eltérések csak összeadhatók.

A variancia kényelmesen kiszámítható egy képlettel, amely könnyen meghatározható a variancia tulajdonságaival

A diszperzió mindig pozitív.

A diszperziónak van dimenzió magának a valószínűségi változónak a dimenziójának négyzete, ami nem mindig kényelmes. Ezért a mennyiség

Szórás Egy valószínűségi változó (szórás vagy standard) szórásának négyzetgyökének aritmetikai értékének nevezzük.

Dobj két érmét 2 és 5 rubel címletben. Ha az érmére esik a címer, akkor nulla pont jár, ha pedig szám, akkor az érme értékével megegyező számú pont jár. Határozza meg a pontok számának matematikai elvárását és szórását!

Megoldás. Először keressük meg az X valószínűségi változó eloszlását - a pontok számát. Minden kombináció - (2; 5), (2; 0), (0; 5), (0; 0) - egyformán valószínű, és az eloszlási törvény:

Várható érték:

A diszperziót a képlet alapján találjuk meg

miért számoljuk

2. példa

Ismeretlen valószínűség keresése R, egy valószínűségi eloszlási táblázat által megadott diszkrét valószínűségi változó matematikai elvárása és szórása

Megtaláljuk a matematikai elvárást és szórást:

M(x) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

A diszperzió kiszámításához a (19.4) képletet használjuk.

D(x) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

3. példa Két egyenrangú atléta rendez egy tornát, amely vagy egyikük első győzelméig, vagy öt mérkőzés lejátszásáig tart. Annak a valószínűsége, hogy egy-egy játékban nyer, mindegyik sportoló esetében 0,3, a döntetlen esélye pedig 0,4. Keresse meg az elosztási törvényt, a lejátszott játékok számának matematikai elvárását és szórását.

Megoldás. Véletlenszerű érték x- a lejátszott játékok száma 1-től 5-ig terjed, azaz.

Határozzuk meg a meccs végének valószínűségét. A mérkőzés az első szettben ér véget, ha valamelyik sportoló nyer. A nyerési valószínűség az

R(1) = 0,3+0,3 =0,6.

Ha döntetlen született (a döntetlen valószínűsége 1 - 0,6 = 0,4), akkor a mérkőzés folytatódik. A mérkőzés a második játszmában ér véget, ha az első döntetlen lett, és valaki megnyerte a másodikat. Valószínűség

R(2) = 0,4 0,6=0,24.

Hasonlóképpen, a mérkőzés a harmadik játszmában ér véget, ha egymás után két döntetlen van, és ismét valaki nyer

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Bármely változatban az ötödik fél az utolsó.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Foglaljunk össze mindent egy táblázatban. A "nyert játékok száma" valószínűségi változó eloszlási törvénye a következő formában van

Várható érték

A diszperziót a (19.4) képlettel számítjuk ki.

Szabványos diszkrét eloszlások.

Binomiális eloszlás. Valósítsuk meg a Bernoulli kísérleti sémát: n azonos független kísérletek, amelyek mindegyikében egy-egy esemény Aállandó valószínűséggel megjelenhet pés nem nagy valószínűséggel fog megjelenni

(lásd a 18. előadást).

Az esemény előfordulásának száma A ezekben n kísérletekben van egy diszkrét valószínűségi változó x, melynek lehetséges értékei:

0; 1; 2; ... ;m; ... ; n.

Megjelenési valószínűség m események A egy adott sorozatban től n Az ilyen valószínűségi változók kísérletei és eloszlási törvénye a Bernoulli-formulával van megadva (lásd a 18. előadást)

Valószínűségi változó numerikus jellemzői x binomiális törvény szerint elosztva:

Ha egy n nagy (), akkor, at, a (19.6) formula bekerül a képletbe

és a táblázatos Gauss-függvény (a Gauss-függvény értéktáblázata a 18. előadás végén található).

A gyakorlatban gyakran nem maga a valószínűség a fontos. m eseményeket A egy adott sorozatban n tapasztalatok, és annak valószínűsége, hogy az esemény DE legalább megjelenik

alkalommal és nem több alkalommal, azaz annak a valószínűsége, hogy X felveszi az értékeket

Ehhez össze kell adnunk a valószínűségeket

Ha egy n nagy (), akkor, at, a (19.9) képlet átmegy a közelítő képletbe

táblázatos függvény. A táblázatok a 18. előadás végén találhatók.

A táblázatok használatakor ne feledje, hogy

1. példa. Az autó a kereszteződéshez közeledve a három út bármelyikén haladhat tovább: A, B vagy C, azonos valószínűséggel. Öt autó közeledik a kereszteződéshez. Határozza meg az A úton közlekedő autók átlagos számát és annak a valószínűségét, hogy három autó megy a B úton.

Megoldás. Az egyes utakon elhaladó autók száma egy valószínűségi változó. Ha feltételezzük, hogy a kereszteződéshez közeledő összes autó egymástól függetlenül tesz meg utat, akkor ez a valószínűségi változó a binomiális törvény szerint eloszlik

n= 5 és p = .

Ezért az A utat követő autók átlagos száma a (19.7) képlet szerint alakul.

és a kívánt valószínűség at

2. példa Az eszköz meghibásodásának valószínűsége minden tesztben 0,1. A készüléken 60 tesztet végeznek. Mennyi annak a valószínűsége, hogy a készülék meghibásodik: a) 15-ször; b) legfeljebb 15-ször?

a. Mivel a tesztek száma 60, a (19.8) képletet használjuk.

A 18. előadás mellékletének 1. táblázata szerint azt találjuk

b. A (19.10) képletet használjuk.

A 18. előadás mellékletének 2. táblázata szerint

  • - 0,495
  • 0,49995

Poisson-eloszlás) ritka jelenségek törvénye). Ha egy n nagyszerű, és R kevés (), míg a termék stb.állandó értéket tart, amit l-el jelölünk,

akkor a (19.6) képlet átmegy a Poisson-képletbe

A Poisson-eloszlási törvény formája a következő:

Nyilvánvalóan helyes a Poisson-törvény meghatározása, mert az elosztási sorozat fő tulajdonsága

teljesült, mert sor összege

A függvénysorozat bővítése zárójelben a következőhöz van írva

Tétel. A Poisson-törvény szerinti eloszlású valószínűségi változó matematikai elvárása és szórása egybeesik és egyenlő ennek a törvénynek a paraméterével, azaz.

Bizonyíték.

Példa. Termékeinek piaci népszerűsítése érdekében a cég szórólapokat helyez el a postaládákba. A korábbi tapasztalatok azt mutatják, hogy 2000-ből körülbelül egy esetben következik a megrendelés. Határozza meg annak valószínűségét, hogy 10 000 szórólap feladása után legalább egy rendelés érkezik, a beérkezett rendelések átlagos számát és a beérkezett rendelések számának szórását!

Megoldás. Itt

Annak a valószínűségét, hogy legalább egy rendelés megérkezik, az ellenkező esemény valószínűségén keresztül találjuk meg, pl.

Véletlenszerű eseményfolyam. Az eseményfolyam véletlenszerű időpontokban bekövetkező események sorozata. Tipikus példák az adatfolyamokra a számítógépes hálózatok meghibásodásai, a telefonközpontokon történő hívások, a berendezésjavítási kérelmek áramlása stb.

Folyam eseményeknek nevezzük helyhez kötött, ha annak a valószínűsége, hogy egy hosszúságú időintervallumon egy vagy több esemény eltalál, csak az intervallum hosszától függ, és nem függ attól, hogy az időintervallum hol helyezkedik el az időtengelyen.

A stacionaritási feltételt az alkalmazások áramlása teljesíti, amelyek valószínűségi jellemzői nem függnek az időtől. A stacionárius áramlást különösen állandó sűrűség jellemzi (időegységenkénti kérések átlagos száma). A gyakorlatban gyakran vannak olyan alkalmazások, amelyek (legalábbis korlátozott ideig) állónak tekinthetők. Például egy városi telefonközpont 12 és 13 óra közötti hívásfolyama állónak tekinthető. Az egész napos áramlás már nem tekinthető állónak (éjszaka a hívások sűrűsége jóval kisebb, mint nappal).

Folyam az eseményeket folyamnak nevezzük hatás nélkül, ha bármely nem átfedő időszegmensnél az egyikre eső események száma nem függ a többire eső események számától.

Az utóhatás nélküli feltétel, ami a legegyszerűbb áramlásnál a legjelentősebb, azt jelenti, hogy a követelések egymástól függetlenül kerülnek be a rendszerbe. Például a metróállomásra belépő utasok áramlása utóhatás nélküli áramlásnak tekinthető, mivel azok az okok, amelyek az adott pillanatban egy utas érkezését okozták, nem pedig egy másik utas érkezését, általában nem kapcsolódnak más utasokhoz. utasok. Az utóhatás hiányának feltétele azonban könnyen megsérthető az ilyen függőség megjelenése miatt. Például a metróállomásról kilépő utasok áramlása már nem tekinthető utóhatás nélküli áramlásnak, hiszen az ugyanazon vonattal érkező utasok kiszállási ideje egymástól függ.

Folyam eseményeknek nevezzük rendes, ha egy kis t időintervallumban két vagy több esemény eltalálásának valószínűsége elhanyagolható ahhoz képest, hogy egy eseményt eltalál (ebben a vonatkozásban a Poisson-törvényt a ritka események törvényének nevezzük).

A rendességi feltétel azt jelenti, hogy az alkalmazások egyenként érkeznek, nem pedig párban, hármasban stb. variancia eltérés Bernoulli eloszlás

Például a fodrászatba belépő vásárlók áramlása szinte hétköznapinak tekinthető. Ha egy rendkívüli áramlásban az alkalmazások csak párban jönnek, csak hármasban stb., akkor a rendkívüli áramlás könnyen redukálható egy közönségesre; ehhez elég az egyes alkalmazások folyama helyett a párok, hármasok stb. áramlását figyelembe venni. Nehezebb lesz, ha minden alkalmazás véletlenszerűen dupla, hármas stb. nem homogén, hanem heterogén események folyamával foglalkozik.

Ha az események folyamának mindhárom tulajdonsága van (azaz stacionárius, közönséges és nincs utóhatása), akkor a legegyszerűbb (vagy stacionárius) Poisson-folyamatnak nevezzük. A "Poisson" elnevezés annak a ténynek köszönhető, hogy a fenti feltételek mellett a tetszőleges fix időintervallumra eső események száma felosztásra kerül. Poisson törvénye

Itt látható az események átlagos száma A időegység alatt megjelenő.

Ez a törvény egyparaméteres, azaz. csak egy paraméter ismerete szükséges. Megmutatható, hogy a Poisson-törvény matematikai elvárása és szórása számszerűen egyenlő:

Példa. Legyen a munkanap közepén az átlagos kérések száma 2 másodpercenként. Mennyi annak a valószínűsége, hogy 1) egy másodperc alatt nem érkezik kérés, 2) 10 kérés érkezik két másodpercen belül?

Megoldás. Mivel a Poisson-törvény alkalmazásának érvényessége nem kétséges, és paramétere be van állítva (= 2), a feladat megoldása a (19.11) Poisson-formula alkalmazására redukálódik.

1) t = 1, m = 0:

2) t = 2, m = 10:

A nagy számok törvénye. Annak a ténynek a matematikai alapja, hogy egy valószínűségi változó értékeit néhány állandó érték köré csoportosítják, a nagy számok törvénye.

Történelmileg a nagy számok törvényének első megfogalmazása Bernoulli tétele volt:

"Az azonos és független kísérletek n számának korlátlan növekedésével az A esemény előfordulási gyakorisága valószínűségében konvergál a valószínűségéhez", azaz.

hol van az A esemény előfordulási gyakorisága n kísérletben,

A (19.10) kifejezés jelentését tekintve azt jelenti, hogy nagy számú kísérlet mellett egy esemény előfordulási gyakorisága A helyettesítheti ennek az eseménynek az ismeretlen valószínűségét, és minél több a kísérlet, annál közelebb van p* p-hez. Érdekes történelmi tény. K. Pearson 12000-szer dobott érmét, címere pedig 6019-szer esett le (0,5016-os gyakoriság). Ugyanazon érme 24 000-szeri dobásakor 12 012 cseppet kapott a címerből, i.e. frekvencia 0,5005.

A nagy számok törvényének legfontosabb formája Csebisev tétele: a függetlenek számának korlátlan növekedésével, véges varianciával és azonos kísérleti körülmények között, egy valószínűségi változó megfigyelt értékeinek számtani átlaga valószínűség szerint konvergál a matematikai elvárásaihoz.. Analitikus formában ez a tétel a következőképpen írható fel:

Csebisev tételének alapvető elméleti jelentősége mellett fontos gyakorlati alkalmazása is van, például a méréselméletben. Valamelyik mennyiség n mérése után x, különböző nem egyező értékeket kap x 1, x 2, ..., xn. A mért érték közelítő értékéhez x vegyük a megfigyelt értékek számtani átlagát

ahol, minél több kísérletet végeznek, annál pontosabb lesz az eredmény. Az a tény, hogy az érték szórása az elvégzett kísérletek számának növekedésével csökken, hiszen

D(x 1) = D(x 2)=…= D(xn) D(x) , akkor

A (19.13) összefüggés azt mutatja, hogy a mérőműszerek nagy pontatlansága (nagy érték) mellett is a mérések számának növelésével tetszőlegesen nagy pontosságú eredményt lehet kapni.

A (19.10) képlet segítségével meghatározható annak a valószínűsége, hogy a statisztikai gyakoriság legfeljebb annyival tér el a valószínűségtől, mint

Példa. Egy esemény valószínűsége minden kísérletben 0,4. Hány tesztet kell elvégezni ahhoz, hogy legalább 0,8 valószínűséggel számítsuk arra, hogy egy esemény relatív gyakorisága 0,01-nél kisebb valószínűségi modultól eltér?

Megoldás. A (19.14) képlet szerint

ezért a táblázat szerint két alkalmazás létezik

Következésképpen, n 3932.

Számoljunk beleKISASSZONYEXCELa minta szórása és szórása. Kiszámítjuk egy valószínűségi változó varianciáját is, ha ismert az eloszlása.

Először fontolja meg diszperzió, akkor szórás.

Minta szórása

Minta szórása (minta varianciája,mintavariancia) jellemzi az értékek terjedését a tömbben ehhez képest.

Mind a 3 képlet matematikailag egyenértékű.

Az első képletből látható, hogy minta variancia a tömbben lévő egyes értékek négyzetes eltéréseinek összege az átlagtól osztva a minta méretével mínusz 1-gyel.

diszperzió minták a DISP() függvényt használjuk, eng. a VAR neve, i.e. Variancia. Az MS EXCEL 2010 óta ajánlott analóg DISP.V() , eng. a VARS név, i.e. Minta variancia. Ezen kívül az MS EXCEL 2010 verziótól kezdve van egy DISP.G () függvény, eng. VARP név, i.e. Population VARIance amely kiszámítja diszperzió számára népesség. Az egész különbség a nevezőben rejlik: n-1 helyett, mint például a DISP.V() , a DISP.G() csak n-et tartalmaz a nevezőben. Az MS EXCEL 2010 előtt a VARP() függvényt használták a populációs variancia kiszámításához.

Minta szórása
=NÉGYZET(Minta)/(COUNT(minta)-1)
=(SUMSQ(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/ (COUNT(Sample)-1)- a szokásos képlet
=SZUM((Minta -ÁTLAG(Minta))^2)/ (COUNT(minta)-1) –

Minta szórása csak akkor egyenlő 0-val, ha minden érték egyenlő egymással, és ennek megfelelően egyenlők középérték. Általában minél nagyobb az érték diszperzió, annál nagyobb az értékek terjedése a tömbben.

Minta szórása egy pontbecslés diszperzió a valószínűségi változó eloszlása, amelyből a minta. Az építkezésről konfidencia intervallumokértékelésekor diszperzió a cikkben olvasható.

Valószínűségi változó varianciája

Számolni diszperzió véletlen változó, ismernie kell.

Mert diszperzió Az X valószínűségi változó gyakran használja a Var(X) jelölést. Diszperzió egyenlő az E(X) átlagtól való eltérés négyzetével: Var(X)=E[(X-E(X)) 2 ]

diszperzió képlettel számolva:

ahol x i az az érték, amelyet a valószínűségi változó felvehet, és μ az átlagos érték (), р(x) annak a valószínűsége, hogy a valószínűségi változó felveheti az x értéket.

Ha a valószínűségi változó rendelkezik , akkor diszperzió képlettel számolva:

Dimenzió diszperzió az eredeti értékek mértékegységének négyzetének felel meg. Például, ha a mintában szereplő értékek az alkatrész tömegének mérései (kg-ban), akkor a szórás dimenziója kg 2 lenne. Ez nehezen értelmezhető, ezért az értékek terjedésének jellemzése, a négyzetgyökével egyenlő érték diszperziószórás.

Néhány ingatlan diszperzió:

Var(X+a)=Var(X), ahol X egy valószínűségi változó, a pedig egy állandó.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ezt a diszperziós tulajdonságot használják cikk a lineáris regresszióról.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), ahol X és Y valószínűségi változók, Cov(X;Y) ezeknek a valószínűségi változóknak a kovarianciája.

Ha a valószínűségi változók függetlenek, akkor azok kovarianciaértéke 0, és ezért Var(X+Y)=Var(X)+Var(Y). A variancia ezen tulajdonságát használjuk a kimenetben.

Mutassuk meg, hogy független mennyiségekre Var(X-Y)=Var(X+Y). Valójában Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). A variancia ezen tulajdonságát használjuk az ábrázoláshoz.

Minta szórása

Minta szórása azt méri, hogy a mintában lévő értékek milyen széles körben vannak szórva a saját értékükhöz képest.

Definíció szerint, szórás egyenlő a négyzetgyökével diszperzió:

Szórás nem veszi figyelembe az értékek nagyságát mintavétel, hanem csak a körülöttük lévő értékek szórásának mértéke középső. Vegyünk egy példát ennek illusztrálására.

Számítsuk ki 2 minta szórását: (1; 5; 9) és (1001; 1005; 1009). Mindkét esetben s=4. Nyilvánvaló, hogy a szórás és a tömb értékeinek aránya jelentősen eltér a mintákban. Ilyen esetekben használja A variációs együttható(Variációs együttható, CV) - arány szórás az átlaghoz számtan százalékban kifejezve.

Az MS EXCEL 2007 és korábbi verzióiban a számításhoz Minta szórása az =STDEV() függvényt használjuk, eng. a STDEV elnevezés, i.e. szórás. Az MS EXCEL 2010 óta ajánlott analógját használni = STDEV.B () , eng. név STDEV.S, i.e. Minta szabványeltérés.

Ezen kívül az MS EXCEL 2010 verziótól kezdve van egy STDEV.G () , eng funkció. név STDEV.P, i.e. Population Standard ELÉRÉS, amely kiszámítja szórás számára népesség. Az egész különbség a nevezőben rejlik: n-1 helyett, mint az STDEV.V() , STDEV.G() csak n-et tartalmaz a nevezőben.

Szórás közvetlenül is kiszámítható az alábbi képletekből (lásd a példafájlt)
=SQRT(SQUADROTIV(Sample)/(COUNT(Sample)-1))
=SQRT((ÖSSZEG(Minta)-SZÁM(Minta)*ÁTLAG(Minta)^2)/(SZÁM(Minta)-1))

Egyéb diszperziós intézkedések

A SQUADRIVE() függvény a következővel számol az értékektől való négyzetes eltérések umm-a középső. Ez a függvény ugyanazt az eredményt adja vissza, mint a =VAR.G( Minta)*JELÖLJE BE( Minta) , ahol Minta- hivatkozás egy mintaértékek tömbjét tartalmazó tartományra (). A QUADROTIV() függvényben a számítások a következő képlet szerint készülnek:

A SROOT() függvény egyben egy adathalmaz szórásának mértéke is. A SIROTL() függvény kiszámítja az értékektől való eltérések abszolút értékeinek átlagát középső. Ez a függvény ugyanazt az eredményt adja vissza, mint a képlet =ÖSSZEG(ABS(Minta-ÁTLAG(Minta)))/SZÁM(Minta), ahol Minta- hivatkozás egy mintaértékek tömbjét tartalmazó tartományra.

A SROOTKL () függvény számításait a következő képlet szerint végezzük: