Változatos sorok. átlagos értékek

Paraméter neve Jelentése
Cikk tárgya: Variációs sorozat
Rubrika (tematikus kategória) Termelés

Egy valószínűségi változó megfigyelt értékei x 1 , x 2 , …, x k hívott lehetőségek.

Frekvencia lehetőségek x számnak hívnak n i (én=1,…,k) megmutatja, hogy ez a változat hányszor fordul elő a mintában.

Frekvencia(relatív gyakoriság, részvények) opciók x i (én=1,…,k) frekvenciájának arányának szokták nevezni n i a minta méretéhez n.

A frekvenciákat és a frekvenciákat ún Mérleg.

Felhalmozott frekvencia az opciók számát szokás hívni, amelyek értéke kisebb az adottnál x:

Felhalmozott frekvencia A felhalmozott gyakoriság és a mintaméret arányát szokás nevezni:

variációs sorozat(statisztikai sorozat) - szokás hívni a növekvő sorrendben írt opciók sorozatát és a hozzájuk tartozó súlyokat.

A variációs sorozat legyen diszkrét(egy diszkrét valószínűségi változó értékeinek mintája) és folyamatos (intervallum)(folyamatos valószínűségi változó értékeinek kiválasztása).

A diszkrét variációs sorozat alakja:

Ha az opciók száma nagy, vagy a jellemző folyamatos (egy valószínűségi változó tetszőleges értéket vehet fel egy bizonyos intervallumon belül), akkor intervallum variációs sorozat.

Intervallumvariációs sorozat felépítéséhez hajtsa végre csoportosítás opció - külön intervallumokra vannak osztva:

Az intervallumok számát néha a segítségével határozzák meg Sturges képletek:

Ezután kiszámítjuk az egyes intervallumokba eső változatok számát - gyakoriságokat n i(vagy gyakoriság n i/n). Ha a változat az intervallum határán van, akkor a megfelelő intervallumhoz kapcsolódik.

Az intervallumvariációs sorozatnak van formája:

Lehetőségek
Frekvenciák

Empirikus (statisztikai) eloszlásfüggvény olyan függvényt szokás hívni, amelynek értéke a pontban x egyenlő azzal a relatív gyakorisággal, amelynél a változat kisebb értéket vesz fel x(halmozott gyakoriság a x):

Frekvencia sokszög vonalláncnak nevezzük, melynek szakaszai pontokat kapcsolnak össze koordinátákkal ( x 1 ; n 1), (x 2 ; n 2), …, (x k; nk). Az frekvencia sokszög, amely az eloszlások sokszögének statisztikai analógja.

Érdemes elmondani, hogy folytonos variációs sorozathoz sokszöget lehet építeni, ha az értékeket x 1 , x 2 , …, x k vegyük az intervallumok felezőpontját.

Az intervallumvariáció sorozatokat általában grafikusan ábrázolják a segítségével hisztogramok.

oszlopdiagram- lépcsőzetes alakzat, amely téglalapokból áll, amelyek alapjai részhosszúságú intervallumok h= x i +1 – x i, én= 0,…,k-1, és a magasságok megegyeznek az intervallumok frekvenciáival (vagy frekvenciáival). n i (w i).

Összesített(kumulatív görbe) - a felhalmozott frekvenciák (frekvenciák) görbéje. Mert diszkrét sorozat a kumulátum a pontokat vagy , pontokat összekötő szaggatott vonal. Mert intervallum sorozat kumulátum abból a pontból indul ki, amelynek abszcisszája egyenlő az első intervallum kezdetével, az ordináta pedig a nullával egyenlő halmozott frekvencia (frekvencia). Ennek a szaggatott vonalnak a többi pontja megfelel az intervallumok végeinek.

Variációs sorozat - koncepció és típusok. A "Variációs sorozat" kategória besorolása és jellemzői 2017, 2018.

  • - Elosztási variációs sorozat

    A kiskereskedelmi forgalom megoszlása ​​az Orosz Föderációban 1995-ben a tulajdon típusa szerint, millió rubel Terjesztési sorozatok típusai Előadás VIII. Eloszlási sorozatok A primer statisztikai adatok feldolgozása és rendszerezése eredményeként ....


  • - Variációs sorozat

    A statisztikai adatok legegyszerűbb átalakítása a nagyságrend szerinti rendezés. Mintanagyság az általános sokaságból, az elemek nem csökkenő sorrendjében rendezve, i.e. , variációs sorozatnak nevezzük: . Abban az esetben, ha a megfigyelések mennyisége ... .


  • - 2. feladat Intervallum variációs sorozat

    1. A feladatváltozatnak megfelelő adott minta alapján készítsen intervallumvariáció-sort; hisztogramot készít és kumulál (két módszert használjon: Excel diagram beszúrása és az "Adatelemzés" csomag "Hisztogram" módja). 2. Elemezze a kapott hisztogramot. ... .


  • - Állítson össze variációs sorozatot bármely azonos korú növény babmagjának vagy levelének tulajdonságának változékonyságáról! Fedezze fel a tulajdonságok változékonyságának mintáit.

    A populáció egy faj szerkezeti egysége. A populációk száma. A népességingadozás okai. Az egyedek kapcsolata a populációkban és az azonos és a különböző fajok különböző populációi között. 1. Egy faj fontos jellemzője a csoportokban, populációkban való eloszlása ​​a ...

  • Variációs sorozatok: meghatározás, típusok, főbb jellemzők. Számítási módszer
    divat, medián, számtani átlag az orvosi és statisztikai tanulmányokban
    (Mutasd feltételes példán).

    A variációs sorozat a vizsgált tulajdonság számértékeinek sorozata, amelyek nagyságukban különböznek egymástól, és egy bizonyos sorrendben vannak elrendezve (növekvő vagy csökkenő sorrendben). A sorozat minden egyes számértékét változatnak (V) nevezzük, és azokat a számokat, amelyek azt mutatják, hogy ez vagy az a változat milyen gyakran fordul elő ennek a sorozatnak az összetételében, gyakoriságnak (p).

    Az összes megfigyelési esetszámot, amelyből a variációs sorozat áll, n betűvel jelöljük. A vizsgált jellemzők jelentésének különbségét variációnak nevezzük. Ha a változó előjelnek nincs mennyiségi mérőszáma, akkor a változást kvalitatívnak, az eloszlási sorozatot pedig attribútumnak (például betegség kimenetel, egészségi állapot stb. szerinti megoszlás) nevezzük.

    Ha egy változójelnek kvantitatív kifejezése van, akkor az ilyen variációt kvantitatívnak, az eloszlássorozatot pedig variációsnak nevezzük.

    A variációs sorozatokat nem folytonosra és folyamatosra - a mennyiségi tulajdonság jellege szerint, egyszerűre és súlyozottra - osztják a változat előfordulási gyakorisága szerint.

    Egy egyszerű variációs sorozatban minden változat csak egyszer fordul elő (p=1), egy súlyozottban ugyanaz a változat többször (p>1). Az ilyen sorozatok példáit a szöveg későbbi részében tárgyaljuk. Ha a mennyiségi attribútum folytonos, pl. Az egész értékek között vannak köztes törtértékek, a variációs sorozatot folytonosnak nevezzük.

    Például: 10,0 - 11,9

    14,0 - 15,9 stb.

    Ha a mennyiségi előjel nem folytonos, pl. egyedi értékei (opciói) egész számmal különböznek egymástól, és nincsenek közbenső törtértékei, a variációs sorozatot nem folytonosnak vagy diszkrétnek nevezik.

    Az előző példa adatainak felhasználása a pulzusszámról

    21 tanuló számára változatsort építünk (1. táblázat).

    Asztal 1

    Az orvostanhallgatók pulzusszám szerinti megoszlása ​​(bpm)

    Így egy variációs sorozat felépítése a meglévő számértékek (opciók) rendszerezését, racionalizálását jelenti, pl. meghatározott sorrendbe (növekvő vagy csökkenő sorrendbe) rendezik a hozzájuk tartozó frekvenciákkal. A vizsgált példában az opciók növekvő sorrendben vannak elrendezve, és nem folytonos (diszkrét) egész számokként vannak kifejezve, minden opció többször előfordul, pl. súlyozott, nem folytonos vagy diszkrét variációs sorozattal van dolgunk.

    Általános szabály, hogy ha az általunk vizsgált statisztikai sokaságban a megfigyelések száma nem haladja meg a 30-at, akkor elegendő a vizsgált tulajdonság összes értékét variációs sorozatba rendezni, növekvő sorrendben, a táblázat szerint. 1, vagy csökkenő sorrendben.

    Nagy számú megfigyelés esetén (n>30) az előforduló változatok száma igen nagy lehet, ilyenkor intervallumot vagy csoportos variációs sorozatot állítanak össze, amelyben a későbbi feldolgozás egyszerűsítése és az eloszlás jellegének tisztázása érdekében a változatait csoportokba vonjuk.

    Általában a csoportlehetőségek száma 8 és 15 között van.

    Legalább 5-nek kell lennie, mert. ellenkező esetben túl durva, túlzott nagyítás lesz, ami torzítja a szórás összképet és nagyban befolyásolja az átlagértékek pontosságát. Ha a csoportopciók száma meghaladja a 20-25-öt, az átlagértékek kiszámításának pontossága növekszik, de a jellemzővariáció jellemzői jelentősen torzulnak, és bonyolultabbá válik a matematikai feldolgozás.

    A csoportosított sorozat összeállításakor figyelembe kell venni

    − a változatcsoportokat meghatározott sorrendbe kell helyezni (növekvő vagy csökkenő);

    - a változatcsoportok intervallumainak azonosaknak kell lenniük;

    − az intervallumok határainak értékei nem eshetnek egybe, mert nem lesz világos, hogy mely csoportokhoz rendeljünk egyedi opciókat;

    - az intervallumok határainak meghatározásakor figyelembe kell venni az összegyűjtött anyag minőségi jellemzőit (például felnőttek súlyának tanulmányozásakor 3-4 kg-os intervallum elfogadható, gyermekeknél az első hónapokban élettartama nem haladhatja meg a 100 g-ot.)

    Készítsünk csoportos (intervallum) sorozatot, amely 55 orvostanhallgató vizsga előtti pulzusszámának (percenkénti ütésszámának) adatait jellemzi: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    Csoportosított sorozat létrehozásához a következőkre lesz szüksége:

    1. Határozza meg az intervallum értékét;

    2. Határozza meg a variációs sorozat változatának csoportjainak közepét, elejét és végét!

    ● Az (i) intervallum értékét a várható csoportok száma (r) határozza meg, amelyek számát a megfigyelések számától függően (n) egy speciális táblázat alapján állítjuk be.

    Csoportok száma a megfigyelések számától függően:

    Esetünkben 55 tanuló esetén 8-10 csoport kialakítására van lehetőség.

    Az (i) intervallum értékét a következő képlet határozza meg:

    i = Vmax-Vmin/r

    Példánkban az intervallum értéke 82-58/8= 3.

    Ha az intervallum értéke tört szám, akkor az eredményt egész számra kell kerekíteni.

    Többféle átlag létezik:

    ● számtani átlag,

    ● geometriai átlag,

    ● harmonikus átlag,

    ● négyzetes középérték,

    ● közepesen progresszív,

    ● medián

    Az orvosi statisztikákban leggyakrabban számtani átlagokat használnak.

    A számtani átlag (M) egy általánosító érték, amely meghatározza azt a tipikus értéket, amely a teljes sokaságra jellemző. Az M kiszámításának fő módszerei: a számtani átlag módszere és a nyomatékok (feltételes eltérések) módszere.

    Az egyszerű számtani átlag és a súlyozott számtani átlag kiszámításához az aritmetikai átlag módszerét használják. A számtani középérték számítási módszerének megválasztása a variációs sorozat típusától függ. Egy egyszerű variációs sorozat esetén, amelyben minden változat csak egyszer fordul elő, az egyszerű számtani átlagot a következő képlet határozza meg:

    ahol: М – számtani középérték;

    V a változó jellemző értéke (opciók);

    Σ - a cselekvést jelzi - összegzés;

    n a megfigyelések teljes száma.

    Egy példa a számtani átlag kiszámítására egyszerű. Légzési frekvencia (percenkénti légvételek száma) 9 35 éves férfinál: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    A 35 éves férfiak légzésszámának átlagos szintjének meghatározásához szükséges:

    1. Készítsünk egy variációs sorozatot, minden opciót növekvő vagy csökkenő sorrendbe helyezve.Egy egyszerű variációs sorozatot kaptunk, mert variánsértékek csak egyszer fordulnak elő.

    M = ∑V/n = 171/9 = 19 légzés percenként

    Következtetés. A 35 éves férfiak légzésszáma átlagosan 19 légzés/perc.

    Ha egy változat egyedi értékei ismétlődnek, nem kell minden változatot egy sorban kiírni, elég felsorolni az előforduló változatok méretét (V) és mellette feltüntetni az ismétlődések számát (p ). egy ilyen variációs sorozatot, amelyben a változatok mintegy súlyozva vannak a hozzájuk tartozó gyakoriságok száma szerint, súlyozott variációs sorozatnak nevezzük, a számított átlagérték pedig a számtani súlyozott átlag.

    A számtani súlyozott átlagot a következő képlet határozza meg: M= ∑Vp/n

    ahol n a megfigyelések száma megegyezik a gyakoriságok összegével - Σr.

    Példa a számtani súlyozott átlag kiszámítására.

    A rokkantság időtartama (napokban) 35 helyi orvos által kezelt akut légúti megbetegedésben (ARI) szenvedő betegnél a tárgyév első negyedévében: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 nap.

    Az akut légúti fertőzésben szenvedő betegek rokkantságának átlagos időtartamának meghatározásának módszertana a következő:

    1. Építsünk súlyozott variációs sorozatot, mert az egyes változatértékek többször megismétlődnek. Ehhez az összes opciót növekvő vagy csökkenő sorrendbe rendezheti a megfelelő frekvenciákkal.

    Esetünkben a lehetőségek növekvő sorrendben vannak.

    2. Számítsa ki az aritmetikai súlyozott átlagot a következő képlet segítségével: M = ∑Vp/n = 233/35 = 6,7 nap

    Az akut légúti fertőzésben szenvedők megoszlása ​​a rokkantság időtartama szerint:

    A keresőképtelenség időtartama (V) Betegek száma (p) vp
    ∑p = n = 35 ∑Vp = 233

    Következtetés. Az akut légúti betegségben szenvedő betegek rokkantságának időtartama átlagosan 6,7 nap volt.

    A mód (Mo) a variációs sorozat leggyakoribb változata. A táblázatban bemutatott eloszlás esetében a mód a 10-es változatnak felel meg, gyakrabban fordul elő, mint mások - 6-szor.

    A betegek megoszlása ​​a kórházi ágyban töltött idő szerint (napokban)

    V
    p

    Néha nehéz meghatározni a módus pontos értékét, mivel a vizsgált adatokban több „leggyakrabban” előforduló megfigyelés is szerepelhet.

    A medián (Me) egy nem paraméteres mutató, amely a variációs sorozatot két egyenlő felére osztja: ugyanannyi opció található a medián mindkét oldalán.

    Például a táblázatban látható eloszlás esetén a medián 10, mert ennek az értéknek mindkét oldalán a 14. opción található, azaz. a 10-es szám központi helyet foglal el ebben a sorozatban, és a mediánja.

    Tekintettel arra, hogy ebben a példában a megfigyelések száma páros (n=34), a medián a következőképpen határozható meg:

    én = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    Ez azt jelenti, hogy a sorozat közepe a tizenhetedik opcióra esik, ami 10-es mediánnak felel meg. A táblázatban bemutatott eloszlásnál a számtani átlag:

    M = ∑Vp/n = 334/34 = 10,1

    Tehát 34 megfigyeléshez a táblázatból. 8, kaptuk: Mo=10, Me=10, a számtani átlag (M) 10,1. Példánkban mindhárom mutató egyenlőnek vagy egymáshoz közelinek bizonyult, bár teljesen eltérőek.

    A számtani átlag az összes hatás eredő összege, kialakításában kivétel nélkül minden opció részt vesz, beleértve a szélsőségeseket is, amelyek gyakran atipikusak egy adott jelenségre vagy halmazra.

    A módusz és a medián, ellentétben a számtani átlaggal, nem függ a változó attribútum összes egyedi értékének értékétől (a szélső változatok értékei és a sorozat szórásának mértéke). A számtani átlag a megfigyelések teljes tömegét jellemzi, a módus és a medián a tömeget.

    1. gyakorlat

    VÁLTOZATOS FORGALMAZÁSSOR

    variációs sorozat vagy elosztás közelében a népességi egységek rendezett eloszlásának nevezzük az attribútum növekvő (gyakrabban) vagy csökkenő (ritkábban) értékei szerint, és megszámolja az egységek számát az attribútum egyik vagy másik értékével.

    3 van kedves elosztási tartomány:

    1) rangsorolt ​​sor- ez a populáció egyes egységeinek listája a vizsgált tulajdonság szerint növekvő sorrendben; ha a populációs egységek száma elég nagy, akkor a rangsorolás nehézkessé válik, és ilyen esetekben az eloszlási sorozatot úgy állítjuk össze, hogy a populációs egységeket a vizsgált tulajdonság értékei szerint csoportosítjuk (ha a tulajdonság kis számot vesz fel értékekből, akkor diszkrét sorozatot állítunk elő, egyébként pedig intervallumsorozatot);

    2) diszkrét sorozat- ez egy két oszlopból (sorból) álló táblázat - egy változó attribútum specifikus értékei x énés a jellemző adott értékével rendelkező populációs egységek száma f én– frekvenciák; a csoportok számát egy diszkrét sorozatban a változó attribútum ténylegesen meglévő értékeinek száma határozza meg;

    3) intervallum sorozat- ez egy táblázat két oszlopból (sorból) - változó előjelű intervallumokból x énés az adott intervallumba eső populációs egységek száma (gyakoriságok), vagy ennek a számnak az összes populációszámhoz viszonyított aránya (gyakoriságok).

    Olyan számokat hívunk meg, amelyek azt mutatják, hogy egy adott populációban hányszor fordulnak elő egyedi opciók frekvenciák vagy Mérleg változat, és a latin ábécé kisbetűivel jelöljük f. A variációs sorozatok gyakoriságainak összege megegyezik ennek a sokaságnak a térfogatával, azaz.

    ahol k- csoportok száma, n a megfigyelések teljes száma vagy a populáció mérete.

    A gyakoriságokat (súlyokat) nemcsak abszolút, hanem relatív számokban is kifejezik - az egység töredékeiben vagy az ezt a halmazt alkotó változatok teljes számának százalékában. Ilyen esetekben a súlyokat ún relatív gyakoriságok vagy frekvenciák. Az adatok teljes összege eggyel egyenlő

    vagy
    ,

    ha a gyakoriságokat a megfigyelések teljes számának százalékában fejezzük ki P. A frekvenciák frekvenciákkal való helyettesítése nem kötelező, de néha hasznosnak, sőt szükségesnek is bizonyul azokban az esetekben, amikor össze kell hasonlítani egymással a térfogatukban erősen eltérő variációs sorozatokat.

    Attól függően, hogy az attribútum hogyan változik - diszkréten vagy folyamatosan, tág vagy szűk tartományban - a statisztikai sokaság megoszlik intervallum nélküli vagy intervallum variációs vonalak. Az első esetben a gyakoriságok közvetlenül a tulajdonság rangsorolt ​​értékeire vonatkoznak, amelyek a variációs sorozat egyes csoportjainak vagy osztályainak helyzetét szerzik meg, a második esetben az egyes intervallumokhoz vagy intervallumokhoz kapcsolódó gyakoriságokat számítják ki (a to), amelyre a tulajdonság összesített variációja fel van osztva, a minimálistól a maximális lehetőségig. Ezek a terek vagy osztályterek lehetnek egyenlő szélességűek vagy nem. Innentől megkülönböztetnek egyenlő és egyenlőtlen intervallumú variációs sorozatok. Az egyenlőtlen intervallumsorokban a gyakorisági eloszlás jellege az osztályintervallumok szélességének változásával változik. Az egyenlőtlen intervallumú csoportosítást a biológiában viszonylag ritkán alkalmazzák. A biometrikus adatok rendszerint egyenlő intervallumú sorozatokban vannak elosztva, ami nem csak a variációs minta azonosítását teszi lehetővé, hanem megkönnyíti a variációs sorozatok összesített numerikus jellemzőinek kiszámítását is, az eloszlási sorozatokat egymással összehasonlítva.

    Az egyenlő intervallumú variációs sorozat felépítésének megkezdésekor fontos az osztályintervallum szélességének helyes felvázolása. A helyzet az, hogy a durva csoportosítás (amikor nagyon széles osztályintervallumokat állít be) torzítja a variáció tipikus jellemzőit, és a sorozatok numerikus jellemzőinek pontosságának csökkenéséhez vezet. A túl szűk intervallumok megválasztásakor az általánosító numerikus jellemzők pontossága nő, de a sorozat túlságosan kiterjesztettnek bizonyul, és nem ad egyértelmű képet a változásról.

    Ahhoz, hogy jól definiált variációs sorozatot kapjunk és A belőle számított numerikus jellemzők kellő pontosságának biztosítása érdekében a tulajdonság variációját (a minimumtól a maximumig terjedő tartományban) olyan számú csoportra vagy osztályra kell felosztani, amely mindkét követelményt kielégíti. Ezt a problémát úgy oldjuk meg, hogy egy jellemző variációs tartományát elosztjuk azon csoportok vagy osztályok számával, amelyeket a variációs sorozat felépítésekor tervezünk:

    ,

    ahol h– intervallumérték; x m a x i x min - a maximális és minimális értékek az aggregátumban; k a csoportok száma.

    Intervallumeloszlási sorozat felépítésénél ki kell választani a csoportok (karakterintervallumok) optimális számát és be kell állítani az intervallum hosszát (tartományát). Mivel egy eloszlási sorozat elemzése során a gyakoriságokat különböző intervallumokban hasonlítjuk össze, szükséges, hogy az intervallumok hossza állandó legyen. Ha egyenlőtlen intervallumú eloszlási intervallumsorozattal kell foglalkozni, akkor az összehasonlíthatóság érdekében a frekvenciát vagy gyakoriságot az intervallum egységére kell hozni, a kapott értéket ún. sűrűség ρ , vagyis
    .

    A csoportok optimális számát úgy választjuk meg, hogy az attribútum értékeinek sokfélesége az aggregátumban kellő mértékben tükröződjön, és ugyanakkor az eloszlás szabályossága, alakja ne torzuljon a véletlenszerű frekvenciaingadozások miatt. Ha túl kevés a csoport, akkor nem lesz variációs minta; ha túl sok a csoport, a véletlenszerű frekvenciaugrások torzítják az eloszlás alakját.

    Leggyakrabban a csoportok számát egy eloszlási sorozatban a Sturgess-képlet határozza meg:

    ahol n- a lakosság nagysága.

    A grafikus ábrázolás alapvető segítséget nyújt egy disztribúciós sorozat és tulajdonságainak elemzéséhez. Az intervallumsort egy oszlopdiagram ábrázolja, amelyben az abszcissza tengely mentén elhelyezkedő oszlopok alapjai a változó attribútum értékeinek intervallumai, az oszlopok magasságai pedig a skálának megfelelő frekvenciák. az ordináta tengely. Ezt a diagramtípust ún hisztogram.

    Ha van diszkrét eloszlási sorozat vagy a középső intervallumokat használjuk, akkor egy ilyen sorozat grafikus ábrázolását ún. poligon, amelyet az egyenes pontok koordinátákkal való összekapcsolásával kapunk x énés f én .

    Ha az osztályértékeket az abszcissza tengely mentén, a felhalmozott frekvenciákat pedig az ordináta tengely mentén ábrázoljuk, majd a pontokat egyenesekkel összekötjük, akkor egy grafikont kapunk, ún. halmozott. A felhalmozott frekvenciákat egymás utáni összegzéssel, ill kumuláció frekvenciák az első osztálytól a variációs sorozat végéig tartó irányban.

    Példa. Baromfitelepen 1 évre tartó 50 tojótyúk tojástermeléséről állnak rendelkezésre adatok (1.1. táblázat).

    T a b l e 1.1

    Tojótyúkok

    tojótyúkok sz

    Tojástermelés, db.

    tojótyúkok sz

    Tojástermelés, db.

    tojótyúkok sz

    Tojástermelés, db.

    tojótyúkok sz

    Tojástermelés, db.

    tojótyúkok sz

    Tojástermelés, db.

    Fel kell építeni egy intervallum eloszlás sorozatot, és grafikusan megjeleníteni hisztogram, sokszög és kumulátum formájában.

    Látható, hogy a tulajdonság 212-245 tojás között változik egy tojótyúktól 1 év alatt.

    Példánkban a Sturgess-képlet segítségével határozzuk meg a csoportok számát:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Számítsa ki az intervallum hosszát (tartományát) a képlet segítségével:

    .

    Építsünk egy intervallum sorozatot 7 csoportból és egy 5 darabból álló intervallumból. tojás (1.2. táblázat). A táblázatban lévő grafikonok felépítéséhez kiszámítjuk az intervallumok közepét és a felhalmozott gyakoriságot.

    T a b l e 1.2

    A tojástermelés eloszlásának intervallumsorozata

    Tojótyúkok csoportja a tojástermelés nagysága szerint

    x én

    Tojótyúkok száma

    f én

    Intervallum felezőpont

    xén'

    Felhalmozott frekvencia

    f én

    Készítsünk hisztogramot a tojástermelés eloszlásáról (1.1. ábra).

    Rizs. 1.1. A tojástermelés eloszlásának hisztogramja

    Ezek a hisztogramok számos tulajdonságra jellemző eloszlási formát mutatják: a tulajdonság átlagos intervallumainak értékei gyakoribbak, a tulajdonság szélső (kis és nagy) értékei kevésbé gyakoriak. Ennek az eloszlásnak a formája közel áll a normál eloszlási törvényhez, amely akkor jön létre, ha egy változóváltozót nagyszámú tényező befolyásol, amelyek közül egyiknek sincs domináns értéke.

    A tojástermelés megoszlásának sokszöge és kumulátuma alakja (1.2. és 1.3. ábra).

    Rizs. 1.2. Tojáselosztási sokszög

    Rizs. 1.3. A tojástermelés kumulált megoszlása

    Problémamegoldó technológia in táblázatkezelő Microsoft excel következő.

    1. Adja meg a kezdeti adatokat az ábra szerint. 1.4.

    2. Rangsorolja a sort.

    2.1. Jelölje ki az A2:A51 cellákat.

    2.2. Kattintson a bal gombbal a gomb eszköztárán<Сортировка по возрастанию > .

    3. Határozza meg az intervallum méretét az eloszlás intervallumsorozatának felépítéséhez!

    3.1. Másolja az A2 cellát az E53 cellába.

    3.2. Másolja az A51 cellát az E54 cellába.

    3.3. Számítsa ki a variációs tartományt! Ehhez írja be a képletet az E55 cellába =E54-E53.

    3.4. Számítsa ki a variációs csoportok számát! Ehhez írja be a képletet az E56 cellába =1+3,322*LOG10(50).

    3.5. Írja be az E57 cellába a csoportok kerekített számát.

    3.6. Számítsa ki az intervallum hosszát! Ehhez írja be a képletet az E58 cellába =E55/E57.

    3.7. Írja be az E59 cellába az intervallum kerekített hosszát.

    4. Készítsen intervallum sorozatot.

    4.1. Másolja az E53 cellát a B64 cellába.

    4.2. Írja be a képletet a B65 cellába = B64+59 E$.

    4.3. Másolja a B65 cellát a B66:B70 cellákba.

    4.4. Írja be a képletet a C64 cellába =B65.

    4.5. Írja be a képletet a C65 cellába =C64+59 USD.

    4.6. Másolja a C65 cellát a C66:C70 cellákba.

    A megoldás eredményei a következő formában jelennek meg a képernyőn (1.5. ábra).

    5. Számítsa ki az intervallum gyakoriságát.

    5.1. Hajtsa végre a parancsot Szolgáltatás,Adatelemzés a bal egérgombbal váltakozva kattintva.

    5.2. A párbeszédpanelen Adatelemzésállítsa be a bal egérgombbal: Elemzőeszközök <Гистограмма>(1.6. ábra).

    5.3. Kattintson a bal gombbal a gombra<ОК>.

    5.4. A lapon oszlopdiagramábra szerint állítsa be a paramétereket. 1.7.

    5.5. Kattintson a bal gombbal a gombra<ОК>.

    A megoldás eredménye a következő formában jelenik meg a képernyőn (1.8. ábra).

    6. Töltse ki az "Eloszlás intervallumsorozata" táblázatot.

    6.1. Másolja a B74:B80 cellákat a D64:D70 cellákba.

    6.2. Számítsa ki a frekvenciák összegét! Ehhez jelölje ki a D64:D70 cellákat, és kattintson a bal egérgombbal a gombra az eszköztáron<Автосумма > .

    6.3. Számítsa ki az intervallumok közepét! Ehhez írja be a képletet az E64 cellába =(B64+C64)/2és másolja az E65:E70 cellákba.

    6.4. Számítsa ki a felhalmozott frekvenciákat. Ehhez másolja a D64 cellát az F64 cellába. Az F65 cellába írja be az =F64+D65 képletet, és másolja az F66:F70 cellákba.

    A megoldás eredményei a következő formában jelennek meg a képernyőn (1.9. ábra).

    7. Szerkessze a hisztogramot.

    7.1. Kattintson a jobb gombbal a "zseb" nevű diagramra, majd a megjelenő lapon kattintson a gombra<Очистить>.

    7.2. Kattintson a jobb gombbal a diagramra, majd a megjelenő lapon kattintson a gombra<Исходные данные>.

    7.3. A párbeszédpanelen Kezdeti adatok módosítsa az x-tengely címkéit, ehhez válassza ki a B64:C70 cellákat (1.10. ábra).

    7.5. Nyomja meg a gombot .

    Az eredmények a következő formában jelennek meg a kijelzőn (1.11. ábra).

    8. Építs egy tojáselosztási sokszöget.

    8.1. Kattintson a bal gombbal a gomb eszköztárán<Мастер диаграмм > .

    8.2. A párbeszédpanelen Diagram varázsló (4/1. lépés) a bal egérgombbal állítsa be: Standard <График>(1.12. ábra).

    8.3. Kattintson a bal gombbal a gombra<Далее>.

    8.4. A párbeszédpanelen Diagram varázsló (4/2. lépés)ábra szerint állítsa be a paramétereket. 1.13.

    8.5. Kattintson a bal gombbal a gombra<Далее>.

    8.6. A párbeszédpanelen Diagram varázsló (4/3. lépés)írja be a diagram és az Y tengely nevét (1.14. ábra).

    8.7. Kattintson a bal gombbal a gombra<Далее>.

    8.8. A párbeszédpanelen Diagram varázsló (4/4. lépés)ábra szerint állítsa be a paramétereket. 1.15.

    8.9. Kattintson a bal gombbal a gombra<Готово>.

    Az eredmények a következő formában jelennek meg a kijelzőn (1.16. ábra).

    9. Helyezzen adatcímkéket a diagramra.

    9.1. Kattintson a jobb gombbal a diagramra, majd a megjelenő lapon kattintson a gombra<Исходные данные>.

    9.2. A párbeszédpanelen Kezdeti adatok módosítsa az x-tengely címkéit, ehhez válassza ki az E64:E70 cellákat (1.17. ábra).

    9.3. Nyomja meg a gombot .

    Az eredmények a következő formában jelennek meg a kijelzőn (1.18. ábra).

    Az eloszlás kumulátum az eloszlási sokszöghöz hasonlóan épül fel a felhalmozott gyakoriságok alapján.

      A vizsgált tulajdonság minden olyan értékét, amely a vizsgált sokaságban előfordul, a jellemző értékének (változat, változat), és ezen érték változásának nevezzük. variáció. A változatokat a latin ábécé kis betűi jelölik, a csoport sorszámának megfelelő indexekkel - x én .

      Egy szám, amely megmutatja, hogy az egyes jellemzőértékek hányszor fordulnak elő a vizsgált populációban frekvencia és jelölje f én . A sorozat összes gyakoriságának összege megegyezik a vizsgált sokaság térfogatával.

      Gyakran számolni kell felhalmozott frekvencia (S). Az egyes jellemzőértékek kumulatív gyakorisága megmutatja, hogy hány populációs egységben van az adott értéknél nem nagyobb jellemzőérték. A kumulatív frekvencia kiszámítása úgy történik, hogy a frekvenciakarakterisztika első értékéhez a következő jellemző értékeket szekvenciálisan hozzáadjuk:

    A felhalmozott frekvencia kiszámítása a jellemző legelső értékétől kezdődik

    A frekvenciák összege mindig egy vagy 100%. A gyakoriságok frekvenciákkal való helyettesítése lehetővé teszi a különböző számú megfigyeléssel rendelkező variációs sorozatok összehasonlítását.

    Az (f i) sorozat frekvenciái bizonyos esetekben helyettesíthetők az (ω i) frekvenciákkal.

    Ha a variációs sorozatot nem egyenlő intervallumokkal adjuk meg, akkor az eloszlás természetének helyes elképzeléséhez ki kell számítani az abszolút vagy relatív eloszlássűrűséget.

      Abszolút eloszlási sűrűség (o f ) a sorozat egy külön csoportjának intervallumának egységnyi méretére eső gyakoriság értékét jelenti:

    R f = f/ én.

      Relatív eloszlási sűrűség (o ω ) a sorozat egy külön csoportjának intervallumának egységnyi méretére eső gyakoriság értékét jelenti:

    R ω = ω / én.

    Az egyenlőtlen intervallumú sorozatoknál csak ezek a jellemzők adnak pontosabb képet az eloszlás természetéről, mint a frekvencia és a frekvencia.

      A minta statisztikai eloszlása nevezze meg az opciók (jellemzők értékeinek) listáját és a hozzájuk tartozó gyakoriságokat vagy eloszlássűrűségeket, relatív gyakoriságokat vagy relatív eloszlássűrűségeket.

    A különböző eloszlási sorozatokat eltérő frekvenciakarakterisztika jellemzi:

    minimális - attribúciós sorozat (gyakoriság, gyakoriság),

    diszkrét esetén négy jellemzőt használnak (frekvencia, frekvencia, halmozott frekvencia, felhalmozott frekvencia),

    intervallumok esetén mind az öt (gyakoriság, gyakoriság, kumulatív gyakoriság, kumulatív gyakoriság, abszolút és relatív eloszlássűrűség).

    1. Intervallumváltozat-sorozat felépítésének szabályai

    1. Variációs sorozatok grafikus ábrázolása

    A variációs sorozat tanulmányozásának első lépése a grafikus ábrázolás megalkotása. A variációs sorozatok grafikus ábrázolása megkönnyíti azok elemzését, és lehetővé teszi az eloszlás formájának megítélését. A statisztikai variációs sorozatok grafikus ábrázolásához hisztogramot, sokszöget és kumulatív eloszlást kell felépíteni.

    Egy diszkrét variációs sorozatot úgynevezett frekvenciapoligonként ábrázolunk.

    Az intervallumsorok megjelenítéséhez frekvenciaeloszlási sokszöget és gyakorisági hisztogramot használnak.

    A grafikonok téglalap alakú koordinátarendszerben épülnek fel.

    (variációs sorozat definíciója; variációs sorozat komponensei; variációs sorozat három formája; intervallumsor felépítésének célszerűsége; a megszerkesztett sorozatból levonható következtetések)

    A variációs sorozat egy minta összes elemének sorozata, nem csökkenő sorrendben. Ugyanazok az elemek ismétlődnek

    Variációs – ezek mennyiségi alapon felépített sorozatok.

    A variációs eloszlás sorozat két elemből áll: változatokból és frekvenciákból:

    A változatok egy mennyiségi tulajdonság számértékei az eloszlás variációs sorozatában. Lehetnek pozitívak vagy negatívak, abszolútak vagy relatívak. Tehát, amikor a vállalkozásokat a gazdasági tevékenység eredménye szerint csoportosítjuk, az opciók pozitívak - ez a nyereség, és a negatív számok - ez a veszteség.

    A gyakoriságok az egyes változatok száma vagy a variációs sorozat egyes csoportjai, azaz. ezek a számok azt mutatják, hogy bizonyos opciók milyen gyakran fordulnak elő egy elosztási sorozatban. Az összes gyakoriság összegét a sokaság térfogatának nevezzük, és a teljes sokaság elemeinek száma határozza meg.

    A gyakoriságok relatív értékben kifejezett gyakoriságok (egységek töredéke vagy százalék). A frekvenciák összege egy vagy 100%. A gyakoriságok frekvenciákkal való helyettesítése lehetővé teszi a különböző számú megfigyeléssel rendelkező variációs sorozatok összehasonlítását.

    A variációs sorozatoknak három formája van: rangsorolt ​​sorozatok, diszkrét sorozatok és intervallumsorozatok.

    A rangsorolt ​​sorozat a populáció egyes egységeinek eloszlása ​​a vizsgált tulajdonság növekvő vagy csökkenő sorrendjében. A rangsorolás megkönnyíti a mennyiségi adatok csoportokra bontását, azonnali felismerést ad a jellemzők legkisebb és legnagyobb értékeiről, és kiemeli a leggyakrabban ismétlődő értékeket.

    A variációs sorozat további formái a vizsgált tulajdonság értékeinek változásának jellege szerint összeállított csoporttáblázatok. A variáció jellege szerint megkülönböztetünk diszkrét (nem folytonos) és folytonos jeleket.

    A diszkrét sorozat olyan variációs sorozat, amelynek felépítése nem folytonos változású jelekre (diszkrét jelekre) épül. Ez utóbbiak közé tartozik a tarifakategória, a családban élő gyermekek száma, a vállalkozásban foglalkoztatottak száma stb. Ezek a jelek csak véges számú bizonyos értéket vehetnek fel.

    A diszkrét variációs sorozat egy olyan táblázat, amely két oszlopból áll. Az első oszlop az attribútum konkrét értékét jelzi, a második pedig az attribútum adott értékével rendelkező populációs egységek számát.

    Ha egy jelnek folyamatos változása van (a jövedelem nagysága, a munkatapasztalat, a vállalkozás tárgyi eszközeinek költsége stb., amely bizonyos határokon belül tetszőleges értéket felvehet), akkor ehhez a jelhez intervallumvariáció-sort kell építeni.



    A csoporttáblázatnak itt is két oszlopa van. Az első a jellemző értékét jelzi a "-tól"-ig (opciók), a második - az intervallumban szereplő egységek számát (gyakoriság).

    Gyakoriság (ismétlődési gyakoriság) - az attribútumértékek egy adott változatának ismétlődéseinek száma, jelölése fi , és a gyakoriságok összege, amely megegyezik a vizsgált populáció térfogatával.

    Ahol k az attribútumérték opciók száma

    Nagyon gyakran a táblázatot kiegészítik egy oszloppal, amelyben az S halmozott gyakoriságokat számítják ki, amelyek azt mutatják meg, hogy a sokaság hány egysége rendelkezik ennél az értéknél nem nagyobb jellemzőértékkel.

    A diszkrét variációs eloszlási sorozatok olyan sorozatok, amelyekben a csoportokat egy olyan tulajdonság szerint állítják össze, amely diszkréten változik, és csak egész értékeket vesz fel.

    Az intervallumvariációs eloszlási sorozat egy olyan sorozat, amelyben a csoportosítás alapját képező csoportosítási attribútum egy adott intervallumban bármilyen értéket felvehet, beleértve a törteket is.

    Az intervallumvariációs sorozat egy valószínűségi változó értékeinek változási intervallumainak rendezett halmaza, amelyek mindegyikébe esik a megfelelő frekvenciák vagy a mennyiség értékeinek gyakorisága.

    Intervallum eloszlás sorozatot célszerű elsősorban egy tulajdonság folytonos variációjával építeni, illetve akkor is, ha egy diszkrét variáció széles tartományban jelentkezik, pl. egy diszkrét jellemző opcióinak száma meglehetősen nagy.

    Ebből a sorozatból már több következtetés is levonható. Például egy variációs sorozat átlagos eleme (medián) lehet egy mérés legvalószínűbb eredményének becslése. A variációs sorozat első és utolsó eleme (azaz a minta minimum és maximum eleme) a minta elemeinek terjedését mutatja. Néha, ha az első vagy az utolsó elem nagyon eltér a minta többi részétől, akkor ezeket kizárják a mérési eredményekből, figyelembe véve, hogy ezeket az értékeket valamilyen súlyos meghibásodás, például technológia eredményeként kapták.