Variačné riadky. priemerné hodnoty

Názov parametra Význam
Predmet článku: Variačné série
Rubrika (tematická kategória) Výroba

Pozorované hodnoty náhodnej premennej X 1 , X 2 , …, x k volal možnosti.

Frekvencia možnosti X volám sa číslo n i (i=1,…,k), ktorý ukazuje, koľkokrát sa tento variant vyskytuje vo vzorke.

Frekvencia(relatívna frekvencia, podiely) opcie x i (i=1,…,k) sa zvyčajne nazýva pomer jeho frekvencie n i na veľkosť vzorky n.

Frekvencie a frekvencie sú tzv váhy.

Akumulovaná frekvencia je zvyčajné nazývať počet opcií, ktorých hodnoty sú menšie ako dané X:

Akumulovaná frekvencia Je obvyklé nazývať pomer akumulovanej frekvencie k veľkosti vzorky:

variačná séria(štatistický rad) - je zvykom nazývať postupnosť opcií zapísaných vo vzostupnom poradí a ich zodpovedajúce váhy.

Séria variácií by mala byť diskrétne(vzorka hodnôt diskrétnej náhodnej premennej) a nepretržitý (interval)(výber hodnôt spojitej náhodnej premennej).

Diskrétny variačný rad má tvar:

Keď je počet možností veľký alebo funkcia je spojitá (náhodná premenná môže mať akúkoľvek hodnotu v určitom intervale), sú interval variačný rad.

Ak chcete zostaviť rad intervalových variácií, vykonajte zoskupenie možnosť - sú rozdelené do samostatných intervalov:

Počet intervalov sa niekedy určuje pomocou Sturgesove vzorce:

Potom sa vypočíta počet variantov, ktoré spadajú do každého intervalu - frekvencie n i(alebo frekvencia n i/n). Ak je variant na hranici intervalu, potom je pripojený k správnemu intervalu.

Intervalový variačný rad má tvar:

možnosti
Frekvencie

Empirická (štatistická) distribučná funkcia je zvykom volať funkciu, ktorej hodnota v bode X sa rovná relatívnej frekvencii, ktorú variant nadobudne hodnotu menšiu ako X(kumulatívna frekvencia pre X):

Frekvenčný mnohouholník sa nazýva lomená čiara, ktorej segmenty spájajú body so súradnicami ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). The frekvenčný polygón, čo je štatistická analógia polygónu rozdelenia.

Stojí za to povedať, že pre súvislú variačnú sériu je možné postaviť polygón, ak sú hodnoty X 1 , X 2 , …, x k vziať stredy intervalov.

Séria intervalových variácií je zvyčajne graficky znázornená pomocou histogramy.

stĺpcový graf- stupňovitý útvar pozostávajúci z obdĺžnikov, ktorých základňami sú čiastočné dĺžkové intervaly h= x i +1 – x i, i= 0,…,k-1 a výšky sa rovnajú frekvenciám (alebo frekvenciám) intervalov n i (w i).

Kumulovať(kumulatívna krivka) - krivka akumulovaných frekvencií (frekvencií). Pre diskrétne série kumulát je prerušovaná čiara spájajúca body alebo , . Pre intervalové série kumulovať začína od bodu, ktorého úsečka sa rovná začiatku prvého intervalu a ordináta je akumulovaná frekvencia (frekvencia) rovná nule. Ostatné body tejto prerušovanej čiary zodpovedajú koncom intervalov.

Variačné série - koncepcia a typy. Klasifikácia a vlastnosti kategórie "Séria variácií" 2017, 2018.

  • - Variačný rad distribúcie

    Rozdelenie maloobchodného obratu v Ruskej federácii v roku 1995 podľa typu vlastníctva, milióny rubľov Typy distribučných sérií Prednáška VIII. Distribučné rady V dôsledku spracovania a systematizácie primárnych štatistických údajov získavajú ....


  • - Séria variácií

    Najjednoduchšou transformáciou štatistických údajov je ich zoradenie podľa veľkosti. Veľkosť vzorky z bežnej populácie zoradená v neklesajúcom poradí prvkov, t.j. , sa nazýva variačný rad: . V prípade, že objem pozorovaní ... .


  • - Úloha 2. Intervalový variačný rad

    1. Na základe danej vzorky zodpovedajúcej variantu úlohy zostavte intervalový variačný rad; vytvorte histogram a kumulujte ho (použite dve metódy: vloženie grafu Excel a režim „Histogram“ balíka „Analýza údajov“). 2. Analyzujte výsledný histogram. ... .


  • - Zostavte sériu variácií variability znaku semien fazule alebo listov ktorejkoľvek rastliny rovnakého veku. Odhaľ vzorce variability vlastností.

    Populácia je štrukturálna jednotka druhu. Počet populácií. Príčiny populačných výkyvov. Vzťah jedincov v populáciách a medzi rôznymi populáciami toho istého a rôznych druhov. 1. Dôležitým znakom druhu je jeho rozšírenie v skupinách, populáciách v ...

  • Variačné série: definícia, typy, hlavné charakteristiky. Spôsob výpočtu
    móda, medián, aritmetický priemer v lekárskych a štatistických štúdiách
    (Ukážte na podmienenom príklade).

    Variačný rad je séria číselných hodnôt študovaného znaku, ktoré sa navzájom líšia svojou veľkosťou a sú usporiadané v určitom poradí (vo vzostupnom alebo zostupnom poradí). Každá číselná hodnota radu sa nazýva variant (V) a čísla, ktoré ukazujú, ako často sa ten alebo ten variant vyskytuje v zložení tohto radu, sa nazývajú frekvencia (p).

    Celkový počet prípadov pozorovaní, z ktorých variačný rad pozostáva, sa označuje písmenom n. Rozdiel vo význame skúmaných charakteristík sa nazýva variácia. Ak premenný znak nemá kvantitatívne meranie, variácia sa nazýva kvalitatívna a distribučný rad sa nazýva atribút (napríklad rozdelenie podľa výsledku choroby, zdravotného stavu atď.).

    Ak má premenné znamienko kvantitatívne vyjadrenie, takáto variácia sa nazýva kvantitatívna a distribučný rad sa nazýva variačný.

    Variačné rady sa delia na nespojité a spojité – podľa charakteru kvantitatívneho znaku, jednoduché a vážené – podľa frekvencie výskytu variantu.

    V jednoduchom variačnom rade sa každý variant vyskytuje len raz (p=1), vo váženom sa ten istý variant vyskytuje viackrát (p>1). Príklady takýchto sérií budú diskutované ďalej v texte. Ak je kvantitatívny atribút spojitý, t.j. medzi celočíselnými hodnotami sú medziľahlé zlomkové hodnoty, variačný rad sa nazýva spojitý.

    Napríklad: 10,0 - 11,9

    14,0 - 15,9 atď.

    Ak je kvantitatívny znak nespojitý, t.j. jeho jednotlivé hodnoty (možnosti) sa od seba líšia celým číslom a nemajú medziľahlé zlomkové hodnoty, variačný rad sa nazýva nespojitý alebo diskrétny.

    Použitie údajov z predchádzajúceho príkladu o srdcovej frekvencii

    pre 21 žiakov zostavíme variačný rad (tabuľka 1).

    stôl 1

    Rozdelenie študentov medicíny podľa pulzovej frekvencie (bpm)

    Vybudovať variačný rad teda znamená systematizovať, zefektívniť existujúce číselné hodnoty (možnosti), t.j. usporiadať v určitom poradí (vo vzostupnom alebo zostupnom poradí) so zodpovedajúcimi frekvenciami. V uvažovanom príklade sú možnosti usporiadané vzostupne a sú vyjadrené ako nespojité (diskrétne) celé čísla, každá možnosť sa vyskytuje niekoľkokrát, t.j. máme do činenia s váženým, nespojitým alebo diskrétnym variačným radom.

    Spravidla, ak počet pozorovaní v štatistickej populácii, ktorú študujeme, nepresahuje 30, potom stačí usporiadať všetky hodnoty študovaného znaku do variačných sérií v rastúcom poradí, ako je uvedené v tabuľke. 1 alebo v zostupnom poradí.

    Pri veľkom počte pozorovaní (n>30) môže byť počet vyskytujúcich sa variantov veľmi veľký, v tomto prípade sa zostavuje intervalový alebo skupinový variačný rad, v ktorom sa pre zjednodušenie následného spracovania a objasnenie podstaty rozdelenia. varianty sú spojené do skupín.

    Zvyčajne sa počet skupinových možností pohybuje od 8 do 15.

    Musí ich byť aspoň 5, pretože. v opačnom prípade bude príliš hrubé, nadmerné zväčšenie, ktoré skresľuje celkový obraz variácií a výrazne ovplyvňuje presnosť priemerných hodnôt. Keď je počet skupinových možností viac ako 20-25, presnosť výpočtu priemerných hodnôt sa zvyšuje, ale vlastnosti variácií funkcií sú výrazne skreslené a matematické spracovanie sa stáva komplikovanejším.

    Pri zostavovaní zoskupeného radu je potrebné brať do úvahy

    − skupiny variantov musia byť umiestnené v špecifickom poradí (vzostupne alebo zostupne);

    - intervaly v skupinách variantov by mali byť rovnaké;

    − hodnoty hraníc intervalov by sa nemali zhodovať, pretože nebude jasné, do ktorých skupín priradiť jednotlivé možnosti;

    - pri stanovovaní hraníc intervalov je potrebné brať do úvahy kvalitatívne vlastnosti zozbieraného materiálu (napríklad pri štúdiu hmotnosti dospelých je prijateľný interval 3-4 kg a pre deti v prvých mesiacoch Životnosť by nemala presiahnuť 100 g.)

    Zostavme skupinový (intervalový) rad, ktorý charakterizuje údaje o tepovej frekvencii (počet úderov za minútu) pre 55 študentov medicíny pred skúškou: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    Na vytvorenie zoskupenej série potrebujete:

    1. Určte hodnotu intervalu;

    2. Určte stred, začiatok a koniec skupín variantu variačného radu.

    ● Hodnota intervalu (i) je určená počtom očakávaných skupín (r), ktorých počet je stanovený v závislosti od počtu pozorovaní (n) podľa osobitnej tabuľky

    Počet skupín v závislosti od počtu pozorovaní:

    V našom prípade pre 55 študentov je možné vytvoriť 8 až 10 skupín.

    Hodnota intervalu (i) je určená nasledujúcim vzorcom -

    i = Vmax-Vmin/r

    V našom príklade je hodnota intervalu 82-58/8= 3.

    Ak je hodnota intervalu zlomkové číslo, výsledok by mal byť zaokrúhlený nahor na celé číslo.

    Existuje niekoľko typov priemerov:

    ● aritmetický priemer,

    ● geometrický priemer,

    ● harmonický priemer,

    ● stredná odmocnina,

    ● stredne progresívny,

    ● medián

    V lekárskej štatistike sa najčastejšie používajú aritmetické priemery.

    Aritmetický priemer (M) je zovšeobecňujúca hodnota, ktorá určuje typickú hodnotu, ktorá je charakteristická pre celú populáciu. Hlavné metódy výpočtu M sú: metóda aritmetického priemeru a metóda momentov (podmienené odchýlky).

    Metóda aritmetického priemeru sa používa na výpočet jednoduchého aritmetického priemeru a váženého aritmetického priemeru. Výber metódy na výpočet aritmetického priemeru závisí od typu variačného radu. V prípade jednoduchého variačného radu, v ktorom sa každý variant vyskytuje iba raz, sa jednoduchý aritmetický priemer určí podľa vzorca:

    kde: М – aritmetický priemer;

    V je hodnota premennej funkcie (opcií);

    Σ - označuje činnosť - súčet;

    n je celkový počet pozorovaní.

    Príklad výpočtu aritmetického priemeru je jednoduchý. Frekvencia dýchania (počet nádychov a výdychov za minútu) u 9 mužov vo veku 35 rokov: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    Na určenie priemernej úrovne dychovej frekvencie u mužov vo veku 35 rokov je potrebné:

    1. Zostavte sériu variácií umiestnením všetkých možností vo vzostupnom alebo zostupnom poradí. Získali sme jednoduchú sériu variácií, pretože variantné hodnoty sa vyskytujú iba raz.

    M = ∑V/n = 171/9 = 19 dychov za minútu

    Záver. Dýchacia frekvencia u mužov vo veku 35 rokov je v priemere 19 dychov za minútu.

    Ak sa jednotlivé hodnoty variantu opakujú, nie je potrebné vypisovať každý variant do riadku, stačí uviesť rozmery variantu, ktoré sa vyskytujú (V) a vedľa uviesť počet ich opakovaní ( p). takýto variačný rad, v ktorom sú varianty akoby vážené podľa počtu im zodpovedajúcich frekvencií, sa nazýva vážený variačný rad a vypočítaná priemerná hodnota je aritmetický vážený priemer.

    Aritmetický vážený priemer je určený vzorcom: M= ∑Vp/n

    kde n je počet pozorovaní rovný súčtu frekvencií - Σr.

    Príklad výpočtu aritmetického váženého priemeru.

    Dĺžka trvania invalidity (v dňoch) u 35 pacientov s akútnymi respiračnými ochoreniami (ARI) liečených miestnym lekárom počas prvého štvrťroka bežného roka bola: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 dní.

    Metodika stanovenia priemerného trvania invalidity u pacientov s akútnymi respiračnými infekciami je nasledovná:

    1. Zostavme vážený variačný rad, pretože hodnoty jednotlivých variantov sa niekoľkokrát opakujú. Ak to chcete urobiť, môžete usporiadať všetky možnosti vo vzostupnom alebo zostupnom poradí s ich zodpovedajúcimi frekvenciami.

    V našom prípade sú možnosti vo vzostupnom poradí.

    2. Vypočítajte aritmetický vážený priemer pomocou vzorca: M = ∑Vp/n = 233/35 = 6,7 dňa

    Rozdelenie pacientov s akútnymi respiračnými infekciami podľa dĺžky invalidity:

    Trvanie práceneschopnosti (V) Počet pacientov (p) vp
    ∑p = n = 35 ∑Vp = 233

    Záver. Dĺžka trvania invalidity u pacientov s akútnymi respiračnými ochoreniami bola v priemere 6,7 dňa.

    Režim (Mo) je najbežnejším variantom v sérii variácií. Pre rozdelenie uvedené v tabuľke režim zodpovedá variantu rovnajúcemu sa 10, vyskytuje sa častejšie ako ostatné - 6-krát.

    Rozdelenie pacientov podľa dĺžky pobytu na nemocničnom lôžku (v dňoch)

    V
    p

    Niekedy je ťažké určiť presnú hodnotu režimu, pretože v skúmaných údajoch môže byť niekoľko pozorovaní, ktoré sa vyskytujú „najčastejšie“.

    Medián (Me) je neparametrický indikátor, ktorý rozdeľuje sériu variácií na dve rovnaké polovice: rovnaký počet možností sa nachádza na oboch stranách mediánu.

    Napríklad pre rozdelenie uvedené v tabuľke je medián 10, pretože na oboch stranách tejto hodnoty sa nachádza na 14. možnosti, t.j. číslo 10 zaujíma ústrednú pozíciu v tejto sérii a je jej mediánom.

    Vzhľadom na to, že počet pozorovaní v tomto príklade je párny (n=34), medián možno určiť takto:

    Ja = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    To znamená, že stred série pripadá na sedemnástu možnosť, čo zodpovedá mediánu 10. Pre rozdelenie uvedené v tabuľke je aritmetický priemer:

    M = ∑Vp/n = 334/34 = 10,1

    Takže pre 34 pozorovaní z tabuľky. 8, dostali sme: Mo=10, Me=10, aritmetický priemer (M) je 10,1. V našom príklade sa ukázalo, že všetky tri ukazovatele sú rovnaké alebo blízko seba, hoci sú úplne odlišné.

    Aritmetický priemer je výsledný súčet všetkých vplyvov, na jeho tvorbe sa podieľajú všetky možnosti bez výnimky, vrátane extrémnych, často atypických pre daný jav alebo súbor.

    Režim a medián, na rozdiel od aritmetického priemeru, nezávisia od hodnoty všetkých jednotlivých hodnôt premenného atribútu (hodnoty extrémnych variantov a stupeň rozptylu série). Aritmetický priemer charakterizuje celý objem pozorovaní, modus a medián charakterizuje objem

    Cvičenie 1

    VARIAČNÝ RAD DISTRIBÚCIE

    variačná séria alebo blízko distribúcie nazývané usporiadané rozdelenie jednotiek populácie podľa zvyšujúcich sa (častejšie) alebo klesajúcich (menej často) hodnôt atribútu a počítania počtu jednotiek s jednou alebo druhou hodnotou atribútu.

    Sú tam 3 milý distribučný rozsah:

    1) riadok v poradí- ide o zoznam jednotlivých jednotiek populácie vo vzostupnom poradí podľa študovaného znaku; ak je počet populačných jednotiek dostatočne veľký, zoradený rad sa stáva ťažkopádnym a v takýchto prípadoch sa distribučný rad zostavuje zoskupením populačných jednotiek podľa hodnôt študovaného znaku (ak znak zaberá malý počet hodnôt, potom sa vytvorí diskrétny rad a inak intervalový rad);

    2) diskrétne série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - konkrétne hodnoty rôzneho atribútu X i a počet populačných jednotiek s danou hodnotou prvku f i- frekvencie; počet skupín v diskrétnej sérii je určený počtom skutočne existujúcich hodnôt premenného atribútu;

    3) intervalové série- toto je tabuľka pozostávajúca z dvoch stĺpcov (riadkov) - intervalov s rôznym znamienkom X i a počet populačných jednotiek spadajúcich do daného intervalu (frekvencie) alebo podiel tohto počtu na celkovom počte populácií (frekvencie).

    Volajú sa čísla, ktoré ukazujú, koľkokrát sa jednotlivé možnosti vyskytujú v danej populácii frekvencie alebo váhy variant a označujú sa malým písmenom latinskej abecedy f. Celkový súčet frekvencií variačného radu sa rovná objemu tejto populácie, t.j.

    kde k- počet skupín, n je celkový počet pozorovaní alebo veľkosť populácie.

    Frekvencie (váhy) sa vyjadrujú nielen v absolútnych, ale aj v relatívnych číslach – v zlomkoch jednotky alebo v percentách z celkového počtu variantov, ktoré tvoria tento súbor. V takýchto prípadoch sú závažia tzv relatívnych frekvencií alebo frekvencie. Celkový súčet údajov sa rovná jednej

    alebo
    ,

    ak sú frekvencie vyjadrené ako percento z celkového počtu pozorovaní P. Nahradenie frekvencií frekvenciami nie je povinné, ale niekedy sa ukazuje ako užitočné a dokonca nevyhnutné v prípadoch, keď je potrebné navzájom porovnávať variačné série, ktoré sa výrazne líšia svojimi objemami.

    V závislosti od toho, ako sa atribút mení – diskrétne alebo nepretržite, v širokom alebo úzkom rozsahu – je štatistická populácia rozdelená v bez intervalu alebo interval variačné línie. V prvom prípade sa frekvencie vzťahujú priamo na zoradené hodnoty znaku, ktoré nadobúdajú postavenie jednotlivých skupín alebo tried variačného radu, v druhom prípade počítajú frekvencie súvisiace s jednotlivými intervalmi alebo intervalmi (od - do), na ktorý sa delí celková variácia znaku v rozsahu od minimálnych po maximálne možnosti pre tento súbor. Tieto medzery alebo medzery tried môžu, ale nemusia mať rovnakú šírku. Odtiaľ rozlišujú rovnaký a nerovnaký intervalový variačný rad. V nerovnakých intervalových radoch sa mení povaha frekvenčného rozdelenia so zmenou šírky triednych intervalov. Nerovnomerné intervalové zoskupovanie sa v biológii používa pomerne zriedkavo. Biometrické údaje sú spravidla distribuované v rovnakých intervalových radoch, čo umožňuje nielen identifikovať vzor variácie, ale tiež uľahčuje výpočet súhrnných číselných charakteristík variačných sérií a vzájomné porovnanie distribučných radov.

    Na začiatku konštrukcie variačného radu s rovnakým intervalom je dôležité správne načrtnúť šírku intervalu triedy. Faktom je, že hrubé zoskupenie (keď sú nastavené veľmi široké intervaly tried) skresľuje typické znaky variácie a vedie k zníženiu presnosti číselných charakteristík série. Pri výbere príliš úzkych intervalov sa zvyšuje presnosť zovšeobecňujúcich číselných charakteristík, ale séria sa ukazuje ako príliš rozšírená a nedáva jasný obraz o variácii.

    Na získanie dobre definovaného variačného radu a na zabezpečenie dostatočnej presnosti z nej vypočítaných číselných charakteristík je potrebné rozdeliť variáciu znaku (v rozsahu od minimálnych po maximálne možnosti) do takého počtu skupín alebo tried, ktoré by vyhovovali obom požiadavkám. Tento problém je vyriešený vydelením rozsahu variácií prvku počtom skupín alebo tried, ktoré sa plánujú pri konštrukcii série variácií:

    ,

    kde h– intervalová hodnota; X m a x i X min - maximálne a minimálne hodnoty v súhrne; k je počet skupín.

    Pri konštrukcii intervalového distribučného radu je potrebné zvoliť optimálny počet skupín (intervalov znakov) a nastaviť dĺžku (rozsah) intervalu. Keďže analýza distribučného radu porovnáva frekvencie v rôznych intervaloch, je potrebné, aby dĺžka intervalov bola konštantná. Ak sa musíte vysporiadať s intervalovým radom rozdelenia s nerovnakými intervalmi, potom pre porovnateľnosť musíte frekvenciu alebo frekvenciu priviesť na jednotku intervalu, výsledná hodnota je tzv. hustota ρ , t.j
    .

    Optimálny počet skupín sa volí tak, aby sa v dostatočnej miere prejavila rôznorodosť hodnôt atribútu v súhrne a zároveň aby ​​pravidelnosť rozloženia, jeho tvar nebol skreslený náhodnými frekvenčnými výkyvmi. Ak je príliš málo skupín, nedôjde k žiadnej variácii; ak je skupín príliš veľa, náhodné frekvenčné skoky skreslia tvar rozloženia.

    Najčastejšie je počet skupín v distribučnej sérii určený Sturgessovým vzorcom:

    kde n- veľkosť populácie.

    Grafické znázornenie poskytuje základnú pomoc pri analýze distribučného radu a jeho vlastností. Séria intervalov je reprezentovaná stĺpcovým grafom, v ktorom sú základne stĺpcov, umiestnené pozdĺž osi x, intervaly hodnôt premenlivého atribútu a výšky stĺpcov sú frekvencie zodpovedajúce stupnici pozdĺž ordinátnej osi. Tento typ diagramu sa nazýva histogram.

    Ak existuje diskrétny distribučný rad alebo sa používajú stredné intervaly, potom sa grafické znázornenie takéhoto radu nazýva mnohouholník, ktorý sa získa spojením priamych bodov so súradnicami X i a f i .

    Ak sú hodnoty tried vynesené pozdĺž osi x a akumulované frekvencie sú vynesené pozdĺž osi y, po čom nasleduje spojenie bodov s priamkami, získa sa graf tzv. kumulatívne. Naakumulované frekvencie sa nachádzajú postupným sčítavaním, príp kumulácia frekvencie v smere od prvej triedy po koniec variačného radu.

    Príklad. Existujú údaje o produkcii vajec 50 nosníc za 1 rok chovaných na hydinovej farme (tabuľka 1.1).

    T a b l e 1.1

    Vajcia nosnice

    Počet nosníc

    Výroba vajec, ks.

    Počet nosníc

    Výroba vajec, ks.

    Počet nosníc

    Výroba vajec, ks.

    Počet nosníc

    Výroba vajec, ks.

    Počet nosníc

    Výroba vajec, ks.

    Je potrebné zostaviť intervalový distribučný rad a zobraziť ho graficky vo forme histogramu, polygónu a kumulácie.

    Je vidieť, že znak sa pohybuje od 212 do 245 vajec získaných od nosnice za 1 rok.

    V našom príklade pomocou Sturgessovho vzorca určíme počet skupín:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Vypočítajte dĺžku (rozsah) intervalu pomocou vzorca:

    .

    Zostavme intervalový rad so 7 skupinami a intervalom 5 kusov. vajcia (tabuľka 1.2). Aby sme vytvorili grafy v tabuľke, vypočítame stred intervalov a akumulovanú frekvenciu.

    T a b l e 1.2

    Intervalový rad rozdelenia produkcie vajec

    Skupina nosníc podľa veľkosti produkcie vajec

    X i

    Počet nosníc

    f i

    Stred intervalu

    X ja

    Akumulovaná frekvencia

    f i

    Zostavme si histogram rozdelenia produkcie vajec (obr. 1.1).

    Ryža. 1.1. Histogram distribúcie produkcie vajec

    Tieto histogramy ukazujú formu distribúcie charakteristickú pre mnohé znaky: hodnoty priemerných intervalov znaku sú bežnejšie a extrémne (malé a veľké) hodnoty znaku sú menej bežné. Forma tohto rozdelenia je blízka zákonu normálneho rozdelenia, ktorý vzniká, ak je premenná premenná ovplyvňovaná veľkým počtom faktorov, z ktorých žiadny nemá prevládajúcu hodnotu.

    Polygón a kumulácia rozloženia produkcie vajec majú tvar (obr. 1.2 a 1.3).

    Ryža. 1.2. Polygón distribúcie vajec

    Ryža. 1.3. Kumulujte rozdelenie produkcie vajec

    Technológia riešenia problémov v tabuľkový procesor Microsoft excel Ďalšie.

    1. Zadajte počiatočné údaje podľa obr. 1.4.

    2. Zoraďte riadok.

    2.1. Vyberte bunky A2:A51.

    2.2. Kliknite ľavým tlačidlom myši na paneli nástrojov na tlačidlo<Сортировка по возрастанию > .

    3. Určte veľkosť intervalu na zostavenie intervalového radu rozdelenia.

    3.1. Skopírujte bunku A2 do bunky E53.

    3.2. Skopírujte bunku A51 do bunky E54.

    3.3. Vypočítajte rozsah variácie. Ak to chcete urobiť, zadajte vzorec do bunky E55 =E54-E53.

    3.4. Vypočítajte počet skupín variácií. Ak to chcete urobiť, zadajte vzorec do bunky E56 =1+3,322*LOG10(50).

    3.5. Do bunky E57 zadajte zaokrúhlený počet skupín.

    3.6. Vypočítajte dĺžku intervalu. Ak to chcete urobiť, zadajte vzorec do bunky E58 =E55/E57.

    3.7. Do bunky E59 zadajte zaokrúhlenú dĺžku intervalu.

    4. Vytvorte intervalový rad.

    4.1. Skopírujte bunku E53 do bunky B64.

    4.2. Zadajte vzorec do bunky B65 = B64 + 59 $ E$.

    4.3. Skopírujte bunku B65 do buniek B66:B70.

    4.4. Zadajte vzorec do bunky C64 =B65.

    4.5. Zadajte vzorec do bunky C65 = C64 + 59 $ E$.

    4.6. Skopírujte bunku C65 do buniek C66:C70.

    Výsledky riešenia sa zobrazia na displeji v nasledovnej podobe (obr. 1.5).

    5. Vypočítajte intervalovú frekvenciu.

    5.1. Vykonajte príkaz servis,Analýza dát striedavým kliknutím ľavým tlačidlom myši.

    5.2. V dialógovom okne Analýza dát nastavte ľavým tlačidlom myši: Analysis Tools <Гистограмма>(obr. 1.6).

    5.3. Kliknite ľavým tlačidlom myši na tlačidlo<ОК>.

    5.4. Na karte stĺpcový graf nastavte parametre podľa obr. 1.7.

    5.5. Kliknite ľavým tlačidlom myši na tlačidlo<ОК>.

    Výsledky riešenia sa zobrazia na displeji v nasledovnej podobe (obr. 1.8).

    6. Vyplňte tabuľku „Intervalové série rozdelenia“.

    6.1. Skopírujte bunky B74:B80 do buniek D64:D70.

    6.2. Vypočítajte súčet frekvencií. Ak to chcete urobiť, vyberte bunky D64:D70 a kliknite ľavým tlačidlom myši na tlačidlo na paneli nástrojov<Автосумма > .

    6.3. Vypočítajte stred intervalov. Ak to chcete urobiť, zadajte vzorec do bunky E64 = (B64+C64)/2 a skopírujte do buniek E65:E70.

    6.4. Vypočítajte akumulované frekvencie. Ak to chcete urobiť, skopírujte bunku D64 do bunky F64. Do bunky F65 zadajte vzorec =F64+D65 a skopírujte ho do buniek F66:F70.

    Výsledky riešenia sa zobrazia na obrazovke v nasledovnom tvare (obr. 1.9).

    7. Upravte histogram.

    7.1. Kliknite pravým tlačidlom myši na diagram na názov „vrecko“ a na zobrazenej karte kliknite na tlačidlo<Очистить>.

    7.2. Kliknite pravým tlačidlom myši na graf a na zobrazenej karte kliknite na tlačidlo<Исходные данные>.

    7.3. V dialógovom okne Počiatočné údaje zmeniť označenie osi x. Na tento účel vyberte bunky B64:C70 (obr. 1.10).

    7.5. Stlačte kláves .

    Výsledky sa zobrazia na obrazovke v nasledovnej forme (obr. 1.11).

    8. Zostavte polygón distribúcie vajec.

    8.1. Kliknite ľavým tlačidlom myši na paneli nástrojov na tlačidlo<Мастер диаграмм > .

    8.2. V dialógovom okne Sprievodca grafom (krok 1 zo 4)ľavým tlačidlom myši nastavte: Štandardné <График>(obr. 1.12).

    8.3. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.4. V dialógovom okne Sprievodca grafom (krok 2 zo 4) nastavte parametre podľa obr. 1.13.

    8.5. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.6. V dialógovom okne Sprievodca grafom (3. krok zo 4) zadajte názvy grafu a osi Y (obr. 1.14).

    8.7. Kliknite ľavým tlačidlom myši na tlačidlo<Далее>.

    8.8. V dialógovom okne Sprievodca grafom (krok 4 zo 4) nastavte parametre podľa obr. 1.15.

    8.9. Kliknite ľavým tlačidlom myši na tlačidlo<Готово>.

    Výsledky sa zobrazia na obrazovke v nasledovnej forme (obr. 1.16).

    9. Vložte štítky údajov do grafu.

    9.1. Kliknite pravým tlačidlom myši na graf a na zobrazenej karte kliknite na tlačidlo<Исходные данные>.

    9.2. V dialógovom okne Počiatočné údaje zmeniť označenie osi x. Na tento účel vyberte bunky E64:E70 (obr. 1.17).

    9.3. Stlačte kláves .

    Výsledky sa zobrazia na obrazovke v nasledovnej forme (obr. 1.18).

    Kumulácia distribúcie je konštruovaná podobne ako polygón distribúcie na základe akumulovaných frekvencií.

      Všetky hodnoty študovanej vlastnosti, ktoré sa vyskytujú v študovanej populácii, sa nazývajú hodnota vlastnosti (variant, variant) a zmena tejto hodnoty variácia. Varianty sú označené malými písmenami latinskej abecedy s indexmi zodpovedajúcimi poradovému číslu skupiny - X i .

      Číslo, ktoré ukazuje, koľkokrát sa každá hodnota funkcie vyskytuje v skúmanej populácii frekvencia a označujú f i . Súčet všetkých frekvencií série sa rovná objemu študovanej populácie.

      Často je potrebné počítať akumulovaná frekvencia (S). Kumulatívna frekvencia pre každú hodnotu funkcie ukazuje, koľko jednotiek populácie má hodnotu funkcie, ktorá nie je väčšia ako daná hodnota. Kumulatívna frekvencia sa vypočíta tak, že sa k frekvencii prvej hodnoty frekvenčnej charakteristiky postupne pripočítajú nasledujúce charakteristické hodnoty:

    Akumulovaná frekvencia sa začne počítať od úplne prvej hodnoty funkcie

    Súčet frekvencií sa vždy rovná jednej alebo 100 %. Nahradenie frekvencií frekvenciami umožňuje porovnávať variačné série s rôznym počtom pozorovaní.

    Frekvencie série (f i) môžu byť v niektorých prípadoch nahradené frekvenciami (ω i).

    Ak je variačná séria uvedená s nerovnakými intervalmi, potom pre správnu predstavu o povahe distribúcie je potrebné vypočítať absolútnu alebo relatívnu hustotu distribúcie.

      Absolútna hustota distribúcie (str f ) predstavuje hodnotu frekvencie na jednotku veľkosti intervalu samostatnej skupiny radu:

    R f = f/ i.

      Relatívna hustota distribúcie (str ω ) predstavuje hodnotu frekvencie na jednotku veľkosti intervalu samostatnej skupiny radu:

    R ω = ω / i.

    Pre série s nerovnakými intervalmi iba tieto charakteristiky poskytujú presnejšiu predstavu o povahe distribúcie ako frekvencia a frekvencia.

      Štatistické rozdelenie vzorky pomenujte zoznam možností (hodnoty vlastností) a ich zodpovedajúce frekvencie alebo hustoty distribúcie, relatívne frekvencie alebo relatívne hustoty distribúcie.

    Rôzne distribučné série sa vyznačujú odlišným súborom frekvenčných charakteristík:

    minimálny - atribútový rad (frekvencia, frekvencia),

    pre diskrétne sa používajú štyri charakteristiky (frekvencia, frekvencia, akumulovaná frekvencia, akumulovaná frekvencia),

    pre intervalové - všetkých päť (frekvencia, frekvencia, kumulatívna frekvencia, kumulatívna frekvencia, absolútna a relatívna hustota distribúcie).

    1. Pravidlá pre konštrukciu intervalových variačných radov

    1. Grafické znázornenie variačných sérií

    Prvou fázou štúdia variačného radu je konštrukcia jeho grafického znázornenia. Grafické znázornenie variačných radov uľahčuje ich analýzu a umožňuje posúdiť formu rozdelenia. Pre grafické znázornenie variačného radu v štatistike sa vytvorí histogram, mnohouholník a kumulatívne rozdelenie.

    Diskrétny variačný rad je znázornený ako takzvaný frekvenčný polygón.

    Na zobrazenie intervalového radu sa používa mnohouholník rozloženia frekvencie a histogram frekvencie.

    Grafy sú zostavené v pravouhlom súradnicovom systéme.

    (definícia variačného radu; zložky variačného radu; tri formy variačného radu; účelnosť zostrojenia intervalového radu; závery, ktoré možno zo zostrojeného radu vyvodiť)

    Variačný rad je postupnosť všetkých prvkov vzorky usporiadaných v neklesajúcom poradí. Opakujú sa tie isté prvky

    Variačné – ide o série postavené na kvantitatívnom základe.

    Variačné distribučné rady pozostávajú z dvoch prvkov: variantov a frekvencií:

    Varianty sú číselné hodnoty kvantitatívneho znaku v sérii variácií distribúcie. Môžu byť pozitívne alebo negatívne, absolútne alebo relatívne. Takže pri zoskupovaní podnikov podľa výsledkov hospodárskej činnosti sú možnosti pozitívne - to je zisk a záporné čísla - to je strata.

    Frekvencie sú počty jednotlivých variantov alebo každej skupiny variačného radu, t.j. toto sú čísla, ktoré ukazujú, ako často sa určité možnosti vyskytujú v distribučnej sérii. Súčet všetkých frekvencií sa nazýva objem populácie a je určený počtom prvkov celej populácie.

    Frekvencie sú frekvencie vyjadrené ako relatívne hodnoty (zlomky jednotiek alebo percent). Súčet frekvencií sa rovná jednej alebo 100 %. Nahradenie frekvencií frekvenciami umožňuje porovnávať variačné série s rôznym počtom pozorovaní.

    Existujú tri formy variačných sérií: zoradené série, diskrétne série a intervalové série.

    Zoradený rad predstavuje rozloženie jednotlivých jednotiek populácie vo vzostupnom alebo zostupnom poradí podľa študovaného znaku. Hodnotenie uľahčuje rozdelenie kvantitatívnych údajov do skupín, okamžité zistenie najmenšej a najväčšej hodnoty prvku a zvýraznenie hodnôt, ktoré sa najčastejšie opakujú.

    Ďalšími formami variačných sérií sú skupinové tabuľky zostavené podľa povahy variácií hodnôt študovaného znaku. Podľa povahy variácie sa rozlišujú diskrétne (nespojité) a spojité znaky.

    Diskrétny rad je taký variačný rad, ktorého konštrukcia je založená na znakoch s nespojitou zmenou (diskrétne znaky). Tieto zahŕňajú tarifnú kategóriu, počet detí v rodine, počet zamestnancov v podniku atď. Tieto znaky môžu nadobúdať iba konečný počet určitých hodnôt.

    Samostatný variačný rad je tabuľka, ktorá pozostáva z dvoch stĺpcov. Prvý stĺpec označuje konkrétnu hodnotu atribútu a druhý - počet jednotiek populácie s konkrétnou hodnotou atribútu.

    Ak sa znamienko neustále mení (výška príjmu, pracovné skúsenosti, náklady na fixné aktíva podniku atď., ktoré môžu nadobudnúť akúkoľvek hodnotu v rámci určitých limitov), ​​musí sa pre toto znamenie zostaviť séria intervalových variácií.



    Skupinová tabuľka má tiež dva stĺpce. Prvý označuje hodnotu funkcie v intervale "od - do" (možnosti), druhý - počet jednotiek zahrnutých v intervale (frekvencia).

    Frekvencia (frekvencia opakovania) - počet opakovaní konkrétneho variantu hodnôt atribútu, označovaného fi , a súčet frekvencií rovnajúci sa objemu študovanej populácie, označ.

    Kde k je počet možností hodnoty atribútu

    Veľmi často je tabuľka doplnená o stĺpec, v ktorom sú vypočítané akumulované frekvencie S, ktoré ukazujú, koľko jednotiek populácie má hodnotu znaku nie väčšiu ako táto hodnota.

    Diskrétny variačný distribučný rad je rad, v ktorom sú skupiny zložené podľa znaku, ktorý sa mení diskrétne a má iba celočíselné hodnoty.

    Séria distribúcie intervalových variácií je séria, v ktorej atribút zoskupenia, ktorý tvorí základ zoskupenia, môže nadobúdať ľubovoľné hodnoty v určitom intervale vrátane zlomkových.

    Intervalový variačný rad je usporiadaná množina intervalov variácií hodnôt náhodnej premennej so zodpovedajúcimi frekvenciami alebo frekvenciami hodnôt množstva spadajúcich do každej z nich.

    Intervalový distribučný rad je účelné zostaviť predovšetkým s kontinuálnou variáciou znaku a tiež vtedy, ak sa diskrétna variácia prejavuje v širokom rozsahu, t.j. počet možností pre diskrétnu funkciu je pomerne veľký.

    Z tejto série už možno vyvodiť niekoľko záverov. Napríklad priemerný prvok série variácií (medián) môže byť odhadom najpravdepodobnejšieho výsledku merania. Prvý a posledný prvok variačného radu (t. j. minimálny a maximálny prvok vzorky) ukazuje rozptyl prvkov vzorky. Niekedy, ak je prvý alebo posledný prvok veľmi odlišný od zvyšku vzorky, potom sú vylúčené z výsledkov merania, pretože tieto hodnoty boli získané v dôsledku nejakého hrubého zlyhania, napríklad technológie.