Rânduri de variație. valori medii

Numele parametrului Sens
Subiect articol: Seria de variații
Rubrica (categoria tematica) Productie

Valorile observate ale unei variabile aleatorii X 1 , X 2 , …, x k numit Opțiuni.

Frecvență Opțiuni X i se numeste un numar n i (i=1,…,k) arătând de câte ori apare această variantă în probă.

Frecvență(frecvență relativă, acțiuni) opțiuni x i (i=1,…,k) se numește de obicei raportul frecvenței sale n i la dimensiunea eșantionului n.

Se numesc frecvențele și frecvențele cântare.

Frecvența acumulată este obișnuit să apelați numărul de opțiuni, ale căror valori sunt mai mici decât un dat X:

Frecvența acumulată Se obișnuiește să se numească raportul dintre frecvența acumulată și dimensiunea eșantionului:

serie de variații(seria statistică) - se obișnuiește să se numească o secvență de opțiuni scrise în ordine crescătoare și ponderile lor corespunzătoare.

Seria de variații ar trebui să fie discret(eșantion de valori ale unei variabile aleatoare discrete) și continuu (interval)(selectarea valorilor unei variabile aleatoare continue).

Seria variațională discretă are forma:

Când numărul de opțiuni este mare sau caracteristica este continuă (o variabilă aleatoare poate lua orice valoare într-un anumit interval), acestea sunt interval serie de variații.

Pentru a construi o serie de variații de interval, efectuați gruparea opțiune - sunt împărțite în intervale separate:

Numărul de intervale este uneori determinat folosind Formule Sturges:

Apoi se calculează numărul de variante care se încadrează în fiecare interval - frecvențe n i(sau frecventa n i/n). Dacă varianta se află la limita intervalului, atunci este atașată la intervalul potrivit.

Seria variațională de interval are forma:

Opțiuni
Frecvențele

Funcția de distribuție empirică (statistică). se obişnuieşte să se apeleze o funcţie a cărei valoare la punct X este egală cu frecvența relativă pe care varianta o va lua o valoare mai mică decât X(frecvența cumulativă pentru X):

Poligon de frecvență se numește polilinie ale cărei segmente conectează puncte cu coordonate ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). The poligon de frecvență, care este un analog statistic al poligonului de distribuții.

Merită spus că pentru o serie variațională continuă se poate construi un poligon dacă valorile X 1 , X 2 , …, x k luați punctele de mijloc ale intervalelor.

O serie de variații de interval este de obicei reprezentată grafic folosind histogramelor.

grafic de bare- o figură în trepte formată din dreptunghiuri ale căror baze sunt intervale de lungime parțială h= x i +1 – x i, i= 0,…,k-1, iar înălțimile sunt egale cu frecvențele (sau frecvențele) intervalelor n i (w i).

Cumula(curba cumulativă) - curba frecvențelor (frecvențe) acumulate. Pentru serie discretă cumulatul este o linie întreruptă care leagă punctele sau , . Pentru serie de intervale cumulat începe de la punctul, a cărui abscisă este egală cu începutul primului interval, iar ordonata este frecvența (frecvența) acumulată egală cu zero. Alte puncte ale acestei linii întrerupte corespund capetelor intervalelor.

Seria de variații - concept și tipuri. Clasificarea și caracteristicile categoriei „Seria de variante” 2017, 2018.

  • - Serii de variații de distribuție

    Distribuția cifrei de afaceri din comerțul cu amănuntul în Federația Rusă în 1995 în funcție de tipul de proprietate, milioane de ruble Tipuri de serii de distribuție Curs VIII. Serii de distribuție În urma prelucrării și sistematizării datelor statistice primare, se obțin ....


  • - Seria de variații

    Cea mai simplă transformare a datelor statistice este ordonarea lor după mărime. Mărimea eșantionului din populația generală, ordonată în ordinea nedescrescătoare a elementelor, adică , se numește serie de variații: . În cazul în care volumul de observații ... .


  • - Sarcina 2. Seria de variație de interval

    1. Pe baza unui eșantion dat corespunzător variantei sarcinii, construiți o serie de variații de interval; construiți o histogramă și cumulați (utilizați două metode: introducerea unei diagrame Excel și modul „Histogramă” al pachetului „Analiza datelor”). 2. Analizați histograma rezultată. ... .


  • - Alcătuiește o serie de variații a variabilității trăsăturii semințelor sau frunzelor de fasole ale oricărei plante de aceeași vârstă. Dezvăluie modele de variabilitate a trăsăturilor.

    O populație este o unitate structurală a unei specii. Numărul de populații. Cauzele fluctuațiilor populației. Relația indivizilor din populații și dintre diferitele populații ale aceleiași specii și ale diferitelor specii. 1. O caracteristică importantă a unei specii este distribuția ei în grupuri, populații în ...

  • Serii de variații: definiție, tipuri, caracteristici principale. Metoda de calcul
    modă, mediană, medie aritmetică în studii medicale și statistice
    (Afișați pe un exemplu condiționat).

    O serie variațională este o serie de valori numerice ale trăsăturii studiate, care diferă unele de altele prin mărimea lor și sunt aranjate într-o anumită succesiune (în ordine crescătoare sau descrescătoare). Fiecare valoare numerică a seriei se numește variantă (V), iar numerele care arată cât de des apare cutare sau cutare variantă în componența acestei serii se numesc frecvență (p).

    Numărul total de cazuri de observații, din care constă seria de variații, se notează cu litera n. Diferența de semnificație a caracteristicilor studiate se numește variație. Dacă semnul variabil nu are o măsură cantitativă, variația se numește calitativă, iar seria de distribuție se numește atribut (de exemplu, distribuția după rezultatul bolii, starea de sănătate etc.).

    Dacă un semn variabil are o expresie cantitativă, o astfel de variație se numește cantitativă, iar seria de distribuție se numește variațională.

    Serii variaționale se împart în discontinue și continue - după natura trăsăturii cantitative, simple și ponderate - în funcție de frecvența de apariție a variantei.

    Într-o serie variațională simplă, fiecare variantă apare o singură dată (p=1), într-una ponderată, aceeași variantă apare de mai multe ori (p>1). Exemple de astfel de serii vor fi discutate mai târziu în text. Dacă atributul cantitativ este continuu, i.e. între valori întregi există valori fracționale intermediare, seria variațională se numește continuă.

    De exemplu: 10.0 - 11.9

    14,0 - 15,9 etc.

    Dacă semnul cantitativ este discontinuu, i.e. valorile sale individuale (opțiunile) diferă între ele printr-un număr întreg și nu au valori fracționale intermediare, seria de variații se numește discontinuă sau discretă.

    Folosind datele din exemplul anterior despre ritmul cardiac

    pentru 21 de elevi, vom construi o serie de variații (Tabelul 1).

    tabelul 1

    Distribuția studenților la medicină în funcție de frecvența pulsului (bpm)

    Astfel, a construi o serie variațională înseamnă a sistematiza, eficientiza valorile numerice existente (opțiuni), adică. aranjați într-o anumită succesiune (în ordine crescătoare sau descrescătoare) cu frecvențele corespunzătoare. În exemplul luat în considerare, opțiunile sunt aranjate în ordine crescătoare și sunt exprimate ca numere întregi discontinue (discrete), fiecare opțiune apare de mai multe ori, i.e. avem de-a face cu o serie variațională ponderată, discontinuă sau discretă.

    De regulă, dacă numărul de observații din populația statistică pe care o studiem nu depășește 30, atunci este suficient să aranjam toate valorile trăsăturii studiate într-o serie variațională în ordine crescătoare, ca în tabel. 1, sau în ordine descrescătoare.

    Cu un număr mare de observații (n>30), numărul de variante care apar poate fi foarte mare, în acest caz se alcătuiește un interval sau o serie variațională grupată, în care, pentru a simplifica prelucrarea ulterioară și a clarifica natura distribuției, variantele sunt combinate în grupuri.

    De obicei, numărul de opțiuni de grup variază de la 8 la 15.

    Trebuie să fie cel puțin 5, pentru că. în caz contrar, va fi o mărire prea aspră, excesivă, care distorsionează imaginea de ansamblu a variației și afectează foarte mult acuratețea valorilor medii. Când numărul de opțiuni de grup este mai mare de 20-25, acuratețea calculării valorilor medii crește, dar caracteristicile variației caracteristicilor sunt distorsionate semnificativ, iar procesarea matematică devine mai complicată.

    La compilarea unei serii grupate, este necesar să se țină cont

    − grupurile de variante trebuie plasate într-o anumită ordine (crescător sau descrescător);

    - intervalele din grupele de variante sa fie aceleasi;

    − valorile limitelor intervalelor nu trebuie să coincidă, deoarece nu va fi clar în ce grupuri să atribuie opțiuni individuale;

    - este necesar să se țină seama de caracteristicile calitative ale materialului colectat la stabilirea limitelor intervalelor (de exemplu, la studierea greutății adulților, este acceptabil un interval de 3-4 kg, iar pentru copii în primele luni de viață nu trebuie să depășească 100 g.)

    Să construim o serie grupată (interval) care caracterizează datele privind frecvența pulsului (numărul de bătăi pe minut) pentru 55 de studenți la medicină înainte de examen: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    Pentru a construi o serie grupată, aveți nevoie de:

    1. Determinați valoarea intervalului;

    2. Determinați mijlocul, începutul și sfârșitul grupelor variantei seriei de variații.

    ● Valoarea intervalului (i) este determinată de numărul de grupuri așteptate (r), al căror număr este stabilit în funcție de numărul de observații (n) conform unui tabel special

    Numărul de grupuri în funcție de numărul de observații:

    În cazul nostru, pentru 55 de elevi, este posibil să se alcătuiască de la 8 până la 10 grupe.

    Valoarea intervalului (i) este determinată de următoarea formulă -

    i = Vmax-Vmin/r

    În exemplul nostru, valoarea intervalului este 82-58/8= 3.

    Dacă valoarea intervalului este un număr fracționar, rezultatul trebuie rotunjit la un număr întreg.

    Există mai multe tipuri de medii:

    ● medie aritmetică,

    ● medie geometrică,

    ● medie armonică,

    ● rădăcină medie pătrată,

    ● mediu progresiv,

    ● mediană

    În statistica medicală, mediile aritmetice sunt cel mai des folosite.

    Media aritmetică (M) este o valoare generalizantă care determină valoarea tipică care este caracteristică întregii populații. Principalele metode de calcul a lui M sunt: ​​metoda mediei aritmetice și metoda momentelor (abaterile condiționate).

    Metoda mediei aritmetice este utilizată pentru a calcula media aritmetică simplă și media aritmetică ponderată. Alegerea metodei de calcul a valorii medii aritmetice depinde de tipul seriei de variații. În cazul unei serii variaționale simple, în care fiecare variantă apare o singură dată, media aritmetică simplă este determinată de formula:

    unde: М – valoarea medie aritmetică;

    V este valoarea caracteristicii variabilei (opțiuni);

    Σ - indică acţiunea - însumare;

    n este numărul total de observații.

    Un exemplu de calcul al mediei aritmetice este simplu. Frecvența respiratorie (numărul de respirații pe minut) la 9 bărbați cu vârsta de 35 de ani: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    Pentru a determina nivelul mediu al frecvenței respiratorii la bărbații în vârstă de 35 de ani, este necesar:

    1. Construiți o serie variațională, plasând toate opțiunile în ordine crescătoare sau descrescătoare, avem o serie variațională simplă, deoarece valorile variantei apar o singură dată.

    M = ∑V/n = 171/9 = 19 respirații pe minut

    Concluzie. Frecvența respiratorie la bărbații în vârstă de 35 de ani este în medie de 19 respirații pe minut.

    Dacă valorile individuale ale variantei sunt repetate, nu este nevoie să scrieți fiecare variantă într-o linie, este suficient să enumerați dimensiunile variantei care apar (V) și apoi să indicați numărul repetărilor lor ( p). o astfel de serie variațională, în care variantele sunt, parcă, ponderate în funcție de numărul de frecvențe care le corespund, se numește serie variațională ponderată, iar valoarea medie calculată este media ponderată aritmetică.

    Media ponderată aritmetică este determinată de formula: M= ∑Vp/n

    unde n este numărul de observații egal cu suma frecvențelor - Σr.

    Un exemplu de calcul a mediei ponderate aritmetice.

    Durata invalidității (în zile) la 35 de pacienți cu boli respiratorii acute (IRA) tratați de un medic local în primul trimestru al anului curent a fost: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 zile .

    Metodologia de determinare a duratei medii a dizabilității la pacienții cu infecții respiratorii acute este următoarea:

    1. Să construim o serie variațională ponderată, deoarece valorile variantelor individuale se repetă de mai multe ori. Pentru a face acest lucru, puteți aranja toate opțiunile în ordine crescătoare sau descrescătoare cu frecvențele corespunzătoare.

    În cazul nostru, opțiunile sunt în ordine crescătoare.

    2. Calculați media ponderată aritmetică folosind formula: M = ∑Vp/n = 233/35 = 6,7 zile

    Distribuția pacienților cu infecții respiratorii acute în funcție de durata dizabilității:

    Durata incapacității de muncă (V) Număr de pacienți (p) vp
    ∑p = n = 35 ∑Vp = 233

    Concluzie. Durata dizabilității la pacienții cu boli respiratorii acute a fost în medie de 6,7 zile.

    Modul (Mo) este cea mai comună variantă din seria de variații. Pentru distribuția prezentată în tabel, modul corespunde variantei egale cu 10, apare mai des decât altele - de 6 ori.

    Distribuția pacienților după durata șederii într-un pat de spital (în zile)

    V
    p

    Uneori este dificil să se determine valoarea exactă a modului, deoarece pot exista mai multe observații în datele studiate care apar „cel mai des”.

    Mediana (Me) este un indicator neparametric care împarte seria de variații în două jumătăți egale: același număr de opțiuni este situat de ambele părți ale medianei.

    De exemplu, pentru distribuția prezentată în tabel, mediana este 10 deoarece pe ambele părți ale acestei valori se află pe a 14-a opțiune, adică numărul 10 ocupă o poziție centrală în această serie și este mediana acestuia.

    Având în vedere că numărul de observații din acest exemplu este par (n=34), mediana poate fi determinată după cum urmează:

    Eu = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    Aceasta înseamnă că mijlocul seriei cade pe a șaptesprezecea opțiune, care corespunde unei mediane de 10. Pentru distribuția prezentată în tabel, media aritmetică este:

    M = ∑Vp/n = 334/34 = 10,1

    Deci, pentru 34 de observații din tabel. 8, avem: Mo=10, Me=10, media aritmetică (M) este 10,1. În exemplul nostru, toți cei trei indicatori s-au dovedit a fi egali sau apropiați unul de celălalt, deși sunt complet diferiți.

    Media aritmetică este suma rezultată a tuturor influențelor; la formarea ei iau parte toate opțiunile, fără excepție, inclusiv cele extreme, adesea atipice pentru un anumit fenomen sau set.

    Modul și mediana, spre deosebire de media aritmetică, nu depind de valoarea tuturor valorilor individuale ale atributului variabil (valorile variantelor extreme și gradul de împrăștiere al seriei). Media aritmetică caracterizează întreaga masă de observații, modul și mediana caracterizează volumul

    Practica 1

    SERIE VARIAȚIONALĂ DE DISTRIBUȚIE

    serie de variații sau aproape de distribuție numită distribuția ordonată a unităților populației în funcție de valorile în creștere (mai des) sau descrescătoare (mai rar) ale atributului și numărarea numărului de unități cu una sau alta valoare a atributului.

    Sunt 3 drăguț domeniul de distribuție:

    1) rând clasat- aceasta este o listă a unităților individuale ale populației în ordinea crescătoare a trăsăturii studiate; dacă numărul de unități de populație este suficient de mare, seria clasată devine greoaie, iar în astfel de cazuri seria de distribuție se construiește prin gruparea unităților populației în funcție de valorile trăsăturii studiate (dacă trăsătura ia un număr mic de valori, atunci se construiește o serie discretă, iar în caz contrar, o serie de intervale);

    2) serie discretă- acesta este un tabel format din două coloane (rânduri) - valori specifice ale unui atribut diferit X iși numărul de unități de populație cu valoarea dată a caracteristicii f i– frecvențe; numărul de grupuri dintr-o serie discretă este determinat de numărul de valori efectiv existente ale atributului variabil;

    3) serie de intervale- acesta este un tabel format din două coloane (rânduri) - intervale de semn variabil X iși numărul de unități de populație care se încadrează într-un interval dat (frecvențe), sau proporția acestui număr în numărul total de populații (frecvențe).

    Sunt numite numere care arată de câte ori apar opțiuni individuale într-o anumită populație frecvente sau cântare variantă și sunt notate cu o literă mică a alfabetului latin f. Suma totală a frecvențelor seriei variaționale este egală cu volumul acestei populații, i.e.

    Unde k– numărul de grupuri, n este numărul total de observații sau dimensiunea populației.

    Frecvențele (greutățile) sunt exprimate nu numai în absolut, ci și în numere relative - în fracții de unitate sau ca procent din numărul total de variante care alcătuiesc acest set. În astfel de cazuri, se numesc greutăți frecvențe relative sau frecvente. Suma totală a detaliilor este egală cu unu

    sau
    ,

    dacă frecvenţele sunt exprimate ca procent din numărul total de observaţii P.Înlocuirea frecvențelor cu frecvențe nu este obligatorie, dar uneori se dovedește a fi utilă și chiar necesară în acele cazuri când este necesar să se compare între ele serii variaționale care diferă mult în volumele lor.

    În funcție de modul în care variază atributul - discret sau continuu, într-un interval larg sau îngust - populația statistică este distribuită în fără intervale sau interval linii de variație. În primul caz, frecvențele se referă direct la valorile clasate ale trăsăturii, care dobândesc poziția grupurilor sau claselor individuale ale seriei de variații, în al doilea, calculează frecvențele aferente intervalelor sau intervalelor individuale (din - to), în care este împărțită variația generală a trăsăturii, variind de la opțiuni minime la maxime pentru acest set. Aceste spații sau spații de clasă pot fi sau nu egale ca lățime. De aici se disting serie variațională cu intervale egale și inegale.În serii de intervale inegale, natura distribuției de frecvență se modifică pe măsură ce lățimea intervalelor de clasă se modifică. Gruparea cu intervale inegale în biologie este folosită relativ rar. De regulă, datele biometrice sunt distribuite în serii de intervale egale, ceea ce permite nu numai identificarea modelului de variație, dar facilitează și calcularea caracteristicilor numerice sumare ale seriei de variații, comparând seria de distribuție între ele.

    Când începeți să construiți o serie variațională cu intervale egale, este important să conturați corect lățimea intervalului de clasă. Faptul este că o grupare brută (când sunt stabilite intervale de clasă foarte largi) denaturează caracteristicile tipice ale variației și duce la o scădere a preciziei caracteristicilor numerice ale seriei. Atunci când se aleg intervale excesiv de înguste, acuratețea caracteristicilor numerice generalizate crește, dar seria se dovedește a fi prea extinsă și nu oferă o imagine clară a variației.

    Pentru a obţine o serie variaţională bine definită şi Pentru a asigura o acuratețe suficientă a caracteristicilor numerice calculate din acesta, este necesar să se împartă variația trăsăturii (în intervalul de la opțiunile minime la maxime) într-un astfel de număr de grupuri sau clase care să satisfacă ambele cerințe. Această problemă este rezolvată prin împărțirea intervalului de variație a atributului la numărul de grupuri sau clase care sunt planificate la construirea seriei de variații:

    ,

    Unde h– valoarea intervalului; X m a x i X min - valorile maxime și minime în agregat; k este numărul de grupuri.

    Când se construiește o serie de distribuție a intervalelor, este necesar să se aleagă numărul optim de grupuri (intervale de caractere) și să se stabilească lungimea (intervalul) intervalului. Deoarece analiza unei serii de distribuție compară frecvențele în intervale diferite, este necesar ca lungimea intervalelor să fie constantă. Dacă trebuie să aveți de-a face cu o serie de intervale de distribuție cu intervale inegale, atunci pentru comparabilitate trebuie să aduceți frecvența sau frecvența la unitatea intervalului, valoarea rezultată se numește densitate ρ , adică
    .

    Numărul optim de grupuri este ales astfel încât varietatea valorilor atributului în agregat să fie reflectată într-o măsură suficientă și, în același timp, regularitatea distribuției, forma acesteia să nu fie distorsionată de fluctuațiile aleatorii ale frecvenței. Dacă sunt prea puține grupuri, nu va exista nici un model de variație; dacă există prea multe grupuri, salturile aleatorii de frecvență vor distorsiona forma distribuției.

    Cel mai adesea, numărul de grupuri dintr-o serie de distribuție este determinat de formula Sturgess:

    Unde n- mărimea populaţiei.

    O reprezentare grafică oferă asistență esențială în analiza unei serii de distribuție și a proprietăților acesteia. Seria de intervale este reprezentată de o diagramă cu bare, în care bazele barelor, situate de-a lungul axei absciselor, sunt intervalele de valori ale atributului variabil, iar înălțimile barelor sunt frecvențele corespunzătoare scalei de-a lungul axa ordonatelor. Acest tip de diagramă se numește histogramă.

    Dacă există o serie de distribuție discretă sau se folosesc intervalele mijlocii, atunci reprezentarea grafică a unei astfel de serii se numește poligon, care se obține prin conectarea punctelor drepte cu coordonatele X iși f i .

    Dacă valorile clasei sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate sunt reprezentate de-a lungul axei ordonatelor, urmate de conectarea punctelor cu linii drepte, se obține un grafic numit cumulativ. Frecvențele acumulate se găsesc prin însumare succesivă, sau cumul frecvențe în direcția de la prima clasă până la sfârșitul seriei de variații.

    Exemplu. Există date despre producția de ouă a 50 de găini ouătoare timp de 1 an ținute într-o fermă de păsări (Tabelul 1.1).

    T a b l e 1.1

    Găinile ouătoare

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Nr de găini ouătoare

    Producția de ouă, buc.

    Este necesar să construiți o serie de distribuție a intervalelor și să o afișați grafic sub formă de histogramă, poligon și cumul.

    Se poate observa că trăsătura variază de la 212 la 245 de ouă obținute de la o găină ouătoare într-un an.

    În exemplul nostru, folosind formula Sturgess, determinăm numărul de grupuri:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Calculați lungimea (intervalul) intervalului folosind formula:

    .

    Să construim o serie de intervale cu 7 grupuri și un interval de 5 bucăți. ouă (Tabelul 1.2). Pentru a construi grafice în tabel, calculăm mijlocul intervalelor și frecvența acumulată.

    T a b l e 1.2

    Seria de intervale de distribuție a producției de ouă

    Grup de găini ouătoare în funcție de mărimea producției de ouă

    X i

    Număr de găini ouătoare

    f i

    Punct de mijloc al intervalului

    X eu

    Frecvența acumulată

    f i

    Să construim o histogramă a distribuției producției de ouă (Fig. 1.1).

    Orez. 1.1. Histograma distribuției producției de ouă

    Aceste histograme arată forma de distribuție caracteristică multor trăsături: valorile intervalelor medii ale trăsăturii sunt mai frecvente, iar valorile extreme (mici și mari) ale trăsăturii sunt mai puțin frecvente. Forma acestei distribuții este apropiată de legea distribuției normale, care se formează dacă o variabilă variabilă este influențată de un număr mare de factori, niciunul dintre care nu are o valoare predominantă.

    Poligonul și cumulul distribuției producției de ouă au forma (Fig. 1.2 și 1.3).

    Orez. 1.2. Poligonul de distribuție a ouălor

    Orez. 1.3. Distribuția cumulată a producției de ouă

    Tehnologia de rezolvare a problemelor în procesor de foi de calcul Microsoft excela Următorul.

    1. Introduceți datele inițiale conform fig. 1.4.

    2. Clasează rândul.

    2.1. Selectați celulele A2:A51.

    2.2. Faceți clic stânga pe bara de instrumente de pe butonul<Сортировка по возрастанию > .

    3. Determinați dimensiunea intervalului pentru construirea seriei de intervale a distribuției.

    3.1. Copiați celula A2 în celula E53.

    3.2. Copiați celula A51 în celula E54.

    3.3. Calculați intervalul de variație. Pentru a face acest lucru, introduceți formula în celula E55 =E54-E53.

    3.4. Calculați numărul de grupuri de variații. Pentru a face acest lucru, introduceți formula în celula E56 =1+3,322*LOG10(50).

    3.5. Introduceți în celula E57 numărul rotunjit de grupuri.

    3.6. Calculați lungimea intervalului. Pentru a face acest lucru, introduceți formula în celula E58 =E55/E57.

    3.7. Introduceți în celula E59 lungimea rotunjită a intervalului.

    4. Construiți o serie de intervale.

    4.1. Copiați celula E53 în celula B64.

    4.2. Introduceți formula în celula B65 =B64+$E$59.

    4.3. Copiați celula B65 în celulele B66:B70.

    4.4. Introduceți formula în celula C64 =B65.

    4.5. Introduceți formula în celula C65 =C64+$E$59.

    4.6. Copiați celula C65 în celulele C66:C70.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.5).

    5. Calculați frecvența intervalului.

    5.1. Executați comanda Serviciu,Analiza datelor făcând clic alternativ cu butonul stâng al mouse-ului.

    5.2. În caseta de dialog Analiza datelor setați cu butonul stâng al mouse-ului: Instrumente de analiză <Гистограмма>(Fig. 1.6).

    5.3. Faceți clic stânga pe butonul<ОК>.

    5.4. Pe fila grafic de bare setați parametrii conform fig. 1.7.

    5.5. Faceți clic stânga pe butonul<ОК>.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.8).

    6. Completați tabelul „Seria de intervale de distribuție”.

    6.1. Copiați celulele B74:B80 în celulele D64:D70.

    6.2. Calculați suma frecvențelor. Pentru a face acest lucru, selectați celulele D64:D70 și faceți clic stânga pe butonul din bara de instrumente<Автосумма > .

    6.3. Calculați mijlocul intervalelor. Pentru a face acest lucru, introduceți formula în celula E64 =(B64+C64)/2și copiați în celulele E65:E70.

    6.4. Calculați frecvențele acumulate. Pentru a face acest lucru, copiați celula D64 în celula F64. În celula F65, introduceți formula =F64+D65 și copiați-o în celulele F66:F70.

    Rezultatele soluției sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.9).

    7. Editați histograma.

    7.1. Faceți clic dreapta pe diagrama de pe numele „buzunar” și în fila care apare, faceți clic pe butonul<Очистить>.

    7.2. Faceți clic dreapta pe diagramă și pe fila care apare, faceți clic pe butonul<Исходные данные>.

    7.3. În caseta de dialog Datele inițiale modificați etichetele axei X. Pentru a face acest lucru, selectați celulele B64:C70 (Fig. 1.10).

    7.5. apasa tasta .

    Rezultatele sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.11).

    8. Construiți un poligon de distribuție a ouălor.

    8.1. Faceți clic stânga pe bara de instrumente de pe butonul<Мастер диаграмм > .

    8.2. În caseta de dialog Expert diagramă (pasul 1 din 4) utilizați butonul stâng al mouse-ului pentru a seta: Standard <График>(Fig. 1.12).

    8.3. Faceți clic stânga pe butonul<Далее>.

    8.4. În caseta de dialog Chart Wizard (Pasul 2 din 4) setați parametrii conform fig. 1.13.

    8.5. Faceți clic stânga pe butonul<Далее>.

    8.6. În caseta de dialog Expert grafic (pasul 3 din 4) introduceți numele diagramei și ale axei Y (Fig. 1.14).

    8.7. Faceți clic stânga pe butonul<Далее>.

    8.8. În caseta de dialog Chart Wizard (Pasul 4 din 4) setați parametrii conform fig. 1.15.

    8.9. Faceți clic stânga pe butonul<Готово>.

    Rezultatele sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.16).

    9. Introduceți etichete de date pe diagramă.

    9.1. Faceți clic dreapta pe diagramă și pe fila care apare, faceți clic pe butonul<Исходные данные>.

    9.2. În caseta de dialog Datele inițiale modificați etichetele axei X. Pentru a face acest lucru, selectați celulele E64:E70 (Fig. 1.17).

    9.3. apasa tasta .

    Rezultatele sunt afișate pe ecranul de afișare în următoarea formă (Fig. 1.18).

    Cumulul de distribuție este construit în mod similar cu poligonul de distribuție pe baza frecvențelor acumulate.

      Toate valorile proprietății studiate care apar în populația studiată se numesc valoarea caracteristicii (variantă, variantă) și modificarea acestei valori variație. Variantele sunt notate cu litere mici ale alfabetului latin cu indici corespunzători numărului de serie al grupului - X i .

      Un număr care arată de câte ori apare fiecare valoare caracteristică în populația studiată frecvență și notăm f i . Suma tuturor frecvențelor seriei este egală cu volumul populației studiate.

      De multe ori trebuie calculat frecventa acumulata (S). Frecvența cumulativă pentru fiecare valoare caracteristică arată câte unități de populație au o valoare caracteristică nu mai mare decât valoarea dată. Frecvența cumulativă se calculează prin adăugarea secvenţială la frecvenţa primei valori a caracteristicii de frecvenţă a următoarelor valori caracteristice:

    Frecvența acumulată începe să fie calculată de la prima valoare a caracteristicii

    Suma frecvențelor este întotdeauna egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe face posibilă compararea seriilor variaționale cu numere diferite de observații.

    Frecvențele seriei (f i) în unele cazuri pot fi înlocuite cu frecvențele (ω i).

    Dacă seria de variații este dată cu intervale inegale, atunci pentru o idee corectă a naturii distribuției, este necesar să se calculeze densitatea distribuției absolute sau relative.

      Densitatea absolută de distribuție (p f ) reprezintă valoarea frecvenței pe unitate de mărime a intervalului unui grup separat al seriei:

    R f = f/ i.

      Densitatea de distribuție relativă (p ω ) reprezintă valoarea frecvenței pe unitate de mărime a intervalului unui grup separat al seriei:

    R ω = ω / i.

    Pentru serii cu intervale inegale, doar aceste caracteristici dau o idee mai corectă a naturii distribuției decât frecvența și frecvența.

      Distribuția statistică a eșantionului denumiți lista de opțiuni (valori caracteristice) și frecvențele corespunzătoare sau densitățile de distribuție, frecvențele relative sau densitățile de distribuție relative.

    Serii de distribuție diferite sunt caracterizate de un set diferit de caracteristici de frecvență:

    minim - serie atributivă (frecvență, frecvență),

    pentru discrete, sunt utilizate patru caracteristici (frecvență, frecvență, frecvență acumulată, frecvență acumulată),

    pentru cele de interval - toate cele cinci (frecvență, frecvență, frecvență cumulată, frecvență cumulativă, densitate de distribuție absolută și relativă).

    1. Reguli pentru construirea unei serii de variații de interval

    1. Reprezentarea grafică a seriei de variații

    Prima etapă în studiul seriei variaționale este construcția reprezentării sale grafice. Reprezentarea grafică a seriei variaționale facilitează analiza acestora și face posibilă aprecierea formei distribuției. Pentru o reprezentare grafică a unei serii variaționale în statistică, se construiesc o histogramă, un poligon și o distribuție cumulativă.

    O serie variațională discretă este descrisă ca un așa-numit poligon de frecvență.

    Pentru a afișa seria de intervale, se utilizează un poligon de distribuție a frecvenței și o histogramă de frecvență.

    Graficele sunt construite într-un sistem de coordonate dreptunghiular.

    (definiția unei serii variaționale; componentele unei serii variaționale; trei forme ale unei serii variaționale; oportunitatea construirii unei serii de intervale; concluzii care pot fi trase din seria construită)

    O serie variațională este o succesiune a tuturor elementelor unei probe aranjate în ordine nedescrescătoare. Se repetă aceleași elemente

    Variaționale - acestea sunt serii construite pe o bază cantitativă.

    Seriile de distribuție variațională constau din două elemente: variante și frecvențe:

    Variantele sunt valorile numerice ale unei trăsături cantitative din seria de variații a distribuției. Ele pot fi pozitive sau negative, absolute sau relative. Deci, atunci când se grupează întreprinderile în funcție de rezultatele activității economice, opțiunile sunt pozitive - acesta este profit și numere negative - aceasta este o pierdere.

    Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor se numește volumul populației și este determinată de numărul de elemente ale întregii populații.

    Frecvențele sunt frecvențe exprimate ca valori relative (fracții de unități sau procente). Suma frecvențelor este egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe face posibilă compararea seriilor variaționale cu numere diferite de observații.

    Există trei forme de serie de variații: serii clasificate, serii discrete și serii cu intervale.

    O serie clasificată este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a trăsăturii studiate. Clasificarea facilitează împărțirea datelor cantitative în grupuri, detectează imediat cele mai mici și mai mari valori ale unei caracteristici și evidențiază valorile care se repetă cel mai des.

    Alte forme ale seriei de variații sunt tabele de grup întocmite în funcție de natura variației valorilor trăsăturii studiate. Prin natura variației, se disting semne discrete (discontinue) și continue.

    O serie discretă este o astfel de serie variațională, a cărei construcție se bazează pe semne cu schimbare discontinuă (semne discrete). Acestea din urmă includ categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc. Aceste semne pot lua doar un număr finit de anumite valori.

    O serie variațională discretă este un tabel care constă din două coloane. Prima coloană indică valoarea specifică a atributului, iar a doua - numărul de unități de populație cu o anumită valoare a atributului.

    Dacă un semn are o schimbare continuă (valoarea venitului, experiența de muncă, costul mijloacelor fixe ale unei întreprinderi etc., care poate lua orice valoare în anumite limite), atunci trebuie construită o serie de variații de interval pentru acest semn.



    Tabelul de grup de aici are și două coloane. Primul indică valoarea caracteristicii în intervalul „de la - la” (opțiuni), al doilea - numărul de unități incluse în interval (frecvență).

    Frecvența (frecvența de repetare) - numărul de repetări ale unei anumite variante a valorilor atributului, notat fi, și suma frecvențelor egală cu volumul populației studiate, notat

    Unde k este numărul de opțiuni de valoare de atribut

    Foarte des, tabelul este completat cu o coloană în care se calculează frecvențele acumulate S, care arată câte unități ale populației au o valoare caracteristică nu mai mare decât această valoare.

    O serie de distribuție variațională discretă este o serie în care grupurile sunt compuse în funcție de o trăsătură care variază discret și ia doar valori întregi.

    Seria de variație a intervalului de distribuție este o serie în care atributul de grupare, care formează baza grupării, poate lua orice valori într-un anumit interval, inclusiv cele fracționale.

    O serie variațională de interval este un set ordonat de intervale de variație a valorilor unei variabile aleatoare cu frecvențele corespunzătoare sau frecvențele valorilor cantității care se încadrează în fiecare dintre ele.

    Este oportun să se construiască o serie de distribuție pe intervale, în primul rând, cu o variație continuă a unei trăsături și, de asemenea, dacă o variație discretă se manifestă pe o gamă largă, i.e. numărul de opțiuni pentru o caracteristică discretă este destul de mare.

    Din această serie se pot trage deja câteva concluzii. De exemplu, elementul mediu al unei serii de variații (mediana) poate fi o estimare a rezultatului cel mai probabil al unei măsurători. Primul și ultimul element al seriei variaționale (adică elementul minim și maxim al eșantionului) arată răspândirea elementelor eșantionului. Uneori, dacă primul sau ultimul element este foarte diferit de restul eșantionului, atunci ele sunt excluse din rezultatele măsurătorilor, având în vedere că aceste valori au fost obținute ca urmare a unui fel de defecțiune gravă, de exemplu, tehnologie.