Редове с вариации. средни стойности

Име на параметъра смисъл
Тема на статията: Вариационна серия
Рубрика (тематична категория) Производство

Наблюдавани стойности на произволна променлива х 1 , х 2 , …, x kНаречен настроики.

Честотанастроики хаз се наричам число n i (и=1,…,к) показва колко пъти този вариант се среща в извадката.

Честота(относителна честота, акции) опции x i (и=1,…,к) обикновено се нарича съотношение на неговата честота n iдо размера на извадката н.

Честотите и честотите се наричат везни.

Натрупана честотаобичайно е да се извиква броят на опциите, чиито стойности са по-малки от дадена х:

Натрупана честотаОбичайно е да се нарича съотношението на натрупаната честота към размера на извадката:

вариационна серия(статистически серии) - обичайно е да се нарича поредица от опции, написани във възходящ ред и съответните им тегла.

Вариантната серия трябва да бъде отделен(извадка от стойности на дискретна случайна променлива) и непрекъснат (интервал)(избор на стойности на непрекъсната произволна променлива).

Дискретната вариационна серия има формата:

Когато броят на опциите е голям или характеристиката е непрекъсната (случайна променлива може да приеме всяка стойност в определен интервал), те са интервалвариационна серия.

За да изградите серия от интервални вариации, изпълнете групиранеопция - те са разделени на отделни интервали:

Броят на интервалите понякога се определя с помощта на Формули на Стърджс:

След това се изчислява броят на вариантите, които попадат във всеки интервал – честоти n i(или честота n i/н). Ако вариантът е на границата на интервала, тогава той е прикрепен към десния интервал.

Интервалният вариационен ред има формата:

Настроики
Честоти

Емпирична (статистическа) функция на разпределениеобичайно е да се извиква функция, чиято стойност в точката хе равна на относителната честота, която вариантът ще приеме на стойност, по-малка от х(кумулативна честота за х):

Честотен полигонсе нарича полилиния, чиито сегменти свързват точки с координати ( х 1 ; н 1), (х 2 ; н 2), …, (x k; nk). В честотен полигон, което е статистически аналог на полигона от разпределения.

Струва си да се каже, че за непрекъсната вариационна серия може да се изгради многоъгълник, ако стойностите х 1 , х 2 , …, x kвземете средните точки на интервалите.

Интервалната вариационна серия обикновено се изобразява графично с помощта на хистограми.

лента диаграма- стъпаловидна фигура, състояща се от правоъгълници, чиито основи са частични интервали по дължина з= x i +1 – x i, и= 0,…,к-1, а височините са равни на честотите (или честотите) на интервалите n i (w i).

Кумулирайте(кумулативна крива) - крива на натрупаните честоти (честоти). За дискретна сериякумулата е прекъсната линия, свързваща точките или , . За интервална сериякумулата започва от точката, чиято абсцисса е равна на началото на първия интервал, а ординатата е натрупаната честота (честота), равна на нула. Други точки от тази прекъсната линия съответстват на краищата на интервалите.

Вариантна серия - концепция и видове. Класификация и характеристики на категорията "Вариационна серия" 2017, 2018 г.

  • - Вариантна серия на разпространение

    Разпределение на търговския оборот на дребно в Руската федерация през 1995 г. по видове собственост, милиона рубли Видове разпределителни серии Лекция VIII. Редове на разпределение В резултат на обработка и систематизация на първични статистически данни те получават ....


  • - Вариационна серия

    Най-простата трансформация на статистическите данни е тяхното подреждане по величина. Размер на извадката от общата съвкупност, подредена в ненамаляващ ред на елементите, т.е. , се нарича вариационна серия: . В случай, когато обемът на наблюденията ... .


  • - Задача 2. Интервална вариационна серия

    1. Въз основа на дадена извадка, съответстваща на варианта на задачата, изградете интервална вариационна серия; изградете хистограма и кумулирайте (използвайте два метода: вмъкване на диаграма на Excel и режим "Хистограма" на пакета "Анализ на данни"). 2. Анализирайте получената хистограма. ...


  • - Съставете серия от вариации на променливостта на чертата на семена от боб или листа на всяко растение на същата възраст. Разкрийте модели на вариабилност на чертите.

    Популацията е структурна единица на даден вид. Броят на популациите. Причини за колебания на населението. Връзката на индивидите в популациите и между различни популации от един и същи и различни видове. 1. Важна характеристика на един вид е разпространението му в групи, популации в ...

  • Вариационни серии: определение, видове, основни характеристики. Метод на изчисление
    мода, медиана, средноаритметично в медицинските и статистическите изследвания
    (Показване на условен пример).

    Вариационна серия е поредица от числови стойности на изследваната черта, които се различават една от друга по своята величина и са подредени в определена последователност (във възходящ или низходящ ред). Всяка числова стойност на серията се нарича вариант (V), а числата, показващи колко често този или онзи вариант се среща в състава на тази серия, се наричат ​​честота (p).

    Общият брой случаи на наблюдения, от които се състои вариационната серия, се обозначава с буквата n. Разликата в значението на изследваните характеристики се нарича вариация. Ако променливият признак няма количествена мярка, вариацията се нарича качествена, а поредицата на разпределение се нарича атрибутивна (например разпределение по изход на заболяването, здравен статус и т.н.).

    Ако променлив знак има количествен израз, такава вариация се нарича количествена, а редът на разпределение се нарича вариационен.

    Вариационните серии се делят на прекъснати и непрекъснати - според естеството на количествения признак, прости и претеглени - според честотата на поява на варианта.

    В проста вариационна серия всеки вариант се среща само веднъж (p=1), в претеглена един и същи вариант се среща няколко пъти (p>1). Примери за такива серии ще бъдат разгледани по-нататък в текста. Ако количественият атрибут е непрекъснат, т.е. между целочислени стойности има междинни дробни стойности, вариационният ред се нарича непрекъснат.

    Например: 10.0 - 11.9

    14.0 - 15.9 и др.

    Ако количественият знак е прекъснат, т.е. неговите отделни стойности (опции) се различават една от друга с цяло число и нямат междинни дробни стойности, вариационният ред се нарича прекъснат или дискретен.

    Използвайки данните от предишния пример за сърдечната честота

    за 21 ученика ще изградим вариационна серия (Таблица 1).

    маса 1

    Разпределение на студентите по медицина по честота на пулса (bpm)

    По този начин, изграждането на вариационна серия означава систематизиране, рационализиране на съществуващите числови стойности (опции), т.е. подреждат в определена последователност (във възходящ или низходящ ред) със съответните им честоти. В разглеждания пример опциите са подредени във възходящ ред и се изразяват като прекъснати (дискретни) цели числа, като всяка опция се среща няколко пъти, т.е. имаме работа с претеглена, прекъсната или дискретна вариационна серия.

    Като правило, ако броят на наблюденията в статистическата популация, която изучаваме, не надвишава 30, тогава е достатъчно всички стойности на изследваната черта да се подредят във вариационна серия в нарастващ ред, както е в таблицата. 1, или в низходящ ред.

    При голям брой наблюдения (n>30) броят на възникващите варианти може да бъде много голям, в този случай се съставя интервална или групирана вариационна серия, в която, за да се опрости последващата обработка и да се изясни естеството на разпределението, вариантите се обединяват в групи.

    Обикновено броят на груповите опции варира от 8 до 15.

    Трябва да са поне 5 от тях, т.к. в противен случай ще бъде твърде грубо, прекомерно уголемяване, което изкривява цялостната картина на вариациите и силно се отразява на точността на средните стойности. Когато броят на груповите опции е повече от 20-25, точността на изчисляване на средните стойности се увеличава, но характеристиките на вариацията на характеристиките са значително изкривени и математическата обработка става по-сложна.

    При съставянето на групирана серия е необходимо да се вземе предвид

    − вариантните групи трябва да бъдат поставени в определен ред (възходящ или низходящ);

    - интервалите във вариантните групи трябва да са еднакви;

    − стойностите на границите на интервалите не трябва да съвпадат, т.к няма да е ясно в кои групи да се приписват отделни опции;

    - необходимо е да се вземат предвид качествените характеристики на събрания материал при определяне на границите на интервалите (например при изучаване на теглото на възрастни е приемлив интервал от 3-4 кг, а за деца през първите месеци от живота не трябва да надвишава 100 g.)

    Нека изградим групирана (интервална) серия, която характеризира данните за честотата на пулса (брой удари в минута) за 55 студенти по медицина преди изпита: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    За да създадете групирана серия, трябва:

    1. Определете стойността на интервала;

    2. Определете средата, началото и края на групите на варианта на вариационния ред.

    ● Стойността на интервала (i) се определя от броя на очакваните групи (r), чийто брой се задава в зависимост от броя на наблюденията (n) съгласно специална таблица

    Брой групи в зависимост от броя на наблюденията:

    В нашия случай за 55 ученици е възможно да се съставят от 8 до 10 групи.

    Стойността на интервала (i) се определя по следната формула -

    i = Vmax-Vmin/r

    В нашия пример стойността на интервала е 82-58/8= 3.

    Ако стойността на интервала е дробно число, резултатът трябва да се закръгли нагоре до цяло число.

    Има няколко вида средни стойности:

    ● средноаритметично,

    ● средно геометрична,

    ● средно хармонично,

    ● среден квадратен корен,

    ● средно прогресивно,

    ● медиана

    В медицинската статистика най-често се използват средни аритметични стойности.

    Средноаритметичната стойност (M) е обобщаваща стойност, която определя типичната стойност, която е характерна за цялата съвкупност. Основните методи за изчисляване на М са: методът на средноаритметичната стойност и методът на моментите (условни отклонения).

    Методът на средноаритметичната стойност се използва за изчисляване на простата средна аритметична и среднопретеглената аритметична стойност. Изборът на метод за изчисляване на средноаритметичната стойност зависи от вида на вариационния ред. В случай на проста вариационна серия, в която всеки вариант се среща само веднъж, простата средна аритметична се определя по формулата:

    където: М – средноаритметична стойност;

    V е стойността на променливата характеристика (опции);

    Σ - обозначава действието - сумиране;

    n е общият брой наблюдения.

    Пример за изчисляване на средноаритметичната стойност е прост. Честота на дишане (брой вдишвания в минута) при 9 мъже на възраст 35 години: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    За да се определи средното ниво на дихателна честота при мъже на възраст 35 години, е необходимо:

    1. Създайте вариационна серия, като поставите всички опции във възходящ или низходящ ред.Получихме проста вариационна серия, т.к. стойностите на варианта се появяват само веднъж.

    M = ∑V/n = 171/9 = 19 вдишвания в минута

    Заключение. Честотата на дишане при мъжете на 35-годишна възраст е средно 19 вдишвания в минута.

    Ако отделните стойности на вариант се повтарят, няма нужда да изписвате всеки вариант на ред; достатъчно е да се изброят размерите на варианта, които се появяват (V) и до него да се посочи броят на техните повторения (p ). такъв вариационен ред, в който вариантите са като че ли претеглени според броя на съответстващите им честоти, се нарича претеглена вариационна серия, а изчислената средна стойност е средноаритметичната претеглена.

    Средноаритметичната претеглена стойност се определя по формулата: M= ∑Vp/n

    където n е броят на наблюденията, равен на сбора от честоти - Σr.

    Пример за изчисляване на средноаритметичната претеглена стойност.

    Продължителността на инвалидността (в дни) при 35 пациенти с остри респираторни заболявания (ОРЗ), лекувани от местен лекар през първото тримесечие на текущата година е: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 дни .

    Методиката за определяне на средната продължителност на инвалидността при пациенти с остри респираторни инфекции е както следва:

    1. Нека изградим претеглена вариационна серия, т.к индивидуалните стойности на варианта се повтарят няколко пъти. За да направите това, можете да подредите всички опции във възходящ или низходящ ред със съответните им честоти.

    В нашия случай опциите са във възходящ ред.

    2. Изчислете средноаритметичната претеглена по формулата: M = ∑Vp/n = 233/35 = 6,7 дни

    Разпределение на пациентите с остри респираторни инфекции по продължителност на инвалидността:

    Продължителност на неработоспособност (V) Брой пациенти (p) vp
    ∑p = n = 35 ∑Vp = 233

    Заключение. Продължителността на инвалидността при пациенти с остри респираторни заболявания е средно 6,7 дни.

    Режимът (Mo) е най-често срещаният вариант в сериите от вариации. За разпределението, представено в таблицата, режимът съответства на варианта, равен на 10, среща се по-често от други - 6 пъти.

    Разпределение на пациентите по продължителност на престоя на болнично легло (в дни)

    V
    стр

    Понякога е трудно да се определи точната стойност на режима, тъй като в изследваните данни може да има няколко наблюдения, които се срещат „най-често“.

    Медиана (Me) е непараметричен индикатор, който разделя сериите от вариации на две равни половини: един и същ брой опции е разположен от двете страни на медианата.

    Например, за разпределението, показано в таблицата, медианата е 10, защото от двете страни на тази стойност се намира на 14-та опция, т.е. числото 10 заема централна позиция в тази серия и е нейната медиана.

    Като се има предвид, че броят на наблюденията в този пример е четен (n=34), медианата може да се определи, както следва:

    Аз = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    Това означава, че средата на поредицата попада върху седемнадесетата опция, която съответства на медиана от 10. За разпределението, представено в таблицата, средноаритметичната стойност е:

    M = ∑Vp/n = 334/34 = 10,1

    И така, за 34 наблюдения от табл. 8, получаваме: Mo=10, Me=10, средноаритметичното (M) е 10,1. В нашия пример и трите индикатора се оказаха равни или близки един до друг, въпреки че са напълно различни.

    Средноаритметичната е резултантната сума от всички влияния; в нейното формиране участват всички опции без изключение, включително екстремни, често нетипични за дадено явление или съвкупност.

    Режимът и медианата, за разлика от средното аритметично, не зависят от стойността на всички отделни стойности на променливия атрибут (стойностите на екстремните варианти и степента на разсейване на серията). Средноаритметичната стойност характеризира цялата маса от наблюдения, модът и медианата характеризират по-голямата част

    Упражнение 1

    ВАРИАЦИОНЕН РЕД НА РАЗПРЕДЕЛЕНИЕ

    вариационна серияили близко разпространениенаречено подредено разпределение на единиците на популацията според нарастващите (по-често) или намаляващи (по-рядко) стойности на атрибута и преброяване на броя на единиците с една или друга стойност на атрибута.

    има 3 милобхват на разпространение:

    1) класиран ред- това е списък на отделните единици от популацията във възходящ ред на изследваната черта; ако броят на единиците на популацията е достатъчно голям, класираната серия става тромава и в такива случаи серия на разпределение се конструира чрез групиране на единиците на популацията според стойностите на изследваната черта (ако чертата заема малък брой на стойности, тогава се конструира дискретна серия, а в противен случай - интервална серия);

    2) дискретна серия- това е таблица, състояща се от две колони (редове) - конкретни стойности на различен атрибут х ии броя на единиците на населението с дадена стойност на признака е и– честоти; броят на групите в дискретна серия се определя от броя на реално съществуващите стойности на променливия атрибут;

    3) интервална серия- това е таблица, състояща се от две колони (редове) - интервали с различен знак х ии броя на единиците на населението, попадащи в даден интервал (честоти), или дела на този брой в общия брой на популациите (честоти).

    Извикват се числа, показващи колко пъти се срещат отделни опции в дадена популация честотиили везнивариант и се означават с малка буква на латинската азбука е. Общата сума от честотите на вариационния ред е равна на обема на тази популация, т.е.

    където к– брой групи, не общият брой на наблюденията или размера на популацията.

    Честотите (тегла) се изразяват не само в абсолютни, но и в относителни числа - във доли от единица или като процент от общия брой варианти, съставляващи този набор. В такива случаи теглата се наричат относителни честотиили честоти.Общата сума на данните е равна на едно

    или
    ,

    ако честотите са изразени като процент от общия брой наблюдения П.Замяната на честоти с честоти не е задължителна, но понякога се оказва полезна и дори необходима в случаите, когато е необходимо да се сравняват помежду си вариационни серии, които се различават значително по обема си.

    В зависимост от това как атрибутът варира - дискретно или непрекъснато, в широк или тесен диапазон - статистическата съвкупност се разпределя в без интервалили интервалвариационни линии. В първия случай честотите се отнасят директно до класираните стойности на признака, които придобиват позицията на отделни групи или класове от вариационните серии, във втория, те изчисляват честотите, свързани с отделни интервали или интервали (от - to), на които е разделена цялостната вариация на чертата, варираща от минимални до максимални опции за този набор. Тези интервали или класови пространства могат или не могат да бъдат равни по ширина. Оттук се различават равни и неравни интервални вариационни серии.При неравномерни интервални серии естеството на честотното разпределение се променя с промяна на ширината на интервалите на класовете. Неравноинтервалното групиране в биологията се използва сравнително рядко. По правило биометричните данни се разпределят в равни интервални серии, което позволява не само да се идентифицира моделът на вариация, но и улеснява изчисляването на обобщените числови характеристики на вариационните серии, сравнявайки сериите на разпределение помежду си.

    Когато започвате да конструирате вариационна серия с равен интервал, важно е правилно да очертаете ширината на интервала на класа. Факт е, че грубото групиране (когато са зададени много широки интервали на класове) изкривява типичните характеристики на вариация и води до намаляване на точността на числените характеристики на серията. При избор на прекалено тесни интервали точността на обобщаващите числови характеристики се увеличава, но поредицата се оказва твърде разширена и не дава ясна картина на вариацията.

    За да се получи добре дефинирана вариационна серия и За да се осигури достатъчна точност на числените характеристики, изчислени от него, е необходимо вариацията на чертата (в диапазона от минималните до максималните опции) да се раздели на такъв брой групи или класове, които биха удовлетворили и двете изисквания. Този проблем се решава чрез разделяне на диапазона на вариация на даден признак на броя на групите или класовете, които са планирани при конструирането на вариационна серия:

    ,

    където з– стойност на интервала; х m a x i х min - максималните и минималните стойности в съвкупността; ке броят на групите.

    При конструиране на интервална серия за разпределение е необходимо да се избере оптималният брой групи (интервали на символите) и да се зададе дължината (обхвата) на интервала. Тъй като анализът на серия на разпределение сравнява честотите в различни интервали, е необходимо дължината на интервалите да бъде постоянна. Ако трябва да се справите с интервална серия от разпределение с неравни интервали, тогава за съпоставимост трябва да доведете честотата или честотата до единицата на интервала, получената стойност се нарича плътност ρ , това е
    .

    Оптималният брой групи се избира така, че разнообразието от стойности на атрибута в съвкупността да се отразява в достатъчна степен и в същото време редовността на разпределението, неговата форма да не се изкривява от случайни колебания на честотата. Ако има твърде малко групи, няма да има модел на вариации; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.

    Най-често броят на групите в разпределителната серия се определя от формулата на Стърджес:

    където н- размера на населението.

    Графичното представяне осигурява съществена помощ при анализа на разпределителна серия и нейните свойства. Интервалната серия е представена от стълбовидна диаграма, в която основите на лентите, разположени по оста на абсцисата, са интервалите от стойности на променливия атрибут, а височините на лентите са честотите, съответстващи на скалата по протежение на ординатната ос. Този тип диаграма се нарича хистограма.

    Ако има дискретна серия на разпределение или се използват средните интервали, тогава графичното представяне на такава серия се нарича многоъгълник, което се получава чрез свързване на прави точки с координати х ии е и .

    Ако стойностите на класа се начертаят по оста на абсцисата, а натрупаните честоти се начертаят по оста на ординатите, последвано от свързване на точките с прави линии, се получава графика, наречена кумулативна.Натрупаните честоти се намират чрез последователно сумиране, или кумулациячестоти в посока от първия клас до края на вариационния ред.

    Пример. Има данни за производството на яйца от 50 кокошки носачки за 1 година, отглеждани в птицеферма (Таблица 1.1).

    T a b l e 1.1

    Кокошки носачки

    брой кокошки носачки

    Производство на яйца, бр.

    брой кокошки носачки

    Производство на яйца, бр.

    брой кокошки носачки

    Производство на яйца, бр.

    брой кокошки носачки

    Производство на яйца, бр.

    брой кокошки носачки

    Производство на яйца, бр.

    Необходимо е да се изгради интервална серия за разпределение и да се покаже графично под формата на хистограма, полигон и кумулация.

    Вижда се, че признакът варира от 212 до 245 яйца, получени от кокошка носачка за 1 година.

    В нашия пример, използвайки формулата на Стърджис, ние определяме броя на групите:

    к = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Изчислете дължината (диапазон) на интервала по формулата:

    .

    Нека изградим интервална серия със 7 групи и интервал от 5 парчета. яйца (Таблица 1.2). За да изградим графики в таблицата, изчисляваме средата на интервалите и натрупаната честота.

    T a b l e 1.2

    Интервални серии на разпределение на производството на яйца

    Група кокошки носачки според големината на производството на яйца

    х и

    Брой кокошки носачки

    е и

    Средна точка на интервала

    хаз

    Натрупана честота

    е и

    Нека изградим хистограма на разпределението на производството на яйца (фиг. 1.1).

    Ориз. 1.1. Хистограма на разпределението на производството на яйца

    Тези хистограми показват формата на разпределение, характерна за много черти: стойностите на средните интервали на чертата са по-чести, а екстремните (малки и големи) стойности на чертата са по-рядко срещани. Формата на това разпределение е близка до нормалния закон за разпределение, който се формира, ако променливата променлива е повлияна от голям брой фактори, нито един от които няма преобладаваща стойност.

    Многоъгълникът и кумулата на разпределението на производството на яйца имат формата (фиг. 1.2 и 1.3).

    Ориз. 1.2. Полигон за разпределение на яйца

    Ориз. 1.3. Кумулативно разпределение на производството на яйца

    Технология за решаване на проблеми в процесор за електронни таблици Microsoft превъзхождам следващия.

    1. Въведете изходните данни в съответствие с фиг. 1.4.

    2. Подредете реда.

    2.1. Изберете клетки A2:A51.

    2.2. Щракнете с левия бутон върху лентата с инструменти върху бутона<Сортировка по возрастанию > .

    3. Определете размера на интервала за конструиране на интервалната серия на разпределението.

    3.1. Копирайте клетка A2 в клетка E53.

    3.2. Копирайте клетка A51 в клетка E54.

    3.3. Изчислете диапазона на вариация. За да направите това, въведете формулата в клетка E55 =E54-E53.

    3.4. Изчислете броя на групите от вариации. За да направите това, въведете формулата в клетка E56 =1+3,322*LOG10(50).

    3.5. Въведете в клетка E57 закръгления брой групи.

    3.6. Изчислете дължината на интервала. За да направите това, въведете формулата в клетка E58 =E55/E57.

    3.7. Въведете в клетка E59 закръглената дължина на интервала.

    4. Създайте интервална серия.

    4.1. Копирайте клетка E53 в клетка B64.

    4.2. Въведете формулата в клетка B65 =B64+$E$59.

    4.3. Копирайте клетка B65 в клетки B66:B70.

    4.4. Въведете формулата в клетка C64 =B65.

    4.5. Въведете формулата в клетка C65 =C64+$E$59.

    4.6. Копирайте клетка C65 в клетки C66:C70.

    Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.5).

    5. Изчислете интервалната честота.

    5.1. Изпълнете командата Обслужване,Анализ на данникато щракнете последователно с левия бутон на мишката.

    5.2. В диалоговия прозорец Анализ на даннизадайте с левия бутон на мишката: Инструменти за анализ <Гистограмма>(фиг. 1.6).

    5.3. Щракнете с левия бутон върху бутона<ОК>.

    5.4. В раздела лента диаграмазадайте параметрите според фиг. 1.7.

    5.5. Щракнете с левия бутон върху бутона<ОК>.

    Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.8).

    6. Попълнете таблицата "Интервална серия на разпределение".

    6.1. Копирайте клетки B74:B80 в клетки D64:D70.

    6.2. Изчислете сумата от честотите. За да направите това, изберете клетки D64:D70 и щракнете с левия бутон върху бутона в лентата с инструменти<Автосумма > .

    6.3. Изчислете средата на интервалите. За да направите това, въведете формулата в клетка E64 =(B64+C64)/2и копирайте в клетки E65:E70.

    6.4. Изчислете натрупаните честоти. За да направите това, копирайте клетка D64 в клетка F64. В клетка F65 въведете формулата =F64+D65 и я копирайте в клетките F66:F70.

    Резултатите от решението се извеждат на екрана на дисплея в следната форма (фиг. 1.9).

    7. Редактирайте хистограмата.

    7.1. Щракнете с десния бутон върху диаграмата върху името "джоб" и в раздела, който се показва, щракнете върху бутона<Очистить>.

    7.2. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

    7.3. В диалоговия прозорец Първоначални даннипроменете етикетите на оста X. За да направите това, изберете клетки B64:C70 (фиг. 1.10).

    7.5. Натиснете клавиша .

    Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.11).

    8. Изградете полигон за разпределение на яйца.

    8.1. Щракнете с левия бутон върху лентата с инструменти върху бутона<Мастер диаграмм > .

    8.2. В диалоговия прозорец Съветник за диаграми (Стъпка 1 от 4)използвайте левия бутон на мишката, за да зададете: Standard <График>(фиг. 1.12).

    8.3. Щракнете с левия бутон върху бутона<Далее>.

    8.4. В диалоговия прозорец Съветник за диаграми (стъпка 2 от 4)задайте параметрите според фиг. 1.13.

    8.5. Щракнете с левия бутон върху бутона<Далее>.

    8.6. В диалоговия прозорец Съветник за диаграми (Стъпка 3 от 4)въведете имената на диаграмата и оста Y (фиг. 1.14).

    8.7. Щракнете с левия бутон върху бутона<Далее>.

    8.8. В диалоговия прозорец Съветник за диаграми (Стъпка 4 от 4)задайте параметрите според фиг. 1.15.

    8.9. Щракнете с левия бутон върху бутона<Готово>.

    Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.16).

    9. Поставете етикети с данни в диаграмата.

    9.1. Щракнете с десния бутон върху диаграмата и в раздела, който се показва, щракнете върху бутона<Исходные данные>.

    9.2. В диалоговия прозорец Първоначални даннипроменете етикетите на оста X. За да направите това, изберете клетки E64:E70 (фиг. 1.17).

    9.3. Натиснете клавиша .

    Резултатите се извеждат на екрана на дисплея в следната форма (фиг. 1.18).

    Кумулата на разпределението се конструира подобно на полигона на разпределение въз основа на натрупаните честоти.

      Всички стойности на изследваното свойство, които се срещат в изследваната популация, се наричат ​​стойност на характеристиката (вариант, вариант), а промяната в тази стойност вариация. Вариантите са обозначени с малки букви на латинската азбука с индекси, съответстващи на поредния номер на групата - х и .

      Число, което показва колко пъти всяка стойност на характеристика се среща в изследваната популация честота и означават f и . Сумата от всички честоти на поредицата е равна на обема на изследваната популация.

      Често трябва да се изчислява натрупана честота (С). Кумулативната честота за всяка стойност на характеристика показва колко единици на населението имат стойност на характеристика, не по-голяма от дадената стойност. Кумулативната честота се изчислява чрез последователно добавяне към честотата на първата стойност на честотната характеристика на следните стойности на характеристиките:

    Натрупаната честота започва да се изчислява от първата стойност на характеристиката

    Сборът от честотите винаги е равен на единица или 100%. Замяната на честотите с честоти прави възможно сравняването на вариационни серии с различен брой наблюдения.

    Честотите на серията (f i) в някои случаи могат да бъдат заменени с честотите (ω i).

    Ако серията от вариации е дадена с неравни интервали, тогава за правилна представа за естеството на разпределението е необходимо да се изчисли абсолютната или относителната плътност на разпределението.

      Абсолютна плътност на разпределение (стр е ) представлява стойността на честотата на единица размер на интервала на отделна група от серията:

    Р е = е/ и

      Относителна плътност на разпределение (стр ω ) представлява стойността на честотата на единица размер на интервала на отделна група от серията:

    Р ω = ω / и

    За серии с неравни интервали само тези характеристики дават по-правилна представа за естеството на разпределението, отколкото честотата и честотата.

      Статистическото разпределение на извадката посочете списъка с опции (стойности на характеристиките) и съответните им честоти или плътности на разпределение, относителни честоти или относителни плътности на разпределение.

    Различните серии на разпределение се характеризират с различен набор от честотни характеристики:

    минимални - атрибутивни серии (честота, честота),

    за дискретни се използват четири характеристики (честота, честота, натрупана честота, натрупана честота),

    за интервални - и петте (честота, честота, кумулативна честота, кумулативна честота, абсолютна и относителна плътност на разпределение).

    1. Правила за изграждане на интервална вариационна серия

    1. Графично представяне на вариационни серии

    Първият етап от изследването на вариационния ред е изграждането на неговото графично представяне. Графичното представяне на вариационните серии улеснява анализа им и дава възможност да се прецени формата на разпределението. За графично представяне на вариационна серия в статистиката се изграждат хистограма, полигон и кумулативно разпределение.

    Дискретна вариационна серия се изобразява като т. нар. честотен многоъгълник.

    За показване на интервалната серия се използват многоъгълник за разпределение на честотата и честотна хистограма.

    Графиките се изграждат в правоъгълна координатна система.

    (дефиниция на вариационна поредица; компоненти на вариационна серия; три форми на вариационна серия; целесъобразност от конструиране на интервална серия; изводи, които могат да се направят от конструирания ред)

    Вариационна серия е последователност от всички елементи на извадка, подредени в ненамаляващ ред. Същите елементи се повтарят

    Вариантни - това са серии, изградени на количествена основа.

    Вариантните разпределителни серии се състоят от два елемента: варианти и честоти:

    Вариантите са числените стойности на количествен признак в вариационния ред на разпределението. Те могат да бъдат положителни или отрицателни, абсолютни или относителни. Така че, когато се групират предприятията според резултатите от икономическата дейност, опциите са положителни - това е печалба, а отрицателните числа - това е загуба.

    Честотите са номерата на отделните варианти или всяка група от вариационните серии, т.е. това са числа, показващи колко често се появяват определени опции в серия за разпространение. Сборът от всички честоти се нарича обем на съвкупността и се определя от броя на елементите на цялата съвкупност.

    Честотите са честоти, изразени като относителни стойности (части от единици или проценти). Сборът от честотите е равен на единица или 100%. Замяната на честотите с честоти прави възможно сравняването на вариационни серии с различен брой наблюдения.

    Има три форми на серии от вариации:класирани серии, дискретни серии и интервални серии.

    Класираната серия е разпределението на отделните единици от популацията във възходящ или низходящ ред на изследваната черта. Класирането улеснява разделянето на количествени данни на групи, незабавно откриване на най-малките и най-големите стойности на даден елемент и подчертаване на стойностите, които най-често се повтарят.

    Други форми на сериите от вариации са групови таблици, съставени според естеството на вариацията в стойностите на изследваната черта. По естеството на вариацията се разграничават дискретни (прекъснати) и непрекъснати знаци.

    Дискретна серия е такава вариационна серия, чието изграждане се основава на знаци с прекъсната промяна (дискретни знаци). Последните включват тарифната категория, броя на децата в семейството, броя на служителите в предприятието и др. Тези знаци могат да приемат само краен брой определени стойности.

    Дискретна вариационна серия е таблица, която се състои от две колони. Първата колона показва конкретната стойност на атрибута, а втората - броя на единиците на населението с конкретна стойност на атрибута.

    Ако знакът има непрекъсната промяна (размерът на дохода, трудовия стаж, цената на дълготрайните активи на предприятието и т.н., който може да приеме всяка стойност в определени граници), тогава трябва да се изгради интервална серия от вариации за този знак.



    Груповата таблица тук също има две колони. Първият показва стойността на характеристиката в интервала "от - до" (опции), вторият - броя на единиците, включени в интервала (честота).

    Честота (честота на повторение) - броят на повторенията на конкретен вариант на стойностите на атрибута, означен fi , и сумата от честотите, равна на обема на изследваната популация, обозначена

    Където k е броят на опциите за стойност на атрибута

    Много често таблицата се допълва с колона, в която се изчисляват натрупаните честоти S, които показват колко единици от популацията имат стойност на характеристика не по-голяма от тази стойност.

    Дискретна вариационна разпределителна серия е поредица, в която групите са съставени според черта, която варира дискретно и приема само цели числа.

    Интервалната вариационна серия на разпределение е серия, в която атрибутът за групиране, който формира основата на групирането, може да приема всякакви стойности в определен интервал, включително дробни.

    Интервалната вариационна серия е подреден набор от интервали на вариация на стойностите на произволна променлива със съответните честоти или честоти на стойностите на количеството, попадащи във всяка от тях.

    Целесъобразно е да се изгради интервална серия на разпределение, преди всичко с непрекъснато изменение на даден признак, а също и ако дискретна вариация се проявява в широк диапазон, т.е. броят на опциите за отделна функция е доста голям.

    От тази поредица вече могат да се направят няколко извода. Например, средният елемент на вариационна серия (медиана) може да бъде оценка на най-вероятния резултат от измерване. Първият и последният елемент от серия от вариации (т.е. минималният и максималният елемент на извадката) показват разпространението на елементите на извадката. Понякога, ако първият или последният елемент е много различен от останалата част от извадката, тогава те се изключват от резултатите от измерването, като се има предвид, че тези стойности са получени в резултат на някакъв вид груб повреда, например технология.