ما يميز التشتت داخل المجموعة. التوقع الرياضي والتباين لمتغير عشوائي

إذا تم تقسيم السكان إلى مجموعات وفقًا للسمة قيد الدراسة ، فيمكن حساب أنواع التشتت التالية لهذه المجموعة: الإجمالي ، المجموعة (داخل المجموعة) ، متوسط ​​المجموعة (متوسط ​​المجموعة الداخلية) ، بين المجموعات.

في البداية ، يحسب معامل التحديد ، والذي يوضح أي جزء من التباين الكلي للسمة المدروسة هو التباين بين المجموعات ، أي بسبب التجميع:

تميز نسبة الارتباط التجريبية ضيق الاتصال بين التجميع (عاملي) والعلامات الفعالة.

يمكن أن تأخذ نسبة الارتباط التجريبية قيمًا من 0 إلى 1.

لتقييم تقارب العلاقة بناءً على نسبة الارتباط التجريبية ، يمكنك استخدام علاقات Chaddock:

مثال 4توجد البيانات التالية عن أداء العمل حسب منظمات التصميم والمسح بمختلف أشكال الملكية:

يُعرِّف:

1) التباين الكلي.

2) تشتت المجموعة ؛

3) متوسط ​​تشتت المجموعة.

4) التشتت بين المجموعات ؛

5) التباين الكلي على أساس قاعدة إضافة الفروق ؛


6) معامل التحديد والارتباط التجريبي.

ارسم استنتاجاتك الخاصة.

حل:

1. دعونا نحدد متوسط ​​حجم العمل الذي تقوم به مؤسسات ذات شكلين من أشكال الملكية:

احسب التباين الكلي:

2. تحديد متوسطات المجموعة:

مليون روبل

مليون فرك.

فروق المجموعة:

;

3. احسب متوسط ​​تباينات المجموعة:

4. تحديد التباين بين المجموعات:

5. احسب إجمالي التباين بناءً على قاعدة إضافة الفروق:

6. تحديد معامل التحديد:

.

وبالتالي ، فإن حجم العمل الذي تقوم به منظمات التصميم والمسح بنسبة 22٪ يعتمد على شكل ملكية المؤسسات.

يتم حساب نسبة الارتباط التجريبي بواسطة الصيغة

.

تشير قيمة المؤشر المحسوب إلى أن اعتماد مقدار العمل على شكل ملكية المؤسسة صغير.

مثال 5نتيجة لمسح الانضباط التكنولوجي لمواقع الإنتاج ، تم الحصول على البيانات التالية:

حدد معامل التحديد

المؤشرات الرئيسية المعممة للتباين في الإحصاء هي التشتت والانحراف المعياري.

تشتت ذلك المتوسط ​​الحسابي تربيع الانحرافات لكل قيمة ميزة عن المتوسط ​​الإجمالي. عادة ما يسمى التباين بالمربع المتوسط ​​للانحرافات ويشار إليه بـ  2. اعتمادًا على البيانات الأولية ، يمكن حساب التباين من المتوسط ​​الحسابي ، البسيط أو الموزون:

 تشتت غير مرجح (بسيط) ؛

 التباين الموزون.

الانحراف المعياري هي خاصية معممة للأبعاد المطلقة الاختلافات السمة في المجموع. يتم التعبير عنها بنفس وحدات اللافتة (بالأمتار ، الأطنان ، النسبة المئوية ، الهكتار ، إلخ).

الانحراف المعياري هو الجذر التربيعي للتباين ويُشار إليه بالرمز :

 انحراف معياري غير مرجح ؛

 الانحراف المعياري المرجح.

الانحراف المعياري هو مقياس لموثوقية المتوسط. كلما كان الانحراف المعياري أصغر ، كان المتوسط ​​الحسابي أفضل يعكس المجموعة السكانية الممثلة بالكامل.

يسبق حساب الانحراف المعياري حساب التباين.

يكون إجراء حساب التباين الموزون كما يلي:

1) تحديد المتوسط ​​المرجح الحسابي:

2) احسب انحرافات الخيارات عن المتوسط:

3) قم بتربيع انحراف كل خيار عن المتوسط:

4) ضرب الانحرافات التربيعية بالأوزان (الترددات):

5) تلخيص الأعمال الواردة:

6) يتم قسمة المبلغ الناتج على مجموع الأوزان:

مثال 2.1

احسب المتوسط ​​المرجح الحسابي:

يتم عرض قيم الانحرافات عن المتوسط ​​ومربعاتها في الجدول. دعنا نحدد التباين:

يساوي الانحراف المعياري:

إذا تم تقديم بيانات المصدر كفاصل زمني سلسلة التوزيع ، فأنت بحاجة أولاً إلى تحديد القيمة المنفصلة للميزة ، ثم تطبيق الطريقة الموضحة.

مثال 2.2

دعونا نظهر حساب التباين لسلسلة الفترات على البيانات الخاصة بتوزيع المنطقة المزروعة للمزرعة الجماعية حسب محصول القمح.

المتوسط ​​الحسابي هو:

دعنا نحسب التباين:

6.3 حساب التشتت وفقًا لمعادلة البيانات الفردية

تقنية الحساب تشتت معقدة ، والقيم الكبيرة للخيارات والترددات يمكن أن تكون مرهقة. يمكن تبسيط العمليات الحسابية باستخدام خصائص التشتت.

التشتت الخصائص التالية.

1. لا يؤدي النقص أو الزيادة في أوزان (ترددات) سمة متغيرة بعدد معين من المرات إلى تغيير التشتت.

2. إنقاص أو زيادة كل قيمة خاصية بنفس القيمة الثابتة أالتشتت لا يتغير.

3. إنقاص أو زيادة كل قيمة خاصية بعدد معين من المرات كعلى التوالي يقلل أو يزيد من التباين في ك 2 مرات الانحراف المعياري  في كمرة واحدة.

4. دائمًا ما يكون تباين السمة بالنسبة إلى القيمة التعسفية أكبر من التباين المتعلق بالمتوسط ​​الحسابي بمربع الفرق بين القيم المتوسطة والقيم التعسفية:

لو أ 0 ، ثم نصل إلى المساواة التالية:

على سبيل المثال ، تباين الميزة يساوي الفرق بين متوسط ​​مربع قيم الميزة ومربع المتوسط.

يمكن استخدام كل خاصية بمفردها أو مع الآخرين عند حساب التباين.

إجراء حساب التباين بسيط:

1) تحديد المتوسط ​​الحسابي :

2) تربيع الوسط الحسابي:

3) تربيع انحراف كل متغير من السلسلة:

X أنا 2 .

4) ابحث عن مجموع مربعات الخيارات:

5) قسّم مجموع مربعات الخيارات على عددها ، أي تحديد متوسط ​​المربع:

6) تحديد الفرق بين متوسط ​​مربع الميزة ومربع المتوسط:

مثال 3.1لدينا البيانات التالية عن إنتاجية العمال:

لنقم بالحسابات التالية:

تشتت المتغير العشوائي هو مقياس لانتشار قيم هذا المتغير. يعني التباين الصغير أن القيم مجمعة بالقرب من بعضها البعض. يشير التباين الكبير إلى تشتت قوي للقيم. يستخدم مفهوم تشتت المتغير العشوائي في الإحصاء. على سبيل المثال ، إذا قارنت تباين قيم كميتين (مثل نتائج ملاحظات المرضى الذكور والإناث) ، يمكنك اختبار أهمية بعض المتغيرات. يستخدم التباين أيضًا عند بناء النماذج الإحصائية ، حيث يمكن أن يكون التباين الصغير علامة على أنك تقوم بتخصيص القيم.

خطوات

نموذج حساب التباين

  1. سجل قيم العينة.في معظم الحالات ، تتوفر فقط عينات من مجموعات سكانية معينة للإحصائيين. على سبيل المثال ، كقاعدة عامة ، لا يحلل الإحصائيون تكلفة الحفاظ على عدد سكان جميع السيارات في روسيا - فهم يحللون عينة عشوائية من عدة آلاف من السيارات. ستساعد هذه العينة في تحديد متوسط ​​التكلفة لكل سيارة ، ولكن على الأرجح ، ستكون القيمة الناتجة بعيدة عن القيمة الحقيقية.

    • على سبيل المثال ، دعنا نحلل عدد الكعك المباع في المقهى في 6 أيام ، بترتيب عشوائي. تحتوي العينة على الشكل التالي: 17 ، 15 ، 23 ، 7 ، 9 ، 13. هذه عينة وليست مجموعة سكانية ، لأننا لا نملك بيانات عن الكعك المباع لكل يوم يفتح فيه المقهى.
    • إذا تم إعطاؤك مجتمعًا وليس عينة من القيم ، فانتقل إلى القسم التالي.
  2. اكتب معادلة حساب تباين العينة.التشتت هو مقياس لانتشار قيم بعض الكمية. كلما اقتربت قيمة التشتت من الصفر ، كلما اقترب تجميع القيم معًا. عند العمل باستخدام عينة من القيم ، استخدم الصيغة التالية لحساب التباين:

    • ث 2 (displaystyle s ^ (2)) = ∑[(س i (displaystyle x_ (i))-x̅) 2 (displaystyle ^ (2))] / (ن - 1)
    • ث 2 (displaystyle s ^ (2))هو التشتت. يقاس التشتت بالوحدات المربعة.
    • س i (displaystyle x_ (i))- كل قيمة في العينة.
    • س i (displaystyle x_ (i))عليك أن تطرح x̅ وتربيعها ثم تضيف النتائج.
    • x̅ - متوسط ​​العينة (متوسط ​​العينة).
    • n هو عدد القيم في العينة.
  3. احسب متوسط ​​العينة.يشار إليه على أنه x̅. يتم حساب متوسط ​​العينة كمتوسط ​​حسابي عادي: اجمع جميع القيم في العينة ، ثم اقسم النتيجة على عدد القيم في العينة.

    • في مثالنا ، أضف القيم الموجودة في العينة: 15 + 17 + 23 + 7 + 9 + 13 = 84
      الآن قسّم النتيجة على عدد القيم في العينة (في مثالنا هناك 6): 84 6 = 14.
      متوسط ​​العينة x̅ = 14.
    • متوسط ​​العينة هو القيمة المركزية التي يتم حولها توزيع القيم في العينة. إذا كانت القيم في مجموعة العينة حول متوسط ​​العينة ، يكون التباين صغيرًا ؛ خلاف ذلك ، فإن التشتت كبير.
  4. اطرح متوسط ​​العينة من كل قيمة في العينة.الآن احسب الفرق س i (displaystyle x_ (i))- x̅ ، أين س i (displaystyle x_ (i))- كل قيمة في العينة. تشير كل نتيجة تم الحصول عليها إلى مدى انحراف قيمة معينة عن متوسط ​​العينة ، أي مدى بُعد هذه القيمة عن متوسط ​​العينة.

    • في مثالنا:
      x 1 (displaystyle x_ (1))- س̅ = 17-14 = 3
      x 2 (displaystyle x_ (2))- س̅ = 15-14 = 1
      x 3 (displaystyle x_ (3))- س̅ = 23-14 = 9
      x 4 (\ displaystyle x_ (4))- س̅ = 7-14 = -7
      x 5 (displaystyle x_ (5))- س̅ = 9-14 = -5
      x 6 (\ displaystyle x_ (6))- س̅ = 13-14 = -1
    • من السهل التحقق من صحة النتائج التي تم الحصول عليها ، حيث يجب أن يكون مجموعها مساويًا للصفر. يرتبط هذا بتحديد متوسط ​​القيمة ، نظرًا لأن القيم السالبة (المسافات من متوسط ​​القيمة إلى القيم الأصغر) يتم تعويضها تمامًا بالقيم الموجبة (المسافات من متوسط ​​القيمة إلى القيم الأكبر).
  5. كما هو مذكور أعلاه ، مجموع الاختلافات س i (displaystyle x_ (i))- يجب أن تكون x̅ مساوية للصفر. هذا يعني أن متوسط ​​التباين هو دائمًا صفر ، وهذا لا يعطي أي فكرة عن انتشار قيم بعض الكمية. لحل هذه المشكلة ، قم بتربيع كل فرق س i (displaystyle x_ (i))- x̅. سيؤدي ذلك إلى حصولك على أرقام موجبة فقط والتي ، عند جمعها معًا ، لن تضيف أبدًا ما يصل إلى 0.

    • في مثالنا:
      (x 1 (displaystyle x_ (1))-x̅) 2 = 3 2 = 9 (\ displaystyle ^ (2) = 3 ^ (2) = 9)
      (x 2 (displaystyle (x_ (2))-x̅) 2 = 1 2 = 1 (\ displaystyle ^ (2) = 1 ^ (2) = 1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • لقد وجدت مربع الفرق - x̅) 2 (displaystyle ^ (2))لكل قيمة في العينة.
  6. احسب مجموع تربيع الفروق.بمعنى ، ابحث عن جزء الصيغة المكتوب على النحو التالي: ∑ [( س i (displaystyle x_ (i))-x̅) 2 (displaystyle ^ (2))]. هنا العلامة Σ تعني مجموع تربيع الفروق لكل قيمة س i (displaystyle x_ (i))في العينة. لقد وجدت بالفعل الفروق التربيعية (x i (\ displaystyle (x_ (i))-x̅) 2 (displaystyle ^ (2))لكل قيمة س i (displaystyle x_ (i))في العينة الآن فقط أضف هذه المربعات.

    • في مثالنا: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. قسّم النتيجة على n - 1 ، حيث n هي عدد القيم في العينة.منذ بعض الوقت ، لحساب تباين العينة ، قسّم الإحصائيون النتيجة ببساطة على n ؛ في هذه الحالة ، ستحصل على متوسط ​​التباين التربيعي ، وهو مثالي لوصف التباين لعينة معينة. لكن تذكر أن أي عينة ليست سوى جزء صغير من مجموعة القيم العامة. إذا أخذت عينة مختلفة وقمت بنفس الحسابات ، فستحصل على نتيجة مختلفة. كما اتضح ، فإن القسمة على n - 1 (بدلاً من n فقط) تعطي تقديرًا أفضل للتباين السكاني ، وهو ما تبحث عنه. أصبحت القسمة على n - 1 شائعة ، لذلك تم تضمينها في معادلة حساب تباين العينة.

    • في مثالنا ، تشتمل العينة على 6 قيم ، أي ن = 6.
      تباين العينة = الصورة 2 = 166 6 - 1 = (displaystyle s ^ (2) = (frac (166) (6-1)) =) 33,2
  8. الفرق بين التباين والانحراف المعياري.لاحظ أن الصيغة تحتوي على الأس ، لذلك يتم قياس التباين بالوحدات المربعة للقيمة التي تم تحليلها. في بعض الأحيان يكون من الصعب جدًا تشغيل هذه القيمة ؛ في مثل هذه الحالات ، يتم استخدام الانحراف المعياري ، والذي يساوي الجذر التربيعي للتباين. هذا هو السبب في أن تباين العينة يشار إليه على أنه ث 2 (displaystyle s ^ (2))، والانحراف المعياري للعينة مثل ث (displaystyle s).

    • في مثالنا ، نموذج الانحراف المعياري هو: s = √33.2 = 5.76.

    حساب التباين السكاني

    1. حلل مجموعة من القيم.تتضمن المجموعة جميع قيم الكمية قيد النظر. على سبيل المثال ، إذا كنت تدرس عمر سكان منطقة لينينغراد ، فإن السكان يشملون عمر جميع سكان هذه المنطقة. في حالة العمل بمجموع ، يوصى بإنشاء جدول وإدخال قيم التجميع فيه. خذ بعين الاعتبار المثال التالي:

      • يوجد 6 أحواض مائية في غرفة معينة. يحتوي كل حوض مائي على العدد التالي من الأسماك:
        س 1 = 5 (displaystyle x_ (1) = 5)
        س 2 = 5 (displaystyle x_ (2) = 5)
        س 3 = 8 (displaystyle x_ (3) = 8)
        س 4 = 12 (displaystyle x_ (4) = 12)
        س 5 = 15 (displaystyle x_ (5) = 15)
        س 6 = 18 (displaystyle x_ (6) = 18)
    2. اكتب معادلة حساب تباين السكان.نظرًا لأن المحتوى يتضمن جميع قيم كمية معينة ، تسمح لك الصيغة التالية بالحصول على القيمة الدقيقة لتباين المحتوى. للتمييز بين تباين المجتمع وتباين العينة (وهو مجرد تقدير) ، يستخدم الإحصائيون متغيرات مختلفة:

      • σ 2 (displaystyle ^ (2)) = (∑(س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))) / ن
      • σ 2 (displaystyle ^ (2))- التباين السكاني (يقرأ ب "سيغما تربيع"). يتم قياس التشتت بالوحدات المربعة.
      • س i (displaystyle x_ (i))- كل قيمة في المجموع.
      • Σ هي علامة المجموع. هذا هو ، لكل قيمة س i (displaystyle x_ (i))اطرح μ ، وقم بتربيعها ، ثم اجمع النتائج.
      • μ هو متوسط ​​السكان.
      • n هو عدد القيم في عموم السكان.
    3. احسب متوسط ​​السكان.عند العمل مع عامة السكان ، يُشار إلى متوسط ​​قيمته بـ μ (mu). يُحسب متوسط ​​المحتوى على أنه المتوسط ​​الحسابي المعتاد: اجمع كل القيم في المجتمع ، ثم اقسم النتيجة على عدد القيم في المجتمع.

      • ضع في اعتبارك أن المتوسطات لا تُحسب دائمًا على أنها المتوسط ​​الحسابي.
      • في مثالنا ، يعني السكان: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\ displaystyle (\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
    4. اطرح متوسط ​​المحتوى من كل قيمة في المجتمع.كلما اقتربت قيمة الفرق من الصفر ، كلما اقتربت القيمة الخاصة من متوسط ​​المحتوى. أوجد الفرق بين كل قيمة في المجتمع ومتوسطها ، وستلقي نظرة أولية على توزيع القيم.

      • في مثالنا:
        x 1 (displaystyle x_ (1))- μ = 5 - 10.5 = -5.5
        x 2 (displaystyle x_ (2))- μ = 5 - 10.5 = -5.5
        x 3 (displaystyle x_ (3))- μ = 8 - 10.5 = -2.5
        x 4 (\ displaystyle x_ (4))- μ = 12 - 10.5 = 1.5
        x 5 (displaystyle x_ (5))- μ = 15 - 10.5 = 4.5
        x 6 (\ displaystyle x_ (6))- μ = 18 - 10.5 = 7.5
    5. ربّع كل نتيجة تحصل عليها.ستكون قيم الفرق موجبة وسالبة ؛ إذا وضعت هذه القيم على خط الأعداد ، فسوف تقع على يمين ويسار وسط السكان. هذا ليس جيدًا لحساب التباين ، لأن الأرقام الموجبة والسالبة تلغي بعضها البعض. لذلك ، قم بتربيع كل فرق للحصول على أرقام موجبة حصريًا.

      • في مثالنا:
        (س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))لكل قيمة سكانية (من i = 1 إلى i = 6):
        (-5,5)2 (displaystyle ^ (2)) = 30,25
        (-5,5)2 (displaystyle ^ (2))، أين س n (displaystyle x_ (n))هي القيمة الأخيرة في عدد السكان.
      • لحساب متوسط ​​قيمة النتائج التي تم الحصول عليها ، تحتاج إلى إيجاد مجموعها وقسمته على n: (( x 1 (displaystyle x_ (1)) - μ) 2 (displaystyle ^ (2)) + (x 2 (displaystyle x_ (2)) - μ) 2 (displaystyle ^ (2)) + ... + (س n (displaystyle x_ (n)) - μ) 2 (displaystyle ^ (2))) / ن
      • لنكتب الآن الشرح أعلاه باستخدام المتغيرات: (∑ ( س i (displaystyle x_ (i)) - μ) 2 (displaystyle ^ (2))) / n والحصول على صيغة لحساب تباين المحتوى.

حل.

كمقياس لتشتت قيم المتغير العشوائي ، نستخدمها تشتت

تشتت (تشتت كلمة تعني "تشتت") هو قياس تشتت قيم متغير عشوائيحول توقعاتها الرياضية. التشتت هو التوقع الرياضي للانحراف التربيعي لمتغير عشوائي عن توقعه الرياضي

إذا كان المتغير العشوائي منفصلًا مع مجموعة لا نهائية ولكن قابلة للعد من القيم ، إذن

إذا كانت السلسلة الموجودة على الجانب الأيمن من المساواة تتقارب.

خصائص التشتت.

  • 1. تشتت قيمة ثابتة صفر
  • 2. التباين في مجموع المتغيرات العشوائية يساوي مجموع الفروق
  • 3. يمكن إخراج عامل ثابت من علامة مربع التباين

تباين فرق المتغيرات العشوائية يساوي مجموع الفروق

هذه الخاصية هي نتيجة للممتلكات الثانية والثالثة. يمكن أن تضيف الفروق فقط.

يتم حساب التباين بشكل ملائم بواسطة صيغة يسهل الحصول عليها باستخدام خصائص التباين

التشتت دائما إيجابي.

تشتت البعدمربع بُعد المتغير العشوائي نفسه ، وهو ليس مناسبًا دائمًا. لذلك ، الكمية

الانحراف المعياري(الانحراف المعياري أو القياسي) لمتغير عشوائي يسمى القيمة الحسابية للجذر التربيعي لتباينه

قم برمي عملتين من فئتين 2 و 5 روبل. إذا سقطت العملة المعدنية مع شعار النبالة ، فسيتم منح صفر نقطة ، وإذا كان رقمًا ، فسيكون عدد النقاط مساويًا لقيمة العملة المعدنية. أوجد التوقع الرياضي والتباين في عدد النقاط.

حل.لنجد أولاً توزيع المتغير العشوائي X - عدد النقاط. جميع التركيبات - (2 ؛ 5) ، (2 ؛ 0) ، (0 ؛ 5) ، (0 ؛ 0) - متساوية في الاحتمال وقانون التوزيع:

القيمة المتوقعة:

نجد التشتت بالصيغة

لماذا نحسب

مثال 2

البحث عن احتمال غير معروف ص، التوقع الرياضي والتباين للمتغير العشوائي المنفصل المعطى بواسطة جدول توزيع الاحتمالية

نجد التوقع والتباين الرياضي:

م(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

لحساب التشتت نستخدم الصيغة (19.4)

د(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

مثال 3يقام لاعبان متساويان في البطولة التي تستمر إما حتى الفوز الأول لأحدهما ، أو حتى يتم لعب خمس مباريات. احتمال الفوز في مباراة واحدة لكل لاعب هو 0.3 ، واحتمال التعادل 0.4. ابحث عن قانون التوزيع والتوقعات الرياضية والتباين في عدد الألعاب التي تم لعبها.

حل.قيمة عشوائية X- عدد الألعاب التي تم لعبها ، يأخذ القيم من 1 إلى 5 ، أي

دعونا نحدد احتمالات نهاية المباراة. تنتهي المباراة في المجموعة الأولى إذا فاز أحد الرياضيين. احتمالية الفوز

ص(1) = 0,3+0,3 =0,6.

إذا كان هناك تعادل (احتمال التعادل هو 1 - 0.6 = 0.4) ، فستستمر المباراة. تنتهي المباراة في الشوط الثاني ، إذا كانت الأولى تعادلاً ، وفاز أحدهم في الثانية. احتمالا

ص(2) = 0,4 0,6=0,24.

وبالمثل ، تنتهي المباراة في الشوط الثالث إذا كان هناك تعادلين على التوالي وفاز أحدهم مرة أخرى

ص(3) = 0,4 0,4 0,6 = 0,096. ص(4)= 0,4 0,4 0,4 0,6=0,0384.

الطرف الخامس في أي متغير هو الأخير.

ص(5)= 1 - (ص(1)+ص(2)+ص(3)+ص(4)) = 0,0256.

دعونا نلخص كل شيء في الجدول. قانون توزيع المتغير العشوائي "عدد الألعاب التي تم الفوز بها" له الشكل

القيمة المتوقعة

يتم حساب التشتت بالصيغة (19.4)

التوزيعات القياسية المنفصلة.

توزيع ثنائي.دع مخطط تجربة برنولي يتم تنفيذه: نتجارب مستقلة متطابقة ، وفي كل منها حدث أقد تظهر باحتمالية ثابتة صولن تظهر باحتمالية

(انظر المحاضرة 18).

عدد مرات وقوع الحدث أفي هذه نالتجارب هناك متغير عشوائي منفصل X، والقيم المحتملة منها هي:

0; 1; 2; ... ;م; ... ؛ ن.

احتمال المظهر مأحداث أ في سلسلة معينة من نالتجارب مع قانون التوزيع لمثل هذا المتغير العشوائي تعطى بواسطة صيغة برنولي (انظر المحاضرة 18)

الخصائص العددية لمتغير عشوائي Xوزعت وفق قانون الحدين:

لو نكبير () ، إذن ، في ، تدخل الصيغة (19.6) في الصيغة

ووظيفة Gaussian المجدولة (جدول قيم دالة Gaussian معطى في نهاية المحاضرة 18).

من الناحية العملية ، غالبًا ما لا يكون الاحتمال نفسه هو المهم. مالأحداث أفي سلسلة معينة نالخبرات ، واحتمال وقوع الحدث أسيظهر على الأقل

مرات وليس أكثر ، أي احتمال أن تأخذ X القيم

للقيام بذلك ، نحتاج إلى جمع الاحتمالات

لو نكبير () ، إذن ، في ، تنتقل الصيغة (19.9) إلى الصيغة التقريبية

وظيفة مجدولة. ترد الجداول في نهاية المحاضرة 18.

عند استخدام الجداول ، ضع في اعتبارك ذلك

مثال 1. يمكن للسيارة ، التي تقترب من التقاطع ، الاستمرار في التحرك على طول أي من الطرق الثلاثة: A أو B أو C بنفس الاحتمال. خمس سيارات تقترب من التقاطع. أوجد متوسط ​​عدد السيارات التي ستسير على الطريق A واحتمال مرور ثلاث سيارات على الطريق B.

حل.عدد السيارات التي تمر على كل طريق متغير عشوائي. إذا افترضنا أن جميع السيارات التي تقترب من التقاطع تقوم برحلة مستقلة عن بعضها البعض ، فسيتم توزيع هذا المتغير العشوائي وفقًا للقانون ذي الحدين مع

ن= 5 و ص = .

لذلك ، فإن متوسط ​​عدد السيارات التي ستتبع الطريق A يكون وفقًا للصيغة (19.7)

والاحتمال المطلوب عند

مثال 2احتمال فشل الجهاز في كل اختبار هو 0.1. تم إجراء 60 اختبارًا للجهاز. ما هو احتمال فشل الجهاز: أ) 15 مرة ؛ ب) لا تزيد عن 15 مرة؟

أ.نظرًا لأن عدد الاختبارات هو 60 ، فإننا نستخدم الصيغة (19.8)

وفقًا للجدول 1 من ملحق المحاضرة 18 ، نجد

ب. نستخدم الصيغة (19.10).

وفقا للجدول 2 من ملحق المحاضرة 18

  • - 0,495
  • 0,49995

توزيع بواسون) قانون الظواهر النادرة).لو نعظيم و صقليلا () ، في حين أن المنتج إلخيحتفظ بقيمة ثابتة ، والتي نشير إليها بواسطة l ،

ثم الصيغة (19.6) تنتقل إلى صيغة بواسون

قانون توزيع بواسون له الشكل:

من الواضح أن تعريف قانون بواسون صحيح ، لأن الخاصية الرئيسية لسلسلة التوزيع

استيفاء ، لأن مجموع الصف

تتم كتابة التوسع في سلسلة من الوظائف بين قوسين لـ

نظرية. يتطابق التوقع والتباين الرياضي لمتغير عشوائي موزع وفقًا لقانون بواسون ويتساوى مع معلمة هذا القانون ، أي

دليل.

مثال.للترويج لمنتجاتها في السوق ، تضع الشركة منشورات في صناديق البريد. تُظهر التجربة السابقة أنه في حالة واحدة تقريبًا من 2000 يتبع الأمر. ابحث عن احتمال استلام طلب واحد على الأقل بعد وضع 10000 نشرة إعلانية ، ومتوسط ​​عدد الطلبات المستلمة ، والتباين في عدد الطلبات المستلمة.

حل. هنا

احتمال وصول أمر واحد على الأقل ، نجد من خلال احتمال وقوع الحدث المعاكس ، أي

دفق عشوائي للأحداث.دفق الأحداث هو سلسلة من الأحداث التي تحدث في أوقات عشوائية. الأمثلة النموذجية للتدفقات هي حالات الفشل في شبكات الكمبيوتر ، والمكالمات في المبادلات الهاتفية ، وتدفق الطلبات لإصلاح المعدات ، وما إلى ذلك.

تدفقالأحداث تسمى ثابت، إذا كان احتمال ضرب واحد أو آخر من الأحداث في فترة زمنية من الطول يعتمد فقط على طول الفاصل الزمني ولا يعتمد على موقع الفاصل الزمني على محور الوقت.

يتم استيفاء حالة الثبات من خلال تدفق التطبيقات ، التي لا تعتمد خصائصها الاحتمالية على الوقت. على وجه الخصوص ، يتميز التدفق الثابت بكثافة ثابتة (متوسط ​​عدد الطلبات لكل وحدة زمنية). من الناحية العملية ، غالبًا ما تكون هناك تدفقات من التطبيقات يمكن اعتبارها ثابتة (على الأقل لفترة محدودة من الوقت). على سبيل المثال ، يمكن اعتبار تدفق المكالمات في مقسم هاتف بالمدينة في الفترة الزمنية من 12 إلى 13 ساعة ثابتًا. لم يعد من الممكن اعتبار نفس التدفق خلال اليوم بأكمله ثابتًا (في الليل تكون كثافة المكالمات أقل بكثير مما كانت عليه أثناء النهار).

تدفقالأحداث تسمى دفق بلا تأثير، إذا كان عدد الأحداث الواقعة على أحدها لا يعتمد على عدد الأحداث التي تقع على الأجزاء الأخرى ، وذلك بالنسبة لأي مقاطع زمنية غير متداخلة.

تعني حالة عدم وجود تأثير لاحق ، وهي الأكثر أهمية لأبسط تدفق ، أن المطالبات تدخل النظام بشكل مستقل عن بعضها البعض. على سبيل المثال ، يمكن اعتبار تدفق الركاب الذين يدخلون محطة المترو تدفقًا بدون تأثير لاحق ، لأن الأسباب التي تسببت في وصول راكب فردي في تلك اللحظة بالذات وليس أخرى ، كقاعدة عامة ، لا تتعلق بأسباب مماثلة لأسباب أخرى ركاب. ومع ذلك ، يمكن بسهولة انتهاك حالة عدم وجود تأثير لاحق بسبب ظهور مثل هذا الاعتماد. على سبيل المثال ، لم يعد من الممكن اعتبار تدفق الركاب الذين يغادرون محطة المترو تدفقاً بدون تأثير لاحق ، لأن أوقات خروج الركاب الذين يصلون بواسطة نفس القطار تعتمد على بعضهم البعض.

تدفقالأحداث تسمى عادي، إذا كان احتمال ضرب حدثين أو أكثر في فترة زمنية قصيرة t ضئيلًا مقارنة باحتمال ضرب حدث واحد (في هذا الصدد ، يسمى قانون بواسون قانون الأحداث النادرة).

يعني الشرط الاعتيادي أن الطلبات تأتي في وقت واحد ، وليس في أزواج ، أو ثلاثة توائم ، وما إلى ذلك. انحراف التباين توزيع برنولي

على سبيل المثال ، يمكن اعتبار تدفق العملاء الذين يدخلون صالون تصفيف الشعر أمرًا عاديًا تقريبًا. إذا كانت التطبيقات في تدفق غير عادي تأتي فقط في أزواج ، فقط في ثلاثة توائم ، وما إلى ذلك ، فيمكن تقليل التدفق الاستثنائي بسهولة إلى التدفق العادي ؛ لهذا يكفي النظر في تدفق الأزواج ، أو الثلاثة أضعاف ، وما إلى ذلك ، بدلاً من تدفق التطبيقات الفردية. سيكون الأمر أكثر صعوبة إذا كان كل تطبيق يمكن أن يتحول بشكل عشوائي إلى مزدوج ، أو ثلاثي ، وما إلى ذلك. ثم يتعين على المرء بالفعل أن التعامل مع تيار من الأحداث غير المتجانسة ، ولكن غير المتجانسة.

إذا كان لتدفق الأحداث جميع الخصائص الثلاث (أي أنه ثابت ، عادي ، وليس له أي تأثير لاحق) ، فإنه يطلق عليه أبسط تدفق (أو ثابت من بواسون). يرجع اسم "Poisson" إلى حقيقة أنه ، وفقًا للشروط المذكورة أعلاه ، سيتم توزيع عدد الأحداث التي تقع في أي فترة زمنية محددة على قانون بواسون

هنا هو متوسط ​​عدد الأحداث أتظهر لكل وحدة زمنية.

هذا القانون هو معيار واحد ، أي لا يتطلب سوى معلمة واحدة ليتم التعرف عليها. يمكن إثبات أن التوقع الرياضي والتباين في قانون بواسون متساويان عدديًا:

مثال. في منتصف يوم العمل ، يكون متوسط ​​عدد الطلبات 2 في الثانية. ما هو احتمال 1) عدم استقبال أي طلبات في الثانية ، 2) 10 طلبات سيتم تلقيها في ثانيتين؟

حل.نظرًا لأن صلاحية تطبيق قانون بواسون أمر لا شك فيه وتم تعيين معاملته (= 2) ، يتم تقليل حل المشكلة إلى تطبيق معادلة بواسون (19.11)

1) ر = 1, م = 0:

2) ر = 2, م = 10:

قانون الأعداد الكبيرة.الأساس الرياضي لحقيقة أن قيم المتغير العشوائي يتم تجميعها حول بعض القيم الثابتة هو قانون الأعداد الكبيرة.

تاريخيًا ، كانت أول صياغة لقانون الأعداد الكبيرة هي نظرية برنولي:

"مع زيادة غير محدودة في عدد التجارب المتطابقة والمستقلة n ، يتقارب تواتر حدوث الحدث A في احتمالية حدوثه" ، أي

أين هو تكرار حدوث الحدث A في تجارب n ،

من حيث المعنى ، يعني التعبير (19.10) أنه مع وجود عدد كبير من التجارب ، فإن تكرار حدوث حدث أيمكن أن يحل محل الاحتمال غير المعروف لهذا الحدث ، وكلما زاد عدد التجارب ، اقترب p * إلى p. حقيقة تاريخية مثيرة للاهتمام. ألقى K.Pearson قطعة نقود معدنية 12000 مرة وسقط شعار النبالة الخاص به 6019 مرة (تردد 0.5016). عند إلقاء نفس العملة 24000 مرة ، تلقى 12012 قطرة من شعار النبالة ، أي تردد 0.5005.

أهم شكل من أشكال قانون الأعداد الكبيرة هي نظرية تشيبيشيف: مع زيادة غير محدودة في عدد المستقلين ، مع وجود تباين محدود ويتم إجراؤه في نفس ظروف التجارب ، فإن المتوسط ​​الحسابي للقيم المرصودة لمتغير عشوائي يتقارب في الاحتمال مع توقعه الرياضي. في شكل تحليلي ، يمكن كتابة هذه النظرية على النحو التالي:

نظرية تشيبيشيف ، بالإضافة إلى أهميتها النظرية الأساسية ، لها أيضًا تطبيق عملي مهم ، على سبيل المثال ، في نظرية القياسات. بعد ن قياسات لبعض الكمية X، احصل على قيم مختلفة غير متطابقة X 1, X 2, ..., xn. للقيمة التقريبية للقيمة المقاسة Xخذ المتوسط ​​الحسابي للقيم المرصودة

حيث، كلما تم إجراء المزيد من التجارب ، كانت النتيجة أكثر دقة.الحقيقة هي أن تباين القيمة يتناقص مع زيادة عدد التجارب التي أجريت منذ ذلك الحين

د(x 1) = د(x 2)=…= د(xn) د(x) ، الذي - التي

توضح العلاقة (19.13) أنه حتى مع وجود عدم دقة عالية في أدوات القياس (قيمة كبيرة) ، من خلال زيادة عدد القياسات ، من الممكن الحصول على نتيجة بدقة عالية بشكل تعسفي.

باستخدام الصيغة (19.10) ، يمكن للمرء أن يجد احتمال أن التردد الإحصائي ينحرف عن الاحتمال بما لا يزيد عن

مثال.احتمال وقوع حدث في كل تجربة هو 0.4. كم عدد الاختبارات التي ينبغي إجراؤها من أجل توقع احتمال لا يقل عن 0.8 أن التردد النسبي لحدث ما سينحرف عن معامل الاحتمال الأقل من 0.01؟

حل.بالصيغة (19.14)

لذلك ، وفقًا للجدول ، هناك تطبيقان

لذلك، ن 3932.

دعونا نحسب فيآنسةاكسلالتباين والانحراف المعياري للعينة. نحسب أيضًا تباين المتغير العشوائي إذا كان توزيعه معروفًا.

فكر أولاً تشتت، ثم الانحراف المعياري.

تباين العينة

تباين العينة (تباين العينةعينةالتباين) يميز انتشار القيم في المصفوفة بالنسبة إلى.

جميع الصيغ الثلاثة متكافئة رياضياً.

يمكن أن نرى من الصيغة الأولى أن تباين العينةهو مجموع الانحرافات التربيعية لكل قيمة في المصفوفة من المتوسطمقسومًا على حجم العينة مطروحًا منه 1.

تشتت عيناتيتم استخدام وظيفة DISP () ، المهندس. اسم VAR ، أي التباين. منذ MS EXCEL 2010 ، يوصى باستخدام نظيره DISP.V () ، eng. اسم VARS ، أي نموذج التباين. بالإضافة إلى ذلك ، بدءًا من إصدار MS EXCEL 2010 ، هناك وظيفة DISP.G () ، eng. اسم VARP ، أي التباين السكاني الذي يحسب تشتتل سكان. ينخفض ​​الاختلاف الكامل إلى المقام: بدلاً من n-1 مثل DISP.V () ، يحتوي DISP.G () على n فقط في المقام. قبل MS EXCEL 2010 ، تم استخدام الدالة VARP () لحساب تباين المحتوى.

تباين العينة
= مربع (نموذج) / (عدد (عينة) -1)
= (SUMSQ (نموذج) -حساب (نموذج) * AVERAGE (نموذج) ^ 2) / (COUNT (نموذج) -1)- الصيغة المعتادة
= SUM ((نموذج - AVERAGE (نموذج)) ^ 2) / (COUNT (نموذج) -1) –

تباين العينةتساوي 0 فقط إذا كانت جميع القيم متساوية ، وبالتالي فهي متساوية قيمة متوسط. عادة ، كلما كانت القيمة أكبر تشتت، كلما زاد انتشار القيم في المصفوفة.

تباين العينةهو تقدير نقطة تشتتتوزيع المتغير العشوائي الذي منه عينة. حول البناء فترات الثقةعند التقييم تشتتيمكن قراءتها في المقال.

تباين المتغير العشوائي

لكي يحسب تشتتمتغير عشوائي ، عليك أن تعرفه.

ل تشتتالمتغير العشوائي X غالبًا ما يستخدم الترميز Var (X). تشتتيساوي مربع الانحراف عن المتوسط ​​E (X): Var (X) = E [(X-E (X)) 2]

تشتتمحسوبة بالصيغة:

حيث x i هي القيمة التي يمكن أن يأخذها المتغير العشوائي ، و μ هي متوسط ​​القيمة () ، و p (x) هي احتمال أن يأخذ المتغير العشوائي القيمة x.

إذا كان المتغير العشوائي ، إذن تشتتمحسوبة بالصيغة:

البعد تشتتيتوافق مع مربع وحدة قياس القيم الأصلية. على سبيل المثال ، إذا كانت القيم في العينة عبارة عن قياسات لوزن الجزء (بالكيلو جرام) ، فإن أبعاد التباين ستكون كجم 2. قد يكون من الصعب تفسير ذلك ، لذلك ، لتوصيف انتشار القيم ، وهي قيمة تساوي الجذر التربيعي لـ تشتتالانحراف المعياري.

بعض الخصائص تشتت:

Var (X + a) = Var (X) ، حيث X متغير عشوائي و a ثابت.

فار (أХ) = أ 2 فار (س)

Var (X) = E [(X-E (X)) 2] = E = E (X 2) -E (2 * X * E (X)) + (E (X)) 2 = E (X 2) - 2 * E (X) * E (X) + (E (X)) 2 = E (X 2) - (E (X)) 2

يتم استخدام خاصية التشتت هذه في مقالة حول الانحدار الخطي.

Var (X + Y) = Var (X) + Var (Y) + 2 * Cov (X ؛ Y) ، حيث X و Y متغيرات عشوائية ، Cov (X ؛ Y) هي التغاير بين هذه المتغيرات العشوائية.

إذا كانت المتغيرات العشوائية مستقلة ، فعندئذٍ التغايرتساوي 0 ، وبالتالي فإن Var (X + Y) = Var (X) + Var (Y). يتم استخدام خاصية التباين هذه في الإخراج.

دعونا نوضح ذلك بالنسبة للكميات المستقلة Var (X-Y) = Var (X + Y). في الواقع ، Var (X-Y) = Var (X-Y) = Var (X + (- Y)) = Var (X) + Var (-Y) = Var (X) + Var (-Y) = Var (X) + (- 1) 2 Var (Y) \ u003d Var (X) + Var (Y) \ u003d Var (X + Y). تُستخدم خاصية التباين هذه للتخطيط.

الانحراف المعياري للعينة

الانحراف المعياري للعينةهو مقياس لمدى انتشار القيم في العينة بالنسبة لها.

الدير ، الانحراف المعيارييساوي الجذر التربيعي ل تشتت:

الانحراف المعياريلا يأخذ في الاعتبار حجم القيم في أخذ العينات، ولكن فقط درجة تشتت القيم من حولهم وسط. لنأخذ مثالاً لتوضيح ذلك.

دعنا نحسب الانحراف المعياري لعينتين: (1 ؛ 5 ؛ 9) و (1001 ؛ 1005 ؛ 1009). في كلتا الحالتين ، s = 4. من الواضح أن نسبة الانحراف المعياري إلى قيم المصفوفة تختلف اختلافًا كبيرًا بالنسبة للعينات. لمثل هذه الحالات ، استخدم معامل الاختلاف(معامل التباين ، CV) - النسبة الانحراف المعياريإلى المتوسط علم الحساب، معبرًا عنها بالنسبة المئوية.

في MS EXCEL 2007 والإصدارات السابقة للحساب الانحراف المعياري للعينةيتم استخدام الدالة = STDEV () ، المهندس. اسم STDEV ، أي الانحراف المعياري. منذ MS EXCEL 2010 ، يوصى باستخدام نظيره = STDEV.B () ، eng. اسم STDEV.S ، أي الانحراف المعياري للعينة.

بالإضافة إلى ذلك ، بدءًا من إصدار MS EXCEL 2010 ، هناك وظيفة STDEV.G () ، eng. اسم STDEV.P ، أي التباين القياسي للسكان الذي يتم حسابه الانحراف المعياريل سكان. يعود الاختلاف الكامل إلى المقام: بدلاً من n-1 مثل STDEV.V () ، يحتوي STDEV.G () على n فقط في المقام.

الانحراف المعيارييمكن أيضًا حسابها مباشرة من الصيغ أدناه (انظر ملف المثال)
= SQRT (SQUADROTIV (نموذج) / (العدد (عينة) -1))
= SQRT ((SUMSQ (نموذج) - العدد (نموذج) * متوسط ​​(نموذج) ^ 2) / (عدد (نموذج) -1))

تدابير التشتت الأخرى

تحسب الدالة SQUADRIVE () باستخدام أم من انحرافات القيم التربيعية عن قيمهم وسط. ستعيد هذه الدالة نفس النتيجة مثل الصيغة = VAR.G ( عينة)*يفحص( عينة) ، أين عينة- مرجع إلى نطاق يحتوي على مصفوفة من عينات القيم (). يتم إجراء الحسابات في دالة QUADROTIV () وفقًا للصيغة:

وظيفة SROOT () هي أيضًا مقياس لتشتت مجموعة من البيانات. تحسب الدالة SIROTL () متوسط ​​القيم المطلقة لانحرافات القيم من وسط. سترجع هذه الدالة نفس نتيجة الصيغة = SUMPRODUCT (ABS (Sample-AVERAGE (Sample))) / COUNT (نموذج)، أين عينة- مرجع إلى نطاق يحتوي على مصفوفة من عينات القيم.

يتم إجراء الحسابات في الدالة SROOTKL () وفقًا للصيغة: