Пример: Нека Y е броят на момичетата в предишния пример. Важно е да се отбележи, че разпределението на Y е същото като разпределението на X, но XY. В този случай има детерминирана връзка между X и Y. .

По този начин, ако имаме основно пространство, дадено от набор от елементарни явления, случайната променлива може да се разбере като функция, която приписва числова стойност на всяко от елементарните явления. Напр. NV X присвоява стойността 0 на елементарно явление, стойността 1 на елементарно явление и т.н. След това вероятността за наблюдение на определена стойност на NV X се дава от сумата от вероятностите на елементарните явления, при които тя придобива тази стойност. Напр. .

Често се използва за съкращение в случай на дискретна NV. да се подчертае, че X може да приема само определени специфични стойности (вместо общи).

Може да се даде разпределението на вероятностите

  • таблица (тип x/p (x))
  • графика:
    вероятностни
  • по формула:

В примера първо изберете броя на децата в семейството (). Ще се ограничим до. Ще наблюдаваме дискретна случайна променлива, която, подобно на първия пример, ще представлява броя на момчетата от даден брой деца в семейството. Предполагаме, че вероятността да се роди момче е. Очевидно може да придобие ценности. Аплетът изчислява вероятността за поява за всяка стойност. Вероятността за се изчислява по формулата. Разпределението на вероятностите на количеството е показано графично и също чрез таблица.

5.2 Характеристики на дискретни NV

В началото на глава 2 имахме случайни извадки (брой деца, височини), открихме разпределението на относителното изобилие и въз основа на тях определихме средната стойност и (проба) дисперсия. Ако диапазонът на селекция беше близо до безкрайността, относителните числа ще се доближат до съответните вероятности. Следователно има смисъл да се определят средната стойност и вариация на популацията респ. вероятностни разпределения.

Определение 5.2.1: Средното (население) NV е .
Дисперсията (популацията) на NV X е .
Режимът NV X е стойността, за която .
Медианата NV X е стойността, за която .
Средното отклонение на NV X е или .
Стандартното отклонение е .

Забележка: Често обозначаваме средната стойност като или. Често обозначаваме и разсейването с или. Медианата не трябва да бъде ясно определена от дадените условия.

Теорема 5.2.2: Отнася се за:

Забележка: Количеството се обозначава като и се нарича вторият (нецентрален) момент (на случайната променлива X или разпределението X). Количеството се нарича още 2-ри централен момент. Теорема 5.2.2 съдържа т.нар изчислена форма - изчисляването на дисперсията по тази формула е по-лесно, отколкото по дефиниция.

Пример: Изчислете средната стойност и дисперсията на разпределението на броя на момчетата в произволно семейство с 3 деца.

0 1/8 0 -3/2 9/4 9/32 0
1 3/8 3/8 -1/2 1/4 3/32 3/8
2 3/8 6/8 1/2 1/4 3/32 12/8
3 1/8 3/8 3/2 9/4 9/32 9/8
Контрол: .
Ако P (момче) = 1/2, тогава средната стойност от 1,5 също се очаква интуитивно.

В примера първо изберете броя на децата () в семейството. Както в примера, ние ще се интересуваме от по-високата средна стойност и вариацията на разпределението на броя на момчетата. Аплетът изчислява за всяка стойност, съответните стойности), както и стойностите във всички други колони, дадени в примера по-горе. След това се изчислява стойността за режим, медиана, средно отклонение и стандартно отклонение. Аплетът работи с фракции, за да направи изчисляването на средното и дисперсията по-ясно. Изчислява се и стойността на втория нецентрален момент.

Ако трансформираме NV X линейно, се прилага еквивалентът на предложение 2.3.3:

Изявление 5.2.3: Нека NV е средната стойност и отклонението. Тогава за средната стойност и дисперсията на NV се прилага следното:
.

5.3 Биномно разпределение

Пример за биномна случайна променлива е .
Като цяло: нека имаме независими "експерименти" (експериментите на Бернули), всеки от които завършва с "успех" или "неуспех" с вероятност респ., където . Тогава тя се нарича биномна случайна променлива. Ще бъде означен фактът, че случайна променлива има биномно разпределение .

Например, ако всяка последователност от 5 резултата с 2 успеха и 3 неуспеха има същата вероятност. Броят на начините да изберете място за 2 успеха от 5 опита е. Следователно е вярно. Като цяло изглежда, че се прилага аналогична формула

Пример: Нека 60% от населението на САЩ са демократи, а останалите републиканци. На случаен принцип бяха избрани 5 избиратели. Каква е вероятността това

  1. трима от тях са демократи?
  2. повечето са демократи?
а)
б) .

Изберете процента от населението, което е демократи. Така получаваме вероятността за съществуването на демократа (). След това изберете броя на селекторите (). Аплетът изчислява стойности за, които показва в таблица и графично. Следователно ние изследваме случайна променлива, представляваща броя на демократите в броя на гласоподавателите, които вписахме. Според формулата, дадена под аплета, той също изчислява средната стойност и дисперсията.

Теорема 5.3.1: Ако NV, то за неговата средна стойност и отклонение: .

Доказателство: Тъй като за, е, защото последната сума е сумата от всички вероятности на случайна променлива с разпределение. По аналогия QED се прилага за дисперсията.

5.4 Геометрично разпределение

Тук също ще приемем, че извършваме експерименти на Бернули (т.е. независими, с вероятност за успех). Нека случайна променлива има геометрично разпределение (т.е. в този случай, за разлика от биномно разпределение, случайна променлива е броят на направените опити). Тъй като всички опити преди първия успех трябва да са неуспехи, редът на успехите и неуспехите е ясно определен. Следователно:

Предложение 5.4.1: Ако NV, то за неговата средна стойност и отклонение: .

Пример: Избираме случайно САЩ избиратели. Чудим се кога ще се срещнем с първия избирател на демократите. Оставете го да се прилага отново. Тогава

  • ;
  • ;
  • .
Средният брой запитвания относно изборните предпочитания изглежда е .

Отново изберете процента от населението (), които са демократи. Ние изучаваме случайна променлива, която представлява броя на опитите, преди да срещнем първия демократ. Индивидуални стойности на вероятности за появата на демократ, за експеримент №. 1 до 9 са показани графично. Също така изчисляваме средната стойност и дисперсията, съгласно горните отношения.

5.5 Отрицателно биномно разпределение

Основата на това разделение отново са експериментите на Бернули (т.е. независими, с вероятност за успех). Нека случайната променлива има отрицателно биномно разпределение. И тук броят на направените опити се намалява с произволна променлива, намален с необходимия брой r късмет. Тъй като успехът трябва да е последен, редът на успехите и неуспехите се определя от позициите на предишните успехи. Следователно:

Предложение 5.5.1: Ако NV, то за неговата средна стойност и отклонение: .

Този резултат е в съответствие с интуитивното очакване, че средната стойност на чакането r-успехът е r-кратно на средното чакане за един (първи) успех.

Пример: Избираме случайно САЩ избиратели. Чудим се кога ще се срещнем с четвъртия избирател на демократите. Оставете го да се прилага отново. Тогава

  • ;
  • ;
  • ;
  • ;
  • .
Средният брой запитвания относно изборните предпочитания изглежда е .

5.6 Разпределение на Поасон

Разпределението на Поасон е разпределението на броя на случайните събития в рамките на определен времеви интервал или място, ако събитията се случват с фиксирана средна честота и независимо от (време, място) предишни събития. Посочен е средният брой повторения на събитието. Тази стойност е единственият параметър на разпределението. Отнася се за:

Това разпределение е ограничителен случай на биномно разпределение с вероятност за успех в зависимост от броя на опитите. Ако е вярно при такова разделение, тогава .

Предложение 5.6.1: Ако NV, то за неговата средна стойност и отклонение: .

Пример: Супермаркетът обеща да плати финансова компенсация на клиенти, които ще чакат на касата повече от 10 минути. Средният брой касови апарати, които трябва да работят, така че клиентите да не трябва да плащат нищо, е 5. Каква е вероятността дори 10 касови апарата да не са достатъчни, за да обслужват всички клиенти в рамките на 10 минути?
Ако приемем предположението, че пристигащите клиенти са независими и хомогенни във времето, тогава броят на клиентите в интервала от 10 минути и съответно броят на необходимите касови апарати има разпределение на Поасон. Броят на необходимите касови апарати се разделя на Po (5). За това

  • ;
  • ;
  • ;
  • .
  • ;
Следователно вероятността дори десет касира да не са достатъчни е .

5.7 Хипергеометрично разпределение

Хипергеометричното разпределение е подобно на биномиалното разпределение за крайни популации. Позволява да бъде размерът на популацията, от която индивидът има някаква крайна точка (). Ние избираме произволно индивиди от популацията (следователно без да повръщаме). Броят на индивидите, които имат наблюдаваното свойство в тази селекция, е случайна променлива с хипергеометрично разпределение. Поради метода на подбор за кандидатства

Забележка: Границите за резултат са от естествените граници за числата на комбинацията: и в същото време .

Ако и, тогава разделението се сближава с .

Предложение 5.7.1: Ако NV, то за неговата средна стойност и отклонение: .

Пример: Сред групата от 30 студенти в САЩ има 18 избиратели демократи и 12 избиратели републиканци. 5 от тях бяха избрани на случаен принцип. Каква е вероятността това

  1. трима от тях са демократи?
  2. повечето са демократи?
а)
б) .

5.8 Непрекъснато разпространение

Случайното разпределение с непрекъснато разпределение е доста добре описано от стълбовидна диаграма на относителните честоти. Ние знаем това. Следователно, чрез просто мащабиране можем да постигнем, че общата площ на графиката е равна на 1. Тогава площта на колоната на всеки интервал е равна на относителното изобилие на класа и по този начин приблизително равна на вероятността че наблюдаваната случайна променлива придобива стойност, принадлежаща на този интервал. Затова дефинираме: Графиката му обаче е засегната

  1. случайно (имам само селекция, а не целия файл);
  2. като изберете броя и границите на класовете.
Ние можем да премахнем тези ефекти
  1. увеличаване на броя на наблюденията;
  2. чрез прецизиране на класовете (1 позволява 2).
Така
Чрез преминаване, ако в същото време ширината на класа отива до 0, получаваме плавна крива, наречена вероятностна плътност. Общата площ под него е равна на 1.

Този аплет генерира числа от разпределението. Интервалът е разделен на толкова по-малки интервали със същата дължина, колкото изберете. Генерираните числа се сортират в тези интервали и се изчисляват числата за всеки интервал (т.е. колко от генерираните числа принадлежат на всеки от интервалите). Така че можете да увеличите/намалите броя на числата, които ще бъдат генерирани, а също така да увеличите/намалите броя на споменатите класове (усъвършенстване на класа).

Особено за непрекъснати случайни променливи е, т.е. и т.н.

Това са пределните случаи на формулите в раздел 2.2. Нито режимът, нито средната стойност трябва да се определят еднозначно.

Определение 5.8.3: Функцията за разпределение на NV се нарича функция .

Предложение 5.8.4: Ако NV е непрекъсната с плътност, то това важи за нейната функция на разпределение

По този начин функцията за разпределение ясно определя вероятностното разпределение.

5.9 Нормално разпределение

Много случайни променливи, напр. грешки, възникващи при измерването на химични, физически или икономически величини, има нормално разпределение. Математически това разпределение има най-красивите свойства, като се приеме нормалност, много проблеми са изрично разрешими. Много други подразделения, напр. бином, може да бъде добре апроксимиран по норма.

а) стандартизирано нормално разпределение

Случайната променлива има нормализирано нормално разпределение, ако нейната вероятностна плътност е

Теорема 5.9.1: Нека случайната променлива има нормализирано нормално разпределение. Тогава се прилага

Доказателство: Очевидно
Използване за партита

като има предвид, че функцията в квадратни скоби е нечетна, а функцията под интеграла е плътност. QED.

Това разпределение често се нарича неговата плътност и функция на разпределение. Стойностите са в таблици (различни програми също могат да изчислят своите числени приближения).

- графика на плътността на разпределение на плоскостите на аплети. Можете да преместите точката на прекъсване, чрез която трябва да се изчисли съдържанието на областта под графиката, т.е. стойността на функцията за разпределение. Графиката на функцията за разпределение също се начертава и свързва с графика на плътността. Графиката на функцията за разпределение показва точката, чиято у-Координатата определя съдържанието на графиката под плътността на интервала. Точната стойност се записва в текстовото поле.

Забележка: Ако случайната променлива X има средна стойност и дисперсия, тогава случайната променлива има средна стойност 0 и дисперсия 1. Тази трансформация се нарича нормализиране или стандартизация на случайната променлива.

Пример: намирам .
В таблиците, които намираме. От това

  • ;
  • ;
  • .
В последния ред използвахме симетрията на плътността (около нулата), което води до централната симетрия на функцията за разпределение, т.е. .

б) общо нормално разпределение

Той възниква от нормализирано нормално разпределение чрез преминаване към някакво средно и мащабиращо време, така че да има дисперсия. Има плътност Ние наричаме това разделение. Плътността е симетрична около средната стойност. Ако, тогава .

5.10 Функция на произволна променлива

Помислете отново за случайно семейство с 3 деца и приемете, че цената на семейното спортно оборудване зависи само от броя на момчетата: къде е броят на момчетата. Например: (в €).

Средната стойност на разходите за спортно оборудване в семейството е, но не трябваше да изчисляваме разпределението, можехме да дойдем директно от разпределението на случайна променлива:

01501/8150/8
12403/8720/8
22703/8810/8
32401/8240/8
1920/8

Предложение 5.10.1: Нека NV е деление и е някаква функция, чийто домейн съдържа всички възможни стойности. Тогава когато е дискретно респ. непрекъснато NV.

Забележка: От това твърдение следва, че средният символ е линеен оператор. Понякога използваме скоби след него, за да определим точно какво правим от средното. Напр. Можем също така да дадем дефиницията на дисперсията във формата респ. . Неговата линейност може да се използва при изчисления; Например: Тази еквивалентна форма за дисперсия се нарича изчислителна форма, тъй като обикновено е значително по-проста за изчисляване, отколкото по дефиниция.