Нормальний розподіл та його параметри. Функція розподілу випадкової величини

16.04.2023

Насправді більшість випадкових величин, у яких впливає велика кількість випадкових чинників, підпорядковуються нормальному закону розподілу ймовірностей. Тому у різних додатках теорії ймовірностей цей закон має особливе значення.

Випадкова величина $X$ підпорядковується нормальному закону розподілу ймовірностей, якщо її щільність розподілу ймовірностей має такий вигляд

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2)))$$

Схематично графік функції $f \ left (x \ right) $ представлений на малюнку і має назву "Гауссова крива". Праворуч від цього графіка зображено банкноту в 10 марок ФРН, яка використовувалася ще до появи євро. Якщо добре придивитися, то на цій банкноті можна помітити криву гауса і її першовідкривача найбільшого математика Карла Фрідріха Гауса.

Повернемося до нашої функції щільності $f\left(x\right)$ і дамо деякі пояснення щодо параметрів розподілу $a,\ (\sigma )^2$. Параметр $a$ характеризує центр розсіювання значень випадкової величини, тобто сенс математичного очікування. При зміні параметра $a$ і незміненому параметрі $(\sigma )^2$ ми можемо спостерігати зміщення графіка функції $f\left(x\right)$ вздовж осі абсцис, причому графік щільності не змінює своєї форми.

Параметр $(\sigma )^2$ є дисперсією і характеризує форму кривої графіка щільності $f\left(x\right)$. При зміні параметра $(\sigma )^2$ при незміненому параметрі $a$ ми можемо спостерігати, як графік щільності змінює свою форму, стискаючись чи розтягуючись, у своїй не зсуваючись уздовж осі абсцис.

Імовірність влучення нормально розподіленої випадкової величини у заданий інтервал

Як відомо, ймовірність попадання випадкової величини $X$ в інтервал $\left(\alpha ;\ \beta \right)$ можна обчислювати $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Тут функція $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ - функція Лапласа . Значення цієї функції беруться із . Можна відзначити такі властивості функції $ \ Phi \ left (x \ right) $.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, тобто функція $\Phi \left(x\right)$ є непарною.

2 . $\Phi \left(x\right)$ - монотонно зростаюча функція.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ left (x \ right) \ ) = -0,5 $.

Для обчислення значень функції $\Phi \left(x\right)$ можна також скористатися майстром функція $f_x$ пакета Excel: $\Phi \left(x\right)=НОРМРАСП\left(x;0;1;1\right ) -0,5 $. Наприклад, обчислимо значень функції $\Phi\left(x\right)$ за $x=2$.

Імовірність попадання нормально розподіленої випадкової величини $X\in N\left(a;\ (\sigma )^2\right)$ в інтервал, симетричний щодо математичного очікування $a$, може бути обчислена за формулою

$$P\left(\left|X-a\right|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Правило трьох сигм. Практично достовірно, що нормально розподілена випадкова величина $X$ потрапить в інтервал $\left(a-3\sigma ;a+3\sigma \right)$.

Приклад 1 . Випадкова величина $X$ підпорядкована нормальному закону розподілу ймовірностей із параметрами $a=2,\sigma =3$. Знайти ймовірність потрапляння $X$ в інтервал $\left(0,5;1\right)$ і можливість виконання нерівності $\left|X-a\right|< 0,2$.

Використовуючи формулу

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

знаходимо $P\left(0,5;1\right)=\Phi \left(((1-2)\over(3))\right)-\Phi \left(((0,5-2)\) over (3))\right)=\Phi \left(-0,33\right)-\Phi \left(-0,5\right)=\Phi \left(0,5\right)-\Phi \ left (0,33 \ right) = 0,191-0,129 = 0,062 $.

$$P\left(\left|X-a\right|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Приклад 2 . Припустимо, що протягом року ціна на акції деякої компанії є випадкова величина, розподілена за нормальним законом з математичним очікуванням, рівним 50 умовним грошовим одиницям, і стандартним відхиленням, рівним 10. Чому дорівнює ймовірність того, що у випадково обраний день обговорюваного періоду ціна за акцію буде:

а) понад 70 умовних грошових одиниць?

б) нижче за 50 за акцію?

в) між 45 та 58 умовними грошовими одиницями за акцію?

Нехай випадкова величина $X$ – ціна на акції деякої компанії. За умовою $X$ підпорядкована нормальному закону розподілу з параметрами $a=50$ - математичне очікування, $sigma =10$ - стандартне відхилення. Можливість $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\right)=\Phi \left(((\infty -50)\over (10))\right)-\Phi \left(((70-50)\) over (10)) \ right) = 0,5-Phi \ left (2 \ right) = 0,5-0,4772 = 0,0228.

$$б)\ P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$в)\ P\left(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Визначення. Нормальнимназивається розподіл ймовірностей безперервної випадкової величини, який описується щільністю ймовірності

Нормальний закон розподілу також називається законом Гауса.

Нормальний закон розподілу займає центральне місце у теорії ймовірностей. Це зумовлено тим, що цей закон проявляється у всіх випадках, коли випадкова величина є результатом дії великої кількості різних факторів. До нормального закону наближаються й інші закони розподілу.

Можна легко показати, що параметри і , що входять у щільність розподілу є математичним очікуванням і середнім квадратичним відхиленням випадкової величини Х.

Знайдемо функцію розподілу F(x).

Графік щільності нормального розподілу називається нормальною кривоюабо кривою Гауса.

Нормальна крива має такі властивості:

1) Функція визначена по всій числовій осі.

2) За всіх хфункція розподілу набуває лише позитивних значень.

3) Вісь ОХ є горизонтальною асимптотою графіка густини ймовірності, т.к. при необмеженому зростанні за абсолютною величиною аргументу хзначення функції прагне до нуля.

4) Знайдемо екстремум функції.

Т.к. при y’ > 0при x< m і y’< 0 при x > m, то в точці х = тфункція має максимум, що дорівнює .

5) Функція є симетричною щодо прямої х = а, т.к. різниця

(х – а) входить у функцію щільності розподілу у квадраті.

6) Для знаходження точок перегину графіка знайдемо другу похідну функції щільності.

При x = m+ s та x = m- s друга похідна дорівнює нулю, а під час переходу через ці точки змінює знак, тобто. у цих точках функція має перегин.

У цих точках значення функції дорівнює.

Побудуємо графік функції густини розподілу.

Побудовано графіки при т=0 і трьох можливих значеннях середнього квадратичного відхилення s = 1, s = 2 і s = 7. Як видно, зі збільшенням значення середнього квадратичного відхилення графік стає більш пологім, а максимальне значення зменшується.

Якщо а> 0, то графік зміститься у позитивному напрямку, якщо а < 0 – в отрицательном.

При а= 0 і s = 1 крива називається нормованою. Рівняння нормованої кривої:

Для стислості кажуть, що СВ Х підпорядковується закону N(m, s), тобто. Х ~ N(m, s). Параметри m та s збігаються з основними характеристиками розподілу: m = m X , s = s Х = . Якщо СВ Х ~ N(0, 1), то вона називається стандартизованою нормальною величиною. ФР стандартизованою нормальною величиною називається функцією Лапласаі позначається як Ф(x). З її допомогою можна обчислювати інтервальні ймовірності для нормального розподілу N(m, s):

P(x 1 £ X< x 2) = Ф - Ф .

При вирішенні завдань на нормальне розподілення часто потрібно використовувати табличні значення функції Лапласа. Оскільки для функції Лапласа справедливе співвідношення Ф(-х) = 1 - Ф(х), достатньо мати табличні значення функції Ф(х)лише позитивних значень аргументу.

Для ймовірності влучення на симетричний щодо математичного очікування інтервал справедлива формула: P(|X - m X |< e) = 2×Ф(e/s) - 1.

Центральні моменти нормального розподілу задовольняють рекурентному співвідношенню: m n +2 = (n+1)s 2 m n , n = 1, 2, ... . Звідси випливає, що це центральні моменти непарного порядку дорівнюють нулю (оскільки m 1 = 0).

Знайдемо можливість потрапляння випадкової величини, розподіленої за нормальним законом, в заданий інтервал.

Позначимо

Т.к. інтеграл не виражається через елементарні функції, то вводиться на розгляд функція

,

яка називається функцією Лапласаабо інтегралом ймовірностей.

Значення цієї функції при різних значеннях хпораховані та наводяться у спеціальних таблицях.

Нижче наведено графік функції Лапласа.

Функція Лапласа має такі властивості:

2) Ф(- х) = - Ф( х);

Функцію Лапласа також називають функцією помилокта позначають erf x.

Ще використовується нормованафункція Лапласа, яка пов'язана з функцією Лапласа співвідношенням:

Нижче наведено графік нормованої функції Лапласа.

При розгляді нормального закону розподілу виділяється важливий окремий випадок, відомий як правило трьох сигм.

Запишемо ймовірність того, що відхилення нормально розподіленої випадкової величини від математичного очікування менше заданої величини D:

Якщо прийняти D = 3s, отримуємо з використанням таблиць значень функції Лапласа:

Тобто. ймовірність того, що випадкова величина відхилиться від свого математичного очікування на величину, більшу за потрійне середнє квадратичне відхилення, практично дорівнює нулю.

Це правило називається правилом трьох сигм.

Не практиці вважається, що з будь-якої – або випадкової величини виконується правило трьох сигм, то ця випадкова величина має нормальне розподіл.

приклад.Потяг складається із 100 вагонів. Маса кожного вагона – випадкова величина, розподілена за нормальним законом з математичним очікуванням а= 65 т і середнім квадратичним відхиленням s = 0,9 т. Локомотив може везти склад масою трохи більше 6600 т, інакше необхідно причіпляти другий локомотив. Знайти ймовірність того, що другий локомотив не потрібно.

Другий локомотив не знадобиться, якщо відхилення маси складу від очікуваного (100×65 = 6500) вбирається у 6600 – 6500 = 100 т.

Т.к. маса кожного вагона має нормальне розподілення, то й маса всього складу теж буде розподілена нормально.

Отримуємо:

приклад.Нормально розподілена випадкова величина Х задана своїми параметрами – а = 2 -математичне очікування та s = 1 – середнє квадратичне відхилення. Потрібно написати щільність ймовірності і побудувати її графік, знайти ймовірність того, що Х прийме значення з інтервалу (1; 3), знайти ймовірність того, що Х відхилиться (по модулю) від математичного очікування не більше ніж на 2.

Щільність розподілу має вигляд:

Побудуємо графік:

Знайдемо можливість потрапляння випадкової величини в інтервал (1; 3).

Знайдемо можливість відхилення випадкової величини від математичного очікування на величину, не більшу ніж 2.

Той самий результат можна отримати з використанням нормованої функції Лапласа.

Лекція 8 Закон великих чисел(Розділ 2)

План лекції

Центральна гранична теорема (загальне формулювання та приватне формулювання для незалежних однаково розподілених випадкових величин).

Нерівність Чебишева.

Закон великих чисел у вигляді Чебишева.

Концепція частоти події.

Статистичне розуміння ймовірності.

Закон великих чисел у вигляді Бернуллі.

Вивчення статистичних закономірностей дозволило встановити, що за деяких умов сумарна поведінка великої кількості випадкових величин майже втрачає випадковий характер і стає закономірною (інакше кажучи, випадкові відхилення від деякої середньої поведінки взаємно погашаються). Зокрема, якщо вплив на суму окремих доданків є рівномірно малим, закон розподілу суми наближається до нормального. Математичне формулювання цього твердження дається в групі теорем, яка називається законом великих чисел.

ЗАКОН ВЕЛИКИХ ЧИСЕЛ- загальний принцип, в силу якого спільна дія випадкових факторів призводить за деяких дуже загальних умов до результату, що майже не залежить від випадку. Першим прикладом дії цього принципу може служити зближення частоти наступу випадкової події з його ймовірністю при зростанні числа випробувань (часто використовується на практиці, наприклад, при використанні частоти будь-якої якості респондента у вибірці як вибіркової оцінки відповідної ймовірності).

Сутність закону великих чиселполягає в тому, що при великій кількості незалежних дослідів частота появи якоїсь події близька до його ймовірності.

Центральна гранична теорема (ЦПТ) (у формулюванні Ляпунова А.М. для однаково розподілених СВ).Якщо попарно незалежні СВ X 1 , X 2 , ..., X n , ... мають однаковий закон розподілу з кінцевими числовими характеристиками M = m і D = s 2 , то при n ® закон розподілу СВ необмежено наближається до нормального закону N(n×m, ).

Слідство.Якщо за умови теореми СВ , то при n ® ¥ закон розподілу СВ Y необмежено наближається до нормального закону N(m, s/ ).

Теорема Муавра Лапласа.Нехай СВК - число "успіхів" в n випробуваннях за схемою Бернуллі. Тоді при n ® і фіксованому значенні ймовірності “успіху” в одному випробуванні p закон розподілу СВ K необмежено наближається до нормального закону N(n×p, ).

Слідство.Якщо за умови теореми замість СВ До розглянути СВ К/n - частоту “успіхів” у n випробуваннях за схемою Бернуллі, її закон розподілу при n ® ¥ і фіксованому значенні p необмежено наближається до нормальному закону N(p, ).

Зауваження.Нехай СВК - число "успіхів" в n випробуваннях за схемою Бернуллі. Законом розподілу такого СВ є біномінальний закон. Тоді при n ® ¥ біномінальний закон має два граничні розподіли:

n розподіл Пуассона(при n ® ¥ і l = n×p = const);

n розподіл Гауса N(n×p, ) (при n ® ¥ і p = const).

приклад.Імовірність "успіху" в одному випробуванні лише p = 0,8. Скільки потрібно провести випробувань, щоб з ймовірністю не менше 0,9 можна очікувати, що частота "успіху", що спостерігається, у випробуваннях за схемою Бернуллі відхилиться від ймовірності p не більше ніж на e = 0,01?

Рішення.Для порівняння розв'яжемо задачу двома способами.

Теоретично ймовірностей розглядається досить велика кількість різноманітних законів розподілу. Для вирішення завдань, пов'язаних з побудовою контрольних карт, цікаві лише деякі з них. Найважливішим з них є нормальний закон розподілу, який застосовується для побудови контрольних карток, що використовуються при контроль за кількісною ознакою, тобто. коли маємо справу з безперервною випадковою величиною. Нормальний закон розподілу займає серед інших законів розподілу особливе становище. Це пояснюється тим, що, по-перше, найчастіше зустрічається на практиці, і, по-друге, він є граничним законом, до якого наближаються інші закони розподілу за типових умов, що дуже часто зустрічаються. Що стосується другої обставини, то в теорії ймовірностей доведено, що сума досить великої кількості незалежних (або слабко залежних) випадкових величин, підпорядкованих будь-яким законам розподілу (при дотриманні деяких дуже нежорстких обмежень), наближено підпорядковується нормальному закону, і це виконується тим точніше, чим більше випадкових величин підсумовується. Більшість випадкових величин, що зустрічаються на практиці, таких, наприклад, як помилки вимірювань, можуть бути представлені як сума дуже великої кількості порівняно малих доданків - елементарних помилок, кожна з яких викликана дією окремої причини, незалежної від інших. Нормальний закон проявляється у тих випадках, коли випадкова змінна Хє результатом дії великої кількості різних чинників. Кожен фактор окремо на величину Хвпливає трохи, і не можна вказати, який саме впливає більшою мірою, ніж інші.

Нормальний розподіл(розподіл Лапласа-Гаусса) – розподіл ймовірностей безперервної випадкової величини Хтаке, що щільність розподілу ймовірностей при - ¥<х< + ¥ принимает действительное значение:

Єхр (3)

Тобто нормальний розподіл характеризується двома параметрами m і s, де m - математичне очікування; s-стандартне відхилення нормального розподілу.

Величина s 2 - Це дисперсія нормального розподілу.

Математичне очікування m характеризує положення центру розподілу, а стандартне відхилення s (СКО) є характеристикою розсіювання (рис. 3).

f(x) f(x)


Рисунок 3 – Функції щільності нормального розподілу:

а) різними математичними очікуваннями m; б) різними СКО s.

Таким чином, значенням μ визначається положенням кривої розподілу на осі абсцис. Розмірність μ - та сама, як і розмірність випадкової величини X. Зі зростанням математичного очікування mобе функції зсувається паралельно вправо. З спадною дисперсією s 2 щільність дедалі більше концентрується навколо m, тоді як функція розподілу стає дедалі крутішою.

Значенням σ визначається форма кривої розподілу. Оскільки площа під кривою розподілу повинна завжди залишатися рівною одиниці, то при збільшенні крива розподілу стає більш плоскою. На рис. 3.1 показано три криві за різних σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Рисунок 3.1 – Функції щільності нормального розподілу зрізними СКО s.

Функція розподілу (інтегральна функція) має вигляд (рис. 4):

(4)

Рисунок 4 – Інтегральна (а) та диференціальна (б) функції нормального розподілу

Особливо важливо те лінійне перетворення нормально розподіленої випадкової змінної Х, після якого виходить випадкова змінна Zз математичним очікуванням 0 та дисперсією 1. Таке перетворення називається нормуванням:

Його можна провести для кожної випадкової змінної. p align="justify"> Нормування дозволяє всі можливі варіанти нормального розподілу звести до одного випадку: m = 0, s = 1.

Нормальний розподіл з m = 0, s = 1 називається нормованим нормальним розподілом (стандартизованим).

Стандартний нормальний розподіл(стандартний розподіл Лапласа-Гаусса або нормований нормальний розподіл) – це розподіл ймовірностей стандартизованої нормальної випадкової величини Z, щільність розподілу якої дорівнює:

при - ¥<z< + ¥

Значення функції Ф(z)визначається за формулою:

(7)

Значення функції Ф(z)та щільності ф(z)нормованого нормального розподілу розраховані та зведені в таблиці (табульовані). Таблиця складена лише для позитивних значень zтому:

Ф (z) = 1Ф(z) (8)

За допомогою цих таблиць можна визначити не тільки значення функції та щільності нормованого нормального розподілу для заданого z, а й значення функції загального нормального розподілу, оскільки:

; (9)

. 10)

У багатьох завданнях, пов'язаних із нормально розподіленими випадковими величинами, доводиться визначати ймовірність влучення випадкової величини Х, підпорядкованої нормальному закону з параметрами m і s на певну ділянку. Такою ділянкою може бути, наприклад, поле допуску на параметр від верхнього значення Uдо нижнього L.

Імовірність попадання в інтервал від х 1 до х 2 можна визначити за формулою:

Таким чином, ймовірність влучення випадкової величини (значення параметра) Ху полі допуску визначається формулою

Можна знайти ймовірність того, що випадкова змінна Хвиявиться в межах μ k s . Отримані значення для k=1,2 і 3 наступні (також дивимося рис. 5):

Таким чином, якщо якесь значення з'являється за межами трисигмової ділянки, в якій знаходяться 99,73% усіх можливих значень, а ймовірність появи такої події дуже мала (1:270), слід вважати, що значення, що розглядається, виявилося занадто маленьким або занадто великим не через випадкове варіювання, а через суттєву перешкоду в самому процесі, здатну викликати зміни в характері розподілу.

Ділянку, що лежить усередині трисигмових кордонів, називають також областю статистичного допускувідповідної машини чи процесу.

Закон нормального розподілу, так званий закон Гауса - один із найпоширеніших законів. Це фундаментальний закон у теорії ймовірностей та в її застосуванні. Нормальний розподіл найчастіше зустрічається у вивченні природних та соціально-економічних явищ. Інакше висловлюючись, більшість статистичних сукупностей у природі та суспільстві підпорядковується закону нормального розподілу. Відповідно можна сказати, що сукупності великої кількості великих за обсягом вибірок підпорядковуються закону нормального розподілу. Ті із сукупностей, які відхиляються від нормального розподілу внаслідок спеціальних перетворень, можуть бути наближені до нормального. У зв'язку з цим слід пам'ятати, що принципова особливість цього закону стосовно інших законів розподілу полягає в тому, що він є законом кордону, до якого наближаються інші закони розподілу у певних (типових) умовах.

Слід зазначити, що термін "нормальний розподіл" має умовний зміст як загальноприйнятий у математичній та статистико-математичній літературі термін. Твердження, що той чи інший ознака будь-якого явища підпорядковується закону нормального розподілу, зовсім не означає непорушність норм, ніби властивих досліджуваному явищу, а віднесення останнього до другого виду закону означає якусь анормальність даного явища. У цьому вся сенсі термін " нормальний розподіл " не зовсім вдалий.

Нормальний розподіл (закон Гаус-Лапласа) є типом безперервного розподілу. Де Муавр (1773, Франція) вивів нормальний закон розподілу ймовірностей. Основні ідеї цього відкриття були використані в теорії помилок вперше К. Гауссом (1809, Німеччина) та А. Лапласом (1812, Франція), які зробили витчутний теоретичний внесок у розробку самого закону. Зокрема, К. Гаусс у своїх розробках виходив із визнання найімовірнішим значенням випадкової величини-середню арифметичну. Загальні умови виникнення нормального розподілу встановив А.М. Ляпунова. Їм було доведено, що якщо досліджувана ознака є результатом сумарного впливу багатьох факторів, кожен з яких мало пов'язаний з більшістю інших, і вплив кожного фактора на кінцевий результат значно перекривається сумарним впливом всіх інших факторів, то розподіл стає близьким до нормального.

Нормальним називають розподіл ймовірностей безперервної випадкової величини, що має щільність:

1 +1 (& #) 2

/ (х, х,<т) = - ^ е 2 ст2

де х - математичне очікування чи середня величина. Як видно, нормальний розподіл визначається двома параметрами: х та °. Щоб встановити нормальний розподіл, достатньо знати математичне очікування або середнє і середнє квадратичне відхилення. Ці дві величини визначають центр угруповання та форму

кривою на графіку. Графік функції і (хх, в) називається нормальною кривою (крива Гауса) з параметрами х та в (рис. 12).

Крива нормального розподілу має точки перегину при X ± 1. Якщо уявити графічно, то між X = + l і 1 = -1 знаходиться 0,683 частини всієї площі кривої (тобто 68,3%). У межах X = + 2 і X-2 знаходяться 0,954 площі (95,4%), а між X = + 3 і X = - 3 - 0,997 частини всієї площі розподілу (99,7%). На рис. 13 проілюстровано характер нормального розподілу з одно-, дво- та трисигмовими кордонами.

При нормальному розподілі середня арифметична, мода та медіана дорівнюватимуть між собою. Форма нормальної кривої має вигляд одновершинної симетричної кривої, гілки якої асимптотично наближаються до осі абсцис. Найбільша ордината кривої відповідає х = 0. У цій точці на осі абсцис розміщується чисельне значення ознак, що дорівнює середній арифметичній, моді та медіані. По обидва боки від вершини кривої її гілки приходять, змінюючи у певних точках форму опуклості на увігнутість. Ці точки симетричні і відповідають значенням х = ± 1, тобто величин ознаки, відхилення яких від середньої чисельно дорівнює середньому квадратичному відхилення. Ордината, що відповідає середній арифметичній, ділить всю площу між кривою та віссю абсцис навпіл. Отже, ймовірності появи значень досліджуваної ознаки більших і менших за середню

арифметичній дорівнюватимуть 0,50, тобто х, (~^х) = 0,50 В

Рис.12. Крива нормального розподілу (крива Гауса)

Форму та положення нормальної кривої зумовлюють значення середнього та середнього квадратичного відхилення. Математично доведено, що зміна величини середнього (математичного очікування) не змінює форми нормальної кривої, а призводить лише до її зміщення уздовж осі абсцис. Крива зрушується вправо, якщо ~ росте, і вліво, якщо ~ приходить.

Рис.14. Криві нормального розподілу з різними значеннями параметрав

Про зміну форми графіка нормальної кривої при зміні

середнього квадратичного відхилення можна судити по максимуму

диференціальної функції нормального розподілу, рівний 1

Як видно, при зростанні величини ° максимальна крива ординату буде зменшуватися. Отже, крива нормального розподілу стискатиметься до осі абсцис і прийматиме більш плосковершинну форму.

І, навпаки, при зменшенні параметра нормальна крива витягується в позитивному напрямку осі ординат, а форма "дзвона" стає більш гостровершиною (рис. 14). Зазначимо, що незалежно від величини параметрів ~ і в площу, обмежена віссю абсцис і кривою, завжди дорівнює одиниці (властивість щільності розподілу). Це наочно ілюструє графік (рис. 13).

Названі вище особливості прояву "нормальності" розподілу дозволяють виділити низку загальних властивостей, які мають криві нормального розподілу:

1) будь-який нормальний крива досягає точки максимуму = х) приходить безперервно праворуч і ліворуч від нього, поступово наближаючись до осі абсцис;

2) будь-яка нормальна крива симетрична по відношенню до прямої,

паралельної осі ординат і проходить через точку максимуму = х)

максимальна ордината дорівнює ^^^ я;

3) будь-яка нормальна крива має форму "дзвона", має опуклість, яка спрямована вгору до точки максимуму. У точках х ~ ° і х + в вона змінює опуклість, і чим менше а, тим гостріше "дзвін", а чим більше а, тим більш нахилею стає вершина "дзвона" (рис.14). Зміна математичного очікування (за незмінної величини

в) не призводить до зміни форми кривої.

При х = 0 і ° = 1 нормальну криву називають нормованою кривою чи нормальним розподілом у канонічному вигляді.

Нормована крива описується такою формулою:

Побудова нормальної кривої за емпіричними даними проводиться за формулою:

пі 1 - "" = --- 7 = е

де і ™ – теоретична частота кожного інтервалу (групи) розподілу; - сума частот, рівну обсягу сукупності; - крок інтервалу;

ж - відношення довжини кола до її діаметру, яке складає

е - основа натуральних логарифмів, що дорівнює 2,71828;

Друга та третя частини формули) є функцією

нормованого відхилення ЦЧ), яку можна розрахувати для будь-яких значень X. Таблиці значень ЦЧ) зазвичай називають "таблиці ординат нормальної кривої" (додаток 3). При використанні цих функцій робоча формула нормального розподілу набуває простого вигляду:

приклад.Розглянемо випадок побудови нормальної кривої з прикладу даних про розподіл 57 працівників за рівнем денного заробітку (табл. 42). За даними таблиці 42, знаходимо середню арифметичну:

~ = ^ = І6 54 =

Розраховуємо середнє квадратичне відхилення:

Для кожного рядка таблиці знаходимо значення нормованого відхилення

х і ~ х | 12 г => - = - ^ 2 = 1.92

а 6.25 (дд Я першого інтервалу тощо).

У графі 8 табл. 42 записуємо табличне значення функції Ді) з програми, наприклад, для першого інтервалу X = 1.92 знаходимо "1,9" проти "2" (0.0632).

Для обчислення теоретичних частот, тобто ординат кривої нормального розподілу, обчислюється множник:

* = ^ = 36,5 а 6,25

Усі знайдені табличні значення функції /(г) множимо на 36,5. Так, для першого інтервалу отримуємо 0,0632x36,5 = 2,31 т. Прийнято нечисленні

частоти (п "<5) об'єднувати (у нашому прикладі - перші два та останні два інтервали).

Якщо крайні теоретичні частоти значно відрізняються від нуля, розбіжність між сумами емпіричних та теоретичних частот може бути значною.

Графік розподілу емпіричних і теоретичних частот (нормальна крива) за даними прикладу, що розглядається, показано на малюнку 15.

Розглянемо приклад визначення частот нормального розподілу випадку, як у крайніх інтервалах відсутня частота (табл. 43). Тут емпірична

X - нормоване відхилення, (в) а - середнє квадратичне відхилення.

частота першого інтервалу дорівнює нулю. Отримана сума неуточнених частот не дорівнює сумі їх емпіричних значень (56*57). І тут розраховується теоретична частота для вмивання отриманих значень центру інтервалу, нормованого відхилення та її функції.

У таблиці 43 ці величини обведено прямокутником. При побудові графіка нормальної кривої у разі теоретичну криву продовжують. У даному випадку нормальна крива буде продовжена у бік негативних відхилень від середньої, оскільки перша не уточнена частота дорівнює 5. Розрахована теоретична частота (уточнена) для першого інтервалу дорівнюватиме одиниці. За сумою уточнені частоти збігаються з емпіричними

Таблиця 42

Розрахункові величини

Статистичні параметри

Інтервал,

Кількість одиниць,

х) 2

нормоване відділення,

теоретична

частота нормального ряду розподілу,

/ 0) х - а

>>

Тисяча шістсот п'ятдесят чотири

а = 6,25

^i = 36,5 а

Таблиця 43

Розрахунок частот нормального розподілу (вирівнювання емпіричних частот за нормальним законом)

Кількість одиниць,

Розрахункові величини

Статистичні параметри

Інтервал (і-2)

Середнє значення (центр) інтервалу,

(Je, -xf

^ x t-x) 1 n та

нормоване відхилення

x s- х

t= x --L

табличне значення функції, f(t)

теоретична

частота нормального ряду розподілу

уточнене значення теоретичної частоти,

ш

-

-

-

-

-

про = 2,41

Мал. 15. Емпіричний розподіл(1) та нормальна крива (2)

Криву нормального розподілу за досліджуваною сукупністю можна побудувати й іншим способом (на відміну від розглянутого вище). Так, якщо необхідно мати наближену уявлення про відповідність фактичного нормального розподілу, обчислення здійснюють наступним послідовності. Визначають максимальну ординату, яка відповідає середньому розміру ознаки), потім, обчисливши середнє квадратичне відхилення, розраховують координати точок кривої нормального розподілу за схемою, викладеною в таблицях 42 і 43. Так, за вихідними та розрахунковими даними таблиці 43 повинні середню ~ = 26 Ця величина Середня збігається з центром четвертого інтервалу (25-27). Отже, частота цього інтервалу "20" може бути прийнята (при побудові графіка) максимальну ординату). Маючи обчислену дисперсію (в = 2,41 см. табл. 43), розраховуємо значення координат всіх необхідних точок кривої нормального розподілу (табл. 44, 45). За отриманими координатами креслимо нормальну криву (рис. 16), прийнявши максимальну частоту ординату четвертого інтервалу.

Узгодженість емпіричного розподілу із нормальним може бути встановлена ​​також шляхом спрощених розрахунків. Так, якщо відношення показника ступеня асиметрії (^) до своєї середньоквадратичної помилки ш а "або відношення показника ексцесу (Е х) до своєї середньоквадратичної помилки т& перевищує за абсолютною величиною число «3», робиться висновок про невідповідність емпіричного розподілу характеру нормального розподілу (тобто,

Ац Е х

якщо А> 3 або ш е "> 3).

Є й інші, нетрудомісткі прийоми встановлення "нормальності" розподілу: а) порівняння середньої арифметичної з модою та медіаною; б) використання цифр Вестергард; в) застосування графічного образу за допомогою напівлогарифмічної сітки Турбіна;г) обчислення спеціальних критеріїв узгодження та ін.

Таблиця 44

Координати 7 точок кривої нормального розподілу

Таблиця 45

Обчислення координат точок кривої нормального розподілу

x - 1,5 (7 =

х - а = 23,6

х - 0,5 (7 = = 24,8

х + 0,5ст = 27,2

х + а = 28,4

X+1,5 (7 =

Рис.16. Крива нормального розподілу, побудована по семи точках

Насправді щодо сукупності щодо узгодження її розподілу з нормальним часто користуються " правилом 3сг " .

Математично доведено ймовірність того, що відхилення від середньої по абсолютній величині буде менше потрійного середнього квадратичного відхилення, що дорівнює 0,9973, тобто, ймовірність того, що абсолютна величина відхилення перевищує потрійне середнє квадратичне відхилення дорівнює 0,0027 або дуже мала. Виходячи з принципу неможливості малоймовірних подій, можна вважати практично неможливим "випадок перевищення" 3 ст. Якщо випадкова величина розподілена нормально, абсолютна величина її відхилення від математичного очікування (середньої) не перевищує потрійного середнього квадратичного відхилення.

У практичних розрахунках діють в такий спосіб. Якщо при невідомому характері розподілу досліджуваної випадкової величини розраховане значення відхилення від середньої виявиться менше значення 3 СТ, тобто підстави вважати, що ознака, що досліджується, розподілена нормально. Якщо зазначений параметр перевищить числове значення 3 СТ, вважатимуться, що розподіл досліджуваної величини не узгоджується з нормальним розподілом.

Обчислення теоретичних частот для досліджуваного емпіричного ряду розподілу прийнято називати вирівнюванням емпіричних кривих за нормальним (або будь-яким іншим) законом розподілу. Цей процес має важливе як теоретичне, так і практичне значення. Вирівнювання емпіричних даних розкриває закономірність у тому розподілі, яка може бути завуальована випадковою формою свого прояви. Встановлену в такий спосіб закономірність можна використовуватиме вирішення низки практичних завдань.

З розподілом, близьким до нормального, дослідник зустрічається в різних сферах науки та галузях практичної діяльності людини. В економіці такого роду розподіли трапляються рідше, ніж, скажімо, у техніці чи біології. Зумовлено це самою природою соціально-економічних явищ, які характеризуються великою складністю взаємопов'язаних та взаємопов'язаних факторів, а також наявністю низки умов, що обмежують вільну гру випадків. Але економіст повинен звертатися до нормального розподілу, аналізуючи будову емпіричних розподілів як до деякого еталону. Таке порівняння дозволяє з'ясувати характер внутрішніх умов, які визначають дану фігуру розподілу.

Проникнення сфери статистичних досліджень у область соціально-економічних явищ дозволило розкрити існування великої кількості різного типу кривих розподілів. Однак не слід вважати, що теоретична концепція кривої нормального розподілу взагалі мало придатна у статистико-математичному аналізі такого типу явищ. Вона може бути не завжди прийнятна в аналізі конкретного статистичного розподілу, але в галузі теорії та практики вибіркового методу дослідження має першорядне значення.

Назвемо основні аспекти застосування нормального розподілу у статистико-математичному аналізі.

1. Для визначення ймовірності конкретного значення ознаки. Це необхідно при перевірці гіпотез щодо відповідності того чи іншого емпіричного розподілу нормальному.

2. Оцінюючи низки параметрів, наприклад, середніх, методом максимальної правдоподібності. Суть його полягає у визначенні такого закону, якому підпорядковується сукупність. Визначається та оцінка, яка дає максимальні значення. Найкраще наближення до параметрів генеральної сукупності дає відношення:

у = - 2 = е 2

3. Для визначення ймовірності вибіркових середніх щодо генеральних середніх.

4. При визначенні довірчого інтервалу, де знаходиться наближене значення показників генеральної сукупності.

(речовий, суворо позитивний)

Нормальний розподіл, також зване розподілом Гаусаабо Гауса - Лапласа- розподіл ймовірностей, яке в одновимірному випадку задається функцією щільності ймовірності, що збігається з функцією Гаусса:

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , (\displaystyle f(x)=(\frac (1)(\sigma (\sqrt (2\pi )))))\ ;e^(-(\frac ((x-\mu)^(2))(2\sigma ^(2)))),)

де параметр μ - математичне очікування (середнє значення), медіана і мода розподілу, а параметр σ - середньоквадратичне відхилення ( σ  ² - дисперсія) розподілу.

Таким чином, одновимірний нормальний розподіл є двопараметричним сімейством розподілів. Багатовимірний випадок описаний у статті «Багатомірний, нормальний, розподіл».

Стандартним нормальним розподіломназивається нормальний розподіл із математичним очікуванням μ = 0 і стандартним відхиленням σ = 1 .

Енциклопедичний YouTube

  • 1 / 5

    Важливе значення нормального розподілу в багатьох галузях науки (наприклад, в математичній статистиці і статистичній фізиці) випливає з центральної граничної теореми теорії ймовірностей. Якщо результат спостереження є сумою багатьох випадкових слабо взаємозалежних величин, кожна з яких робить малий внесок щодо загальної суми, то при збільшенні числа доданків розподіл центрованого та нормованого результату прагне нормального. Цей закон теорії ймовірностей має наслідком стала вельми поширеною нормального розподілу, що й стало однією з причин його найменування.

    Властивості

    Моменти

    Якщо випадкові величини X 1 (\displaystyle X_(1))і X 2 (\displaystyle X_(2))незалежні та мають нормальний розподіл з математичними очікуваннями μ 1 (\displaystyle \mu _(1))і μ 2 (\displaystyle \mu _(2))та дисперсіями σ 1 2 (\displaystyle \sigma _(1)^(2))і σ 2 2 (\displaystyle \sigma _(2)^(2))відповідно, то X 1 + X 2 (\displaystyle X_(1)+X_(2))також має нормальний розподіл із математичним очікуванням μ 1 + μ 2 (\displaystyle \mu _(1)+\mu _(2))та дисперсією σ 1 2 + σ 2 2 . (\displaystyle \sigma _(1)^(2)+\sigma _(2)^(2).)Звідси випливає, що нормальна випадкова величина уявна як сума довільного числа незалежних нормальних випадкових величин.

    Максимальна ентропія

    Нормальний розподіл має максимальну диференціальну ентропію серед усіх безперервних розподілів, дисперсія яких не перевищує задану величину .

    Моделювання нормальних псевдовипадкових величин

    Найпростіші наближені методи моделювання ґрунтуються на центральній, граничній теоремі. Саме якщо скласти кілька незалежних однаково розподілених величин з кінцевою дисперсією , то сума буде розподілена приблизнонормально. Наприклад, якщо скласти 100 незалежних стандартно рівномірнорозподілених випадкових величин, то розподіл суми буде приблизно нормальним.

    Для програмного генерування нормально розподілених псевдовипадкових величин краще використовувати перетворення "Бокса" - "Мюллера". Воно дозволяє генерувати одну нормально розподілену величину на основі однієї рівномірно розподіленої.

    Нормальний розподіл у природі та додатках

    Нормальний розподіл часто зустрічається у природі. Наприклад, наступні випадкові величини добре моделюються нормальним розподілом:

    • відхилення під час стрільби.
    • похибки вимірювань (проте похибки деяких вимірювальних приладів мають не нормальні розподіли).
    • деякі характеристики живих організмів у популяції.

    Таке широке розповсюдження цього розподілу пов'язане з тим, що він є нескінченно ділимим безперервним розподілом з кінцевою дисперсією. Тому до нього в межі наближаються деякі інші, наприклад, біноміальне та пуассонівське. Цим розподілом моделюється багато детермінованих фізичних процесів.

    Зв'язок з іншими розподілами

    • Нормальний розподіл є розподілом Пірсона типу XI.
    • Відношення пари незалежних стандартних нормально розподілених випадкових величин має розподіл  Коші. Тобто якщо випадкова величина X (\displaystyle X)є відношенням X = Y / Z (Displaystyle X = Y / Z)(де Y (\displaystyle Y)і Z (\displaystyle Z)- незалежні стандартні нормальні випадкові величини), то вона матиме розподіл Коші.
    • Якщо z 1 , … , z k (\displaystyle z_(1),\ldots ,z_(k))- Спільно незалежні стандартні нормальні випадкові величини, тобто z i ~ N (0 , 1) (\displaystyle z_(i)\sim N\left(0,1\right)), то випадкова величина x = z 1 2 + … + z k 2 (displaystyle x = z_ (1) ^ (2) + \ ldots + z_ (k)має розподіл хі-квадрат з k ступенями свободи.
    • Якщо випадкова величина X (\displaystyle X)підпорядкована логнормальному розподілу, то її натуральний логарифм має нормальний розподіл. Тобто якщо X ~ L o g N (μ , σ 2) (\displaystyle X\sim \mathrm (LogN) \left(\mu ,\sigma ^(2)\right)), то Y = ln ⁡ (X) ~ N (μ , σ 2) )). І навпаки, якщо Y ~ N (μ , σ 2) (\displaystyle Y\sim \mathrm (N) \left(\mu ,\sigma ^(2)\right)), то X = exp ⁡ (Y) ~ L o g N (μ , σ 2) (\displaystyle X = \ exp \ left (Y \ right) \ sim \ mathrm (LogN) \right)).
    • Відношення квадратів двох стандартних нормальних випадкових величин має
© rifma-k-slovu.ru, 2023
Rifmakslovu - Освітній портал