Пусть для случайной величины x возможные значения:

X1, x2, …, xk.

Измерения проводятся N раз, результат x i наблюдается N i раз, тогда

Среднее значение

(сумма результатов измерений)/(число всех измерений) =
.

При
с учетом (1.1)

получаем

. (1.5)

Для функции случайной величины

. (1.5а)

Среднее значение величины равно сумме произведений ее значений на вероятности этих значений .

При
получаем
и (1.5а) дает нормировку вероятностей

. (1.6)

Свойства среднего

Для постоянной
и независимых случайных величинx и y выполняется:

– постоянный множитель выносится из под знака усреднения;

– среднее от суммы/разности равно сумме/разности средних;

– среднее от произведения независимых величин равно произведению их средних.

Доказательство свойства 1

Из определения среднего (1.5а)

получаем

Доказательство свойства 2

Функция
, описывающая распределение вероятности дляслучайной величины x , одинакова для функций
и
, тогда из определения среднего (1.5а)

;

Доказательство свойства 3

Используем определение среднего и функцию распределения
независимых случайных величин x и y . Согласно теореме о независимых событиях их вероятности перемножаются

Тогда получаем

Основные определения

Отклонение от среднего случайной величины

Среднее отклонение от среднего случайной величины равно нулю

Среднее квадратичное величины

. (1.7)

Для средних значений случайных величин x и y выполняется неравенство Коши–Буняковского–Шварца

. (1.7а)

Из (1.7а) при
находим

. (1.7б)

Среднее квадратичное больше или равно квадрату среднего.

Дисперсия – среднее квадратичное отклонение от среднего

Из (1.7б) получаем
.

Флуктуация – корень квадратный из дисперсии

Относительная флуктуация

. (1.10)

Если x случайным образом изменяется с течением времени, то относительная флуктуация показывает долю времени, в течение которой система находится в состоянии с
.

Теорема: Относительная флуктуация аддитивной величины, характеризующей систему, уменьшается обратно пропорционально корню квадратному из числа независимых подсистем и для макроскопической системы она мала . Примером аддитивной величины (от лат. additivus – «прибавляемый») является энергия. Флуктуация энергии для макросистемы ничтожно мала, для микросистемы она существенна.

Доказательство

Аддитивная величина X для системы равна сумме значений x k для N независимых подсистем

По свойству 2 усреднения – среднее от суммы равно сумме средних

– пропорциональна числу подсистем.

Отклонение от среднего

дисперсия

При возведении в квадрат
и усреднении результата для перекрестных произведений учтено свойство 3 усреднения –среднее от произведения независимых величин равно произведению их средних

,
,

и использовано, что среднее отклонение от среднего равно нулю

Не равными нулю остаются квадраты величин. В результате флуктуация

Относительная флуктуация

(П.1.11)

уменьшается обратно пропорционально корню квадратному из числа независимых подсистем.

Производящая функция . Имеется случайная величина n , которая принимает дискретные значения в интервале
. Вероятность получения результатаn равна
. Определяем производящую функцию

. (П.1.14)

Если известна производящая функция, то распределение вероятности получаем из (П.1.14)

, (П.1.15)

где использовано

Условие нормировки (1.6)

требует выполнения

. (П.1.16)

Для получения средних значений случайной величины дифференцируем (П.1.14)

и находим

. (П.1.17)

Двукратное дифференцирование (П.1.14)

. (П.1.18)

Теорема о произведении производящих функций . Если происходят два независимых вида событий, которые описываются распределениями вероятностей с производящими функциями
и
, то распределение для суммы событий выражается произведением их производящих функций

Средние значения случайных величин

Предположим, что Х – дискретная случайная величина, которая в результате эксперимента принимала значения x 1 , x 2 ,…, x n с вероятностями p 1 , p 2 ,…, p n , . Тогда средним значением или математическим ожиданием величины X называется сумма , т.е. средневзвешенное значение величины Х, где весами служат вероятности p i .

Пример . Определить среднее значение ошибки регулирования e, если на основании большого числа опытов установлено, что вероятность ошибки р i равна:

e, %	0,1	0,15	0,2	0,25	0,3
р i	0,2	0,2	0,3	0,15	0,15

1. M [e] = 0,1×0,2 + 0,15×0,2 + 0,2×0,3 + 0,25×0,15 + 0,3×0,15 =

В том случае, если g(Х ) является функцией X (причем вероятность того, что X = x i равна p i ), то среднее значение функции определяется как

Предположим, что X – случайная величина с непрерывным распределением и характеризуется плотностью вероятности j(x ). Тогда вероятность того, что X заключена между x и x + Dх :

Величина X при этом приближенно принимает значение x . В пределе при Dx ® 0, можно предположить, что приращение Dx численно равно дифференциалу dx .

Произведя замену Dx = dх , получаем точную формулу для расчета среднего значения Х :

Аналогично для g(Х ):

Как правило, недостаточно бывает знать только среднее значение (математическое ожидание) случайной величины. Для оценки меры случайности величины (для оценки разброса конкретных значений X относительно математического ожидания M [X ]) вводится понятие дисперсии случайной величины. Дисперсия – среднее значение квадрата отклонения каждого конкретного значения X от математического ожидания. Чем больше дисперсия , тем больше случайности разброса величины от математического ожидания. Если случайная величина дискретная, то

Для непрерывной случайной величины дисперсию можно записать аналогично:

Дисперсия хорошо описывает разброс величины, но при этом есть один недостаток: размерность не соответствует размерности X . Чтобы избавиться от этого недостатка, часто в конкретных приложениях рассматривают не , а положительное значение , которое называется средним квадратическим отклонением .

1.3.2.1. Свойства математического ожидания

1. Математическое ожидание неслучайной величины равно самой этой величине M [C ] = C .

2. Неслучайный множитель С можно выносить за знак математического ожидания M [CX ] = CM [X ].

3. Математическое ожидание суммы случайных величин равно сумме математических ожиданий этих случайных величин.

4. Математическое ожидание произведения независимых случайных величин равно произведению математических ожиданий этих величин (условие независимости случайных величин).

1.3.2.2. Свойства дисперсии

1. Дисперсия неслучайной величины С равна нулю: D [C ]=0.

2. Дисперсия произведения неслучайного множителя С на случайную величину равна произведению С 2 на дисперсию случайной величины.

3. Дисперсия суммы независимых случайных величин X 1 и X 2 равна сумме дисперсий слагаемых

1.3.3. Моменты случайной величины

Пусть Х – непрерывная случайная величина. Если n – целое положительное число, а функция x n интегрируема на интервале (–¥; +¥), то среднее значение

n = 0, 1,…, n

называется начальным моментом порядка n случайной величины X .

Очевидно, что момент нулевого порядка

Каждая, отдельно взятая величина полностью определяется своей функцией распределения. Также, для решения практических задач хватает знать несколько числовых характеристик, благодаря которым появляется возможность представить основные особенности случайной величины в краткой форме.

К таким величинам относят в первую очередь математическое ожидание и дисперсия .

Математическое ожидание — среднее значение случайной величины в теории вероятностей. Обозначается как .

Самым простым способом математическое ожидание случайной величины Х(w) , находят как интеграл Лебега по отношению к вероятностной мере Р исходном вероятностном пространстве

Еще найти математическое ожидание величины можно как интеграл Лебега от х по распределению вероятностей Р Х величины X :

где - множество всех возможных значений X .

Математическое ожидание функций от случайной величины X находится через распределение Р Х . Например , если X - случайная величина со значениями в и f(x) - однозначная борелевская функция Х , то:

Если F(x) - функция распределения X , то математическое ожидание представимо интегралом Лебега - Стилтьеса (или Римана - Стилтьеса):

при этом интегрируемость X в смысле (* ) соответствует конечности интеграла

В конкретных случаях, если X имеет дискретное распределение с вероятными значениями х k , k=1, 2 , . , и вероятностями , то

если X имеет абсолютно непрерывное распределение с плотностью вероятности р(х) , то

при этом существование математического ожидания равносильно абсолютной сходимости соответствующего ряда или интеграла.

Свойства математического ожидания случайной величины.

Математическое ожидание постоянной величины равно этой величине:

C - постоянная;

M=C.M[X]

Математическое ожидание суммы случайно взятых величин равно сумме их математических ожиданий:

Математическое ожидание произведения независимых случайно взятых величин = произведению их математических ожиданий:

M=M[X]+M[Y]

если X и Y независимы.

если сходится ряд:

Алгоритм вычисления математического ожидания.

Свойства дискретных случайных величин: все их значения можно перенумеровать натуральными числами; каждому значению приравнять отличную от нуля вероятность.

1. По очереди перемножаем пары: x i на p i .

2. Складываем произведение каждой пары x i p i .

Напрмер , для n = 4 :

Функция распределения дискретной случайной величины ступенчатая, она возрастает скачком в тех точках, вероятности которых имеют положительный знак.

Пример: Найти математическое ожидание по формуле.

– количество мальчиков среди 10 новорождённых.

Совершенно понятно, что это количество заранее не известно, и в очередном десятке родившихся детей может оказаться:

Либо мальчиков – один и только один из перечисленных вариантов.

И, дабы соблюсти форму, немного физкультуры:

– дальность прыжка в длину (в некоторых единицах) .

Её не в состоянии предугадать даже мастер спорта:)

Тем не менее, ваши гипотезы?

2) Непрерывная случайная величина – принимает все числовые значения из некоторого конечного или бесконечного промежутка.

Примечание : в учебной литературе популярны аббревиатуры ДСВ и НСВ

Сначала разберём дискретную случайную величину, затем – непрерывную .

Закон распределения дискретной случайной величины

– этосоответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон записывают таблицей:

Довольно часто встречается термин ряд распределения , но в некоторых ситуациях он звучит двусмысленно, и поэтому я буду придерживаться «закона».

А теперь очень важный момент : поскольку случайная величина обязательно примет одно из значений , то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице:

или, если записать свёрнуто:

Так, например, закон распределения вероятностей выпавших на кубике очков имеет следующий вид:

Без комментариев.

Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем иллюзию – они могут быть любыми:

Пример 1

Некоторая игра имеет следующий закон распределения выигрыша:

…наверное, вы давно мечтали о таких задачах:) Открою секрет – я тоже. В особенности после того, как завершил работу над теорией поля .

Решение : так как случайная величина может принять только одно из трёх значений, то соответствующие события образуют полную группу , а значит, сумма их вероятностей равна единице:

Разоблачаем «партизана»:

– таким образом, вероятность выигрыша условных единиц составляет 0,4.

Контроль: , в чём и требовалось убедиться.

Ответ :

Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности , теоремы умножения / сложения вероятностей событий и другие фишки тервера :

Пример 2

В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по 100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.

Решение : как вы заметили, значения случайной величины принято располагать в порядке их возрастания . Поэтому мы начинаем с самого маленького выигрыша, и именно рублей.

Всего таковых билетов 50 – 12 = 38, и по классическому определению :
– вероятность того, что наудачу извлечённый билет окажется безвыигрышным.

С остальными случаями всё просто. Вероятность выигрыша рублей составляет:

Проверка: – и это особенно приятный момент таких заданий!

Ответ : искомый закон распределения выигрыша:

Следующее задание для самостоятельного решения:

Пример 3

Вероятность того, что стрелок поразит мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.

…я знал, что вы по нему соскучились:) Вспоминаем теоремы умножения и сложения . Решение и ответ в конце урока.

Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь некоторые её числовые характеристики .

Математическое ожидание дискретной случайной величины

Говоря простым языком, это среднеожидаемое значение при многократном повторении испытаний. Пусть случайная величина принимает значения с вероятностями соответственно. Тогда математическое ожидание данной случайной величины равно сумме произведений всех её значений на соответствующие вероятности:

или в свёрнутом виде:

Вычислим, например, математическое ожидание случайной величины – количества выпавших на игральном кубике очков:

Теперь вспомним нашу гипотетическую игру:

Возникает вопрос: а выгодно ли вообще играть в эту игру? …у кого какие впечатления? Так ведь «навскидку» и не скажешь! Но на этот вопрос можно легко ответить, вычислив математическое ожидание, по сути – средневзвешенный по вероятностям выигрыш:

Таким образом, математическое ожидание данной игры проигрышно .

Не верь впечатлениям – верь цифрам!

Да, здесь можно выиграть 10 и даже 20-30 раз подряд, но на длинной дистанции нас ждёт неминуемое разорение. И я бы не советовал вам играть в такие игры:) Ну, может, только ради развлечения .

Из всего вышесказанного следует, что математическое ожидание – это уже НЕ СЛУЧАЙНАЯ величина.

Творческое задание для самостоятельного исследования:

Пример 4

Мистер Х играет в европейскую рулетку по следующей системе: постоянно ставит 100 рублей на «красное». Составить закон распределения случайной величины – его выигрыша. Вычислить математическое ожидание выигрыша и округлить его до копеек. Сколько в среднем проигрывает игрок с каждой поставленной сотни?

Справка : европейская рулетка содержит 18 красных, 18 чёрных и 1 зелёный сектор («зеро»). В случае выпадения «красного» игроку выплачивается удвоенная ставка, в противном случае она уходит в доход казино

Существует много других систем игры в рулетку, для которых можно составить свои таблицы вероятностей. Но это тот случай, когда нам не нужны никакие законы распределения и таблицы, ибо доподлинно установлено, что математическое ожидание игрока будет точно таким же. От системы к системе меняется лишь

Функция распределения содержит полную информацию о случайной величине. На практике функцию распределения не всегда можно установить; иногда такого исчерпывающего знания и не требуется. Частичную информацию о случайной величине дают числовые характеристики, которые в зависимости от рода информации делятся на следующие группы.
1. Характеристики положения случайной величины на числовой оси (мода Мo , медиана Мe , математическое ожидание М(Х )).
2. Характеристики разброса случайной величины около среднего значения (дисперсия D(X ), среднее квадратическое отклонение σ(х )).
3. Характеристики формы кривой y = φ(x ) (асимметрия As , эксцесс Ех ).
Рассмотрим подробнее каждую из указанных характеристик.
Математическое ожидание случайной величины Х указывает некоторое среднее значение, около которого группируются все возможные значения Х . Для дискретной случайной величины, которая может принимать лишь конечное число возможных значений, математическим ожиданием называют сумму произведений всех возможных значений случайной величины на вероятность этих значений:
. (2.4)
Для непрерывной случайной величины Х , имеющей заданную плотность распределения φ(x ) математическим ожиданием называется следующий интеграл:
. (2.5)
Здесь предполагается, что несобственный интеграл сходится абсолютно, т.е. существует.
Свойства математического ожидания:
1. М(С ) = C , где С = const ;
2. M(C ∙Х) = С ∙М(Х );
3. М(Х ± Y) = М(Х ) ± М(Y ), где X и Y – любые случайные величины;
4. М(Х ∙Y )=М(Х )∙М(Y ), где X и Y – независимые случайные величины.
Две случайные величины называются независимыми , если закон распределения одной из них не зависит от того, какие возможные значения приняла другая величина.
Модой дискретной случайной величины, обозначаемой Мо , называется ее наиболее вероятное значение (рис. 2.3), а модой непрерывной случайной величины – значение, при котором плотность вероятности максимальна (рис. 2.4).

Рис. 2.3 Рис. 2.4
Медианой непрерывной случайной величины Х называется такое ее значение Ме, для которого одинаково вероятно, окажется ли случайная величина меньше или больше Ме , т.е.
Р(Х < Ме) = Р(X > Ме )
Из определения медианы следует, что Р(Х <Ме ) = 0,5, т.е. F (Ме ) = 0,5. Геометрически медиану можно истолковывать как абсциссу, в которой ордината φ(x ) делит пополам площадь, ограниченную кривой распределения (рис. 2.5). В случае симметричного распределения медиана совпадает с модой и математическим ожиданием (рис. 2.6).

Рис. 2.5 Рис. 2.6

Дисперсия.

Диспе́рсия случа́йной величины́ - мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Обозначается D [X ] в русской литературе и (англ. variance ) в зарубежной. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии, равный , называется среднеквадрати́чным отклоне́нием,станда́ртным отклоне́нием или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах, что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.

Из неравенства Чебышёва следует, что случайная величина удаляется от её математического ожидания на более чем k стандартных отклонений с вероятностью менее 1/k ². Так, например, как минимум в 75 % случаев случайная величина удалена от её среднего не более чем на два стандартных отклонения, а в примерно 89 % - не более чем на три.

Дисперсией случайной величины называется математическое ожидание квадрата ее отклонения от математического ожидания
D(X ) = M(X –М(Х )) 2 .
Дисперсию случайной величины Х удобно вычислять по формуле:
а) для дискретной величины
; (2.6)
б) для непрерывной случайной величины
j(х )dx – 2 . (2.7)
Дисперсия обладает следующими свойствами:
1. D(C ) = 0, где С = const ;
2. D(C ×X ) = C 2 ∙D(X );
3. D (X ±Y ) = D (X ) + D (Y ), если X и Y независимые случайные величины.
Средним квадратическим отклонением случайной величины Х называется арифметический корень из дисперсии, т.е.
σ(X ) = .
Заметим, что размерность σ(х ) совпадает с размерностью самой случайной величины Х , поэтому среднее квадратическое отклонение более удобно для характеристики рассеяния.
Обобщением основных числовых характеристик случайных величин является понятие моментов случайной величины.
Начальным моментом k-го порядка α k случайной величины Х называется математическое ожидание величины Х k , т.е. α k = М(Х k ).
Начальный момент первого порядка – это математическое ожидание случайной величины.
Центральным моментом k-го порядка μ k случайной величины Х называется математическое ожидание величины (Х –М(Х )) k , т.е. μ k = М(Х –М(Х )) k .
Центральный момент второго порядка – это дисперсия случайной величины.
Для дискретной случайной величины начальный момент выражается суммой α k = , а центральный – суммой μ k = где р i = p(X = x i ). Для начального и центрального моментов непрерывной случайной величины можно получить следующие равенства:
α k = , μ k = ,
где φ(x ) – плотность распределения случайной величины Х.
Величина As = μ 3 / σ 3 называется коэффициентом асимметрии .
Если коэффициент асимметрии отрицательный, то это говорит о большом влиянии на величину m 3 отрицательных отклонений. В этом случае кривая распределения (рис.2.7) более полога слева от М(Х ). Если коэффициент As положительный, а значит, преобладает влияние положительных отклонений, то кривая распределения (рис.2.7) более полога справа. Практически определяют знак асимметрии по расположению кривой распределения относительно моды (точки максимума дифференциальной функции).

Рис. 2.7
Эксцессом Еk называется величина
Еk = μ 4 / σ 4 – 3.

Вопрос 24. Корреляция

Корреля́ция (корреляционная зависимость ) - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение , либо коэффициент корреляции (или ) . В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической .

Впервые в научный оборот термин «корреляция» ввёл французский палеонтолог Жорж Кювье в XVIII веке. Он разработал «закон корреляции» частей и органов живых существ, с помощью которого можно восстановить облик ископаемого животного, имея в распоряжении лишь часть его останков. В статистике слово «корреляция» первым стал использовать английский биолог и статистик Фрэнсис Гальтон в конце XIX века.

Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными (возможна также ситуация отсутствия статистической взаимосвязи - например, для независимых случайных величин). Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция - корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции может быть отрицательным; положительная корреляция в таких условиях - корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции может быть положительным.