Определение функции распределения

Пусть $X$ – случайная величина, а $x$ – вероятность распределения этой случайной величины .

Определение 1

Функцией распределения называется функция $F(x)$ удовлетворяющая условию $F\left(x\right)=P(X

Также иначе функцию распределения иногда называются интегральной функцией распределения или интегральным законом распределения.

В общем виде график функции распределения представляет собой график неубывающей функции с областью значений, принадлежащей отрезку $\left$ (причем 0 и 1 обязательно входят в область значений). При этом функция может, как иметь, так и не иметь скачков функции (рис. 1)

Рисунок 1. Пример графика функции распределения

Функция распределения дискретной случайной величины

Пусть случайная величина $X$ является дискретной. И пусть для нее дан ряд её распределения. Для такой величины функцию распределения вероятностей можно записать в следующем виде:

Функция распределения непрерывной случайной величины

Пусть случайная величина $X$ теперь является непрерывной.

График функции распределения такой случайной величины всегда представляет собой неубывающую непрерывную функцию (рис. 3).

Рассмотрим теперь случай, где случайная величина $X$ является смешанной.

График функции распределения такой случайной величины всегда представляет собой неубывающую функцию, которая имеет минимальное значение в 0, максимальное значение в 1, но которая не на всей области определения является непрерывной функцией (то есть имеет скачки в отдельных точках) (рис. 4).

Рисунок 4. Функция распределения смешанной случайной величины

Примеры задач на нахождение функции распределения

Пример 1

Приведен ряд распределений появления события $A$ в трех опытах

Рисунок 5.

Найти функцию распределения вероятностей и построить её график.

Решение.

Так как случайная величина является дискретной, то мы можем пользоваться формулой $\ F\left(x\right)=\sum\limits_{x_i

При $x>3$, $F\left(x\right)=0,2+0,1+0,3+0,4=1$;

Отсюда получаем следующую функцию распределения вероятностей:

Рисунок 6.

Построим ее график:

Рисунок 7.

Пример 2

Проводится один опыт, в котором событие $A$ может, как произойти, так и не произойти. Вероятность того, что данное событие произойдет равно $0,6$. Найти и построить функцию распределения случайной величины.

Решение.

Так как вероятность того, что событие $A$ произойдет равно $0,6$, то вероятность того, что данное событие не произойдет равно $1-0,6=0,4$.

Построим для начала ряд распределения данной случайной величины:

Рисунок 8.

Так как случайная величина является дискретной, найдем функцию распределения по аналогии с задачей 1:

При $x\le 0$, $F\left(x\right)=0$;

При $x>1$, $F\left(x\right)=0,4+0,6=1$;

Таким образом, получаем следующую функцию распределения:

Рисунок 9.

Построим ее график:

Рисунок 10.

3. Функция распределения является неубывающей : если , то

4. Функция распределения непрерывна слева : для любого .

Примечание . Последнее свойство обозначает, какие значения принимает функция распределения в точках разрыва. Иногда определение функции распределения формулируют с использованием нестрогого неравенства: . В этом случае непрерывность слева заменяется на непрерывность справа: при . Никакие содержательные свойства функции распределения при этом не меняются, поэтому данный вопрос является лишь терминологическим.

Свойства 1-4 являются характеристическими, т.е. любая функция , удовлетворяющая этим свойствам, является функцией распределения некоторой случайной величины.

Функция распределения задает распределение вероятностей случайной величины однозначно. Фактически, она является универсальным и наиболее наглядным способом описания этого распределения.

Чем сильнее функция распределения растет на заданном интервале числовой оси, тем выше вероятность попадания случайной величины в этот интервал. Если вероятность попадания в интервал равна нулю, то функция распределения на нем постоянна.

В частности, вероятность того, что случайная величина примет заданное значение , равна скачку функции распределения в данной точке:

Если функция распределения непрерывна в точке , то вероятность принять данное значение для случайной величины равна нулю. В частности, если функция распределения непрерывна на всей числовой оси (при этом и соответствующее распределение называется непрерывным ), то вероятность принять любое заданное значение равна нулю.

Из определения функции распределения вытекает, что вероятность попадания случайной величины в интервал, замкнутый слева и открытый справа, равна:

С помощью данной формулы и указанного выше способа нахождения вероятности попадания в любую заданную точку, легко определяются вероятности попадания случайной величины в интервалы других типов: , и . Далее, по теореме о продолжении меры, можно однозначно продолжить меру на все борелевские множества числовой прямой . Для того, чтобы применить эту теорему, требуется показать, что таким образом определенная на интервалах мера является на них сигма-аддитивной; при доказательстве этого в точности используются свойства 1-4 (в частности, свойство непрерывности слева 4, поэтому отбросить его нельзя).

Генерация случайной величины, имеющей заданное распределение

Рассмотрим случайную величину , имеющую функцию распределения . Предположим, что непрерывна . Рассмотрим случайную величину

Легко показать, что тогда будет иметь равномерное распределение на отрезке .

Чтобы найти функции распределения случайных величин и их переменных, необходимо изучить все особенности данной области знаний. Существует несколько различных методов для нахождения рассматриваемых значений, включая изменение переменной и генерирование момента. Распределение - такое понятие, в основу которого легли такие элементы, как дисперсия, вариации. Однако они характеризуют только степень размаха рассеяния.

Более важными функциями случайных величин являются те, которые связаны и независимы, и одинаково распределены. Например, если X1 - вес случайно выбранного индивидуума из популяции самцов, X2 - вес другого, ..., а Xn - вес еще одного человека из мужского населения, тогда, необходимо узнать, как случайная функция X распределяется. В этом случае применима классическая теорема, называемая центральной предельной. Она позволяет показать, что при больших n функция следует стандартным распределениям.

Функции одной случайной переменной

Центральная предельная теорема предназначена для аппроксимации дискретных рассматриваемых значений, таких как биномиальное и Пуассона. Функции распределения случайных величин, рассматриваются, в первую очередь, на простых значениях одной переменной. Например, если X является непрерывной случайной величиной, имеющей собственное распределение вероятности. В данном случае исследуется, как найти функцию плотности Y, используя два разных подхода, а именно метод функции распределения и изменения переменной. Сначала рассматриваются только взаимно однозначные значения. Затем необходимо модифицировать технику изменения переменной, чтобы найти ее вероятность. Наконец, нужно узнать, как кумулятивного распределения может помочь моделировать случайные числа, которые следуют за определенными последовательными схемами.

Методика распределения рассматриваемых значений

Метод функции распределения вероятностей случайной величины применим для того, чтобы найти ее плотность. При использовании этого способа вычисляется кумулятивное значение. Затем, дифференцируя его, можно получить плотность вероятности. Теперь, при наличии метода функции распределения, можно рассмотреть еще несколько примеров. Пусть X - непрерывная случайная величина с определенной плотностью вероятности.

Какова функция плотности вероятности от x2? Если посмотреть или построить график функции (сверху и справа) у = х2, можно отметить, что она является возрастающей X и 0

В последнем примере большую осторожность использовали для индексирования кумулятивных функций и плотности вероятности либо с помощью X, либо с Y, чтобы указать, к какой случайной переменной они принадлежали. Например, при нахождении кумулятивной функции распределения Y получили X. Если необходимо найти случайную величину X и ее плотность, то ее просто нужно дифференцировать.

Техника смены переменных

Пусть X - непрерывная случайная величина заданная функцией распределения с общим знаменателем f (x). В этом случае, если поместить значение y в X = v (Y), то получится значение x, например v (y). Теперь, нужно получить функцию распределения непрерывной случайной величины Y. Где первое и второе равенство имеет место из определения кумулятивной Y. Третье равенство выполняется потому, что части функции, для которой u (X) ≤ y, также верно, что X ≤ v (Y). И последнее выполняется для определения вероятности в непрерывной случайной величине X. Теперь нужно взять производную от FY (y), кумулятивной функции распределения Y, чтобы получить плотность вероятности Y.

Обобщение для функции уменьшения

Пусть X - непрерывная случайная величина с общим f (x), определенная над c1

Для решения этого вопроса можно собирать количественные данные и использовать эмпирическую кумулятивную функцию распределения. Обладая этой информацией и апеллируя ею, нужно комбинировать образцы средств, стандартные отклонения, медиаданные и так далее.

Аналогично даже довольно простая вероятностная модель может иметь огромное количество результатов. Например, если перевернуть монету 332 раза. Тогда число получаемых результатов от переворотов больше, чем у google (10100) - число, но не менее 100 квинтиллионов раз выше элементарных частиц в известной вселенной. Не интересен анализ, который дает ответ на каждый возможный результат. Потребуется более простая концепция, такая как количество головок или самый длинный ход хвостов. Чтобы сосредоточить внимание на вопросах, представляющих интерес, принимается определенный результат. Определение в данном случае следующее: случайная величина является вещественной функцией с вероятностным пространством.

Диапазон S случайной величины иногда называют пространством состояний. Таким образом, если X - рассматриваемое значение, то так N = X2, exp ↵X, X2 + 1, tan2 X, bXc и так далее. Последнее из них, округляя X до ближайшего целого числа, называют функцией пола.

Функции распределения

Как только определена интересующая функция распределения случайной величины х, вопрос обычно становится следующим: «Каковы шансы, что X попадает в какое-то подмножество значений B?». Например, B = {нечетные числа}, B = {больше 1} или B = {между 2 и 7}, чтобы указать эти результаты, которые имеют X, значение случайной величины, в подмножестве А. Таким образом, в приведенном выше примере можно описать события следующим образом.

{X - нечетное число}, {X больше 1} = {X> 1}, {X находится между 2 и 7} = {2

Случайные переменные и функции распределения

Таким образом, можно вычислить вероятность того, что функция распределения случайной величины x примет значения в интервале путем вычитания. Необходимо подумать о включении или исключении конечных точек.

Будем называть случайную переменную дискретной, если она имеет конечное или счетное бесконечное пространство состояний. Таким образом, X - число головок на трех независимых флипсах смещенной монеты, которая поднимается с вероятностью p. Нужно найти кумулятивную функцию распределения дискретной случайной величины FX для X. Пусть X - количество пиков в коллекции из трех карт. То Y = X3 через FX. FX начинается с 0, заканчивается на 1 и не уменьшается с увеличением значений x. Кумулятивная FX функция распределения дискретной случайной величины X является постоянной, за исключением прыжков. При скачке FX является непрерывной. Доказать утверждение о правильной непрерывности функции распределения из свойства вероятности можно с помощью определения. Звучит оно так: постоянная случайная величина имеет кумулятивную FX, которая дифференцируема.

Чтобы показать, как это может произойти, можно привести пример: мишень с единичным радиусом. Предположительно. дротик равномерно распределяется на указанную область. Для некоторого λ> 0. Таким образом, функции распределения непрерывных случайных величин плавно увеличиваются. FX обладает свойствами функции распределения.

Человек ждет автобуса на остановке, пока тот не прибудет. Решив для себя, что откажется, когда ожидание достигнет 20 минут. Здесь необходимо найти кумулятивную функцию распределения для T. Время, когда человек еще будет находиться на автовокзале или не уйдет. Несмотря на то, что кумулятивная функция распределения определена для каждой случайной величины. Все равно достаточно часто будут использоваться другие характеристики: масса для дискретной переменной и функция плотности распределения случайной величины. Обычно выводится значение через одно из этих двух значений.

Массовые функции

Эти значения рассматриваются следующими свойствами, которые имеют общий (массовый характер). Первое основано на том, что вероятности не отрицательны. Второе следует из наблюдения, что набор для всех x=2S, пространство состояний для X, образует разбиение вероятностной свободы X. Пример: броски необъективной монеты, результаты которой независимы. Можно продолжать выполнять определенные действия, пока не получится бросок голов. Пусть X обозначает случайную величину, которая дает количество хвостов перед первой головой. А p обозначает вероятность в любом заданном действии.

Итак, массовая функция вероятности имеет следующие характерные признаки. Поскольку члены образуют численную последовательность, X называется геометрической случайной величиной. Геометрическая схема c, cr, cr2,. , crn имеет сумму. И, следовательно, sn имеет предел при n 1. В этом случае бесконечная сумма является пределом.

Функция массы выше образует геометрическую последовательность с отношением. Следовательно, натуральных чисел a и b. Разность значений в функции распределения равна значению массовой функции.

Рассматриваемые значения плотности имеют определение: X - случайная величина, распределение FX которой имеет производную. FX, удовлетворяющая Z xFX (x) = fX (t) dt-1, называется функцией плотности вероятности. А X называется непрерывной случайной величиной. В основной теореме исчисления функция плотности является производной распределения. Можно вычислить вероятности путем вычисления определенных интегралов.

Поскольку собираются данные по нескольким наблюдениям, то должно рассматриваться более одной случайной величины за раз, чтобы моделировать экспериментальные процедуры. Следовательно, множество этих значений и их совместное распределение для двух переменных X1 и X2 означает просмотр событий. Для дискретных случайных величин определяются совместные вероятностные массовые функции. Для непрерывных рассматриваются fX1, X2, где совместная плотность вероятности удовлетворяется.

Независимые случайные переменные

Две случайные величины X1 и X2 независимы, если любые два связанных с ними события такие же. В словах вероятность того, что два события {X1 2 B1} и {X2 2 B2} происходят одновременно, y равно произведению переменных указанных выше, что каждая из них происходит индивидуально. Для независимых дискретных случайных величин имеется совместная вероятностная массовая функция, которая является произведением предельного объема ионов. Для непрерывных случайных величин являющихся независимыми, совместная функция плотности вероятности - произведение значений предельной плотности. В заключение рассматриваются n независимые наблюдения x1, x2,. , xn, возникающие из неизвестной плотности или массовой функции f. Например, неизвестный параметр в функциях для экспоненциальной случайной величины, описывающей время ожидания автобуса.

Имитация случайных переменных

Основная цель этой теоретической области - предоставить инструменты, необходимые для разработки умозаключительных процедур, основанных на обоснованных принципах статистической науки. Таким образом, одним из очень важных вариантов применения программного обеспечения является способность генерировать псевдоданные для имитации фактический информации. Это дает возможность тестировать и совершенствовать методы анализа перед необходимостью использования их в реальных базах. Это требуется для того, чтобы исследовали свойства данных посредством моделирования. Для многих часто используемых семейств случайных величин R предоставляет команды для их создания. Для других обстоятельств понадобятся методы моделирования последовательности независимых случайных величин, которые имеют общее распределение.

Дискретные случайные переменные и образец Command. Команда sample используется для создания простых и стратифицированных случайных выборок. В результате, если вводится последовательность x, sample (x, 40) выбирает 40 записей из x таким образом, что все варианты размера 40 имеют одинаковую вероятность. Это использует команду R по умолчанию для выборки без замены. Можно использовать также для моделирования дискретных случайных величин. Для этого нужно предоставить пространство состояний в векторе x и массовой функции f. Вызов для replace = TRUE указывает, что сэмплирование происходит с заменой. Затем, чтобы дать образец из n независимых случайных величин, имеющих общую массовую функцию f, используется образец (x, n, replace = TRUE, prob = f).

Определено, что 1 является наименьшим представленным значением, а 4 является наибольшим из всех. Если команда prob = f опущена, то образец будет выбирать равномерно из значений в векторе x. Проверить симуляцию против массовой функции, которая генерировала данные, можно обратив внимание на знак двойного равенства, ==. И пересчитав наблюдения, которые принимают каждое возможное значение для x. Можно сделать таблицу. Повторить это для 1000 и сравнить моделирование с соответствующей функцией массы.

Иллюстрирование трансформации вероятности

Сначала смоделировать однородные функции распределения случайных величин u1, u2,. , un на интервале . Около 10 % чисел должно находиться в пределах . Это соответствует 10 % симуляций на интервале для случайной величины с показанной функцией распределения FX. Точно так же около 10 % случайных чисел должно находиться в интервале . Это соответствует 10 % симуляций на интервале случайной величины с функцией распределения FX. Эти значения на x ось может быть получена из взятия обратной от FX. Если X - непрерывная случайная величина с плотностью fX, положительной всюду в своей области, то функция распределения строго возрастает. В этом случае FX имеет обратную функцию FX-1, известную как функция квантиля. FX (x) u только тогда, когда x FX-1 (u). Преобразование вероятности следует из анализа случайной переменной U = FX (X).

FX имеет диапазон от 0 до 1. Он не может принимать значения ниже 0 или выше 1. Для значений u между 0 и 1. Если можно моделировать U, то необходимо имитировать случайную величину с распределением FX через функцию квантиля. Взять производную, чтобы увидеть, что плотность u варьируется в пределах 1. Поскольку случайная величина U имеет постоянную плотность по интервалу своих возможных значений, она называется равномерной на отрезке . Он моделируется в R с помощью команды runif. Идентичность называется вероятностным преобразованием. Видно, как оно работает в примере с дротильной доской. X между 0 и 1, функция распределения u = FX (x) = x2, и, следовательно, функция квантиля x = FX-1 (u). Можно моделировать независимые наблюдения расстояния от центра панели дротика, и создавая при этом равномерные случайные величины U1, U2,. , Un. Функция распределения и эмпирическая основаны на 100 симуляциях распределения дартс-доски. Для экспоненциальной случайной величины, предположительно u = FX (x) = 1 - exp (- x), и, следовательно, x = - 1 ln (1 - u). Иногда логика состоит из эквивалентных утверждений. В этом случае нужно объединить две части аргумента. Тождество с пересечением аналогично для всех 2 {S i i} S, вместо некоторого значения. Объединение Ci равно пространству состояний S и каждая пара взаимно исключена. Поскольку Bi - разбита на три аксиомы. Каждая проверка основана на соответствующей вероятности P. Для любого подмножества. Используя тождество, чтобы убедиться, что ответ не зависит от того, включены ли конечные точки интервала.

Экспоненциальная функция и ее переменные

Для каждого результата во всех событиях в конечном счете используется второе свойство непрерывности вероятностей, которое считается аксиоматическим. Закон распределения функции случайной величины здесь показывает, что каждой свое решение и ответ.

Функция распределения вероятностей случайной величины и ее свойства.

Рассмотрим функцию F(х) , определенную на всей числовой оси следующим образом: для каждого х значение F(х) равно вероятности того, что дискретная случайная величина примет значение, меньшее х , т. е.

(18)

Эта функция называется функцией распределения вероятностей , или кратко, функцией распределения .

Пример 1. Найти функцию распределения случайной величины , приведенной в примере 1, п. 1.

Решение: Ясно, что если , то F(x)=0 , так как не принимает значений, меньших единицы. Если , то ; если , то . Но событие <3 в данном случае является суммой двух несовместных событий: =1 и =2. Следовательно,

Итак для имеем F(x)=1/3 . Аналогично вычисляются значения функции в промежудках , и . Наконец, если x>6 то F(x)=1 , так как в этом случае любое возможное значение (1, 2, 3, 4, 5, 6) меньше, чем x . График функции F(x) изображен на рис. 4.

Пример 2. Найти функцию распределения случайной величины , приведенной в примере 2, п. 1.

Решение: Очевидно, что

График F(x) изображен на рис. 5.

Зная функцию распределения F(x) , легко найти вероятность того, что случайная величина удовлетворяет неравенствам .
Рассмотрим событие, заключающееся в том, что случайняя величина примет значение, меньшее . Это событие распадается на сумму двух несовместных событий: 1) случайная величина принимает значения, меньшие , т.е. ; 2) случайная величина принимает значения, удовлетворяющие неравенствам . Используя аксиому сложения, получаем

Но по определению функции распределения F(x) [см. формулу (18)], имеем , ; cледовательно,

(19)

Таким образом, вероятность попадания дискретной случайной величины в интервал равна приращению функции распределения на этом интервале.

Рассмотрим основные свойства функции распределения.
1°. Функция распределения является неубывающей.
В самом деле, пусть < . Так как вероятность любого события неотрицательна, то . Поэтому из формулы (19) следует, что , т.е. .

2°. Значения функции распределения удовлетворяют неравенствам .
Это свойство вытекает из того, что F(x) определяется как вероятность [см. формулу (18)]. Ясно, что * и .

3°. Вероятность того, что дискретная случайная величина примет одно из возможных значений xi, равна скачку функции распределения в точке xi .
Действительно, пусть xi - значение, принимаемое дискретной случайной величиной, и . Полагая в формуле (19) , , получим

Т.е. значение p(xi) равно скачку функции ** xi . Это свойство наглядно иллюстрируется на рис. 4 и рис. 5.

* Здесь и в дальнейшем введены обозначения: , .
** Можно показать, что F(xi)=F(xi-0) , т.е. что функция F(x) непрерывна слева в точке xi .

3. Непрерывные случайные величины.

Кроме дискретных случайных величин, возможные значения которых образуют конечную или бесконечную последовательность чисел, не заполняющих сплошь никакого интервала, часто встречаются случайные величины, возможные значения которых образуют некоторый интервал. Примером такой случайной величины может служить отклонение от номинала некоторого размера детали при правильно налаженном технологическом процессе. Такого рода, случайные величины не могут быть заданы с помощью закона распределения вероятностей р(х) . Однако их можно задать с помощью функции распределения вероятностей F(х) . Эта функция определяется точно так же, как и в случае дискретной случайной величины:

Таким образом, и здесь функция F(х) определена на всей числовой оси, и ее значение в точке х равно вероятности того, что случайная величина примет значение, меньшее чем х .
Формула (19) и свойства 1° и 2° справедливы для функции распределения любой случайной величины. Доказательство проводится аналогично случаю дискретной величины.
Случайная величина называется непрерывной , если для нее существует неотрицательная кусочно-непрерывная функция* , удовлетворяющая для любых значений x равенству

Исходя из геометрического смысла интеграла как площади, можно сказать, что вероятность выполнения неравенств равна площади криволинейной трапеции с основанием , ограниченной сверху кривой (рис. 6).

Так как , а на основании формулы (22)

Заметим, что для непрерывной случайной величины функция распределения F(х) непрерывна в любой точке х , где функция непрерывна. Это следует из того, что F(х) в этих точках дифференцируема.
На основании формулы (23), полагая x 1 =x , , имеем

В силу непрерывности функции F(х) получим, что

Следовательно

Таким образом, вероятность того, что непрерывная случайная величина может принять любое отдельное значение х, равна нулю .
Отсюда следует, что события, заключающиеся в выполнении каждого из неравенств

Имеют одинаковую вероятность, т.е.

В самом деле, например,

Так как

Замечание. Как мы знаем, если событие невозможно, то вероятность его наступления равна нулю. При классическом определении вероятности, когда число исходов испытания конечно, имеет место и обратное предложение: если вероятность события равна нулю, то событие невозможно, так как в этом случае ему не благоприятствует ни один из исходов испытания. В случае непрерывной случайной величины число возможных ее значений бесконечно. Вероятность того, что эта величина примет какое-либо конкретное значение x 1 как мы видели, равна нулю. Однако отсюда не следует, что это событие невозможно, так как в результате испытания случайная величина может, в частности, принять значение x 1 . Поэтому в случае непрерывной случайной величины имеет смысл говорить о вероятности попадания случайной величины в интервал, а не о вероятности того, что она примет какое-то конкретное значение.
Так, например, при изготовлении валика нас не интересует вероятность того, что его диаметр будет равен номиналу. Для нас важна вероятность того, что диаметр валика не выходит из поля допуска.