Эконометрические модели




НазваниеЭконометрические модели
страница2/4
Дата публикации28.07.2013
Размер0.79 Mb.
ТипУчебно-методическое пособие
zadocs.ru > Информатика > Учебно-методическое пособие
1   2   3   4
Тема 2. Основные понятия теории вероятностей и математической статистики.


    1. Элементы теории вероятностей и математической статистики.

2.2. Функция распределения случайной величины. Непрерывные случайные величины.

2.3. Основные понятия проверки статистических гипотез.

2.4. Схема проверки статистических гипотез.

2.1. Элементы теории вероятностей и математической статистики.
В этой главе приводится краткий обзор основных понятий и результатов теории вероятностей и математической статистики, которые используются в курсе эконометрики. Цель этой главы — напомнить читателю некоторые сведения [4, 12], но для основательного усвоения материала нужно самостоятельно поработать с указанными источниками.
^ 2.1.1. Случайные величины и их числовые характеристики
Вероятностью Р(А) события А называется численная мера степени объективной возможности появления этого события.

Согласно классическому определению, вероятность события А равна отношению числа случаев m, благоприятствующих ему, к общему числу случаев n, т.е. Р(А) = m/n. При определенных условиях в качестве оценки вероятности события Р(А) может быть использована статистическая вероятность Р*(А), т.е. относительная частота (частость) W(A) появления события А в n произведенных испытаниях.

Одним из важнейших понятий теории вероятностей является понятие случайной величины.

Под случайной величиной понимается переменная, которая в результате испытания в зависимости от случая принимает одно из возможного множества своих значений (какое именно – заранее не известно).

Более строго случайная величина X определяется как функция, заданная на множестве элементарных исходов (или в пространстве элементарных событий), областью изменения которой является числовая прямая R, т.е.

X = f(): R,

где  — элементарный исход (или элементарное событие, принадлежащее пространству , т. е. .

Для дискретной случайной величины множество  возможных значений случайной величины, т.е. функции f(), конечно или счетно, для непрерывной – бесконечно и несчетно.

Множество называется счетным, если его элементы можно перенумеровать натуральными числами.

Примеры случайных величин:

X – число родившихся детей в течение суток в вашем городе;

Y – количество израсходованных денег за один день;

Z – дальность полета артиллерийского снаряда.

Здесь X, Y — дискретные случайные величины, a Z – непрерывная случайная величина.

Наиболее полным, исчерпывающим описанием случайной величины является ее закон распределения.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.

Для дискретной случайной величины закон распределения может быть задан в виде таблицы, аналитически (в виде формулы) и графически.

Например, случайная дискретная величина X может быть задана в виде:

x1

x2



xi



xn

p1

p2



pi



pn

Или

.

Такая таблица называется рядом распределения дискретной случайной величины.

Для любой дискретной случайной величины выполняется соотношение

(2.1)

Если по оси абсцисс откладывать значения случайной величины, по оси ординат – соответствующие их вероятности, то получаемая (соединением точек) ломаная называется многоугольником или полигоном распределения вероятностей.
Пример 2.1 [12]. В лотерее разыгрывается: автомобиль стоимостью 5000 ден. ед., 4 телевизора стоимостью 250 ден. ед., 5 видеомагнитофонов стоимостью 200 ден. ед. Всего продается 1000 билетов по 7 ден. ед. Составить закон распределения чистого выигрыша, полученного участником лотереи, купившим один билет.

Решение. Возможные значения случайной величины X (чистого выигрыша на один билет) равны 0 – 7 = –7 ден. ед. (если билет не выиграл), 200 – 7 = 193, 250 – 7 = 243, 5000 – 7 = 4993 ден. ед. (если на билет выпали выигрыши в виде видеомагнитофона, телевизора или автомобиля соответственно). Учитывая, что из 1000 билетов число невыигравших составляет 990, а указанных выигрышей 5, 4 и 1 соответственно; используя классическое определение вероятности, получим:

Р(Х = –7) = 990/1000 = 0,990; Р(Х=193) = 5/1000=0,005; Р(Х=243) = 4/1000 = 0,004; P(Х=4993)=1/1000=0,001, т.е. ряд распределения

xi

-7

193

243

4993

Pi

0,990

0,005

0,004

0,001

Две случайные величины называются независимыми, если закон распределения одной из них не меняется от того, какие возможные значения приняла другая величина.

Закон (ряд) распределения дискретной случайной величины дает исчерпывающую информацию о ней, так как позволяет вычислить вероятности любых событий, связанных со случайной величиной. Однако такой закон (ряд) распределения бывает трудно обозримым, не всегда удобным (и даже необходимым) для анализа.

Поэтому для описания случайных величин часто используются их числовые характеристики – числа, в сжатой форме выражающие наиболее существенные черты распределения случайной величины. Наиболее важными из них являются математическое ожидание, дисперсия, среднее квадратическое отклонение и др. Обращаем внимание на то, что в силу определения числовые характеристики случайных величин являются числами неслучайными, определенными.

Математическим ожиданием или средним значением М(Х) дискретной случайной величины X называется сумма произведений всех ее значений на соответствующие им вероятности:

M(X) = (2.2)

(Для математического ожидания используются также обозначения: Е(Х), ).

Пример 2.2. Вычислить М(Х) для случайной величины X – чистого выигрыша по данным примера 2.1.

Решение. По формуле (2.2)

М(Х) = (–7)0,990 +1930,005 + 2430,004 + 49930,001 = 0,

т.е. средний выигрыш равен нулю. Полученный результат означает, что вся выручка от продажи билета лотереи идет на выигрыши. Можно заметить, что это положение не совсем должно устраивать организаторов лотереи (чтобы это среднее склонялось в их сторону).

При n математическое ожидание представляет сумму ряда , если он абсолютно сходится.

Свойства математического ожидания:

1) М(С) = С, где С – постоянная величина;

2) M(kX) = kM(X);

3) М(Х± Y) = М(Х) ± M(Y);

4) M(XY) = M(X)M(Y), где X, Y – независимые случайные величины;

5) М(Х± C) = М(Х)± С.

Дисперсией D(X) случайной величины X называется математическое ожидание квадрата ее отклонения от математического ожидания:

D(X) = M[Х – М(Х)]2, (2.3)

или

D(X) = М(Х – а)2,

где а = М(Х).

Для дисперсии случайной величины X используется также обозначение Var(X), которое больше подходит для выражения ее смысла: дисперсия характеризует отклонение (разброс, рассеяние, вариацию) значений случайной величины относительно среднего значения (принято в англоязычной литературе).

Если случайная величина X – дискретная с конечным числом значений, то

D(X) = . (2.4)

Дисперсия D(X) имеет размерность квадрата случайной величины, что не всегда удобно. Поэтому в качестве показателя рассеяния используют также величину (D(X))1/2.

Средним квадратическим отклонением (стандартным отклонением или стандартом) х случайной величины X называется арифметическое значение корня квадратного из ее дисперсии:

. (2.5)

Пример 2.3. Вычислить дисперсию и среднее квадратическое отклонение случайной величины X по данным примера 2.2.

Решение. В примере 2.2 было вычислено М(Х) = 0. По формулам (2.4) и (2.5)

D(X) = (–7 – 0)20,990 + (193 – 0) 2 0,005 + (243 – 0) 20,004 + (4993 – 0) 2 0,001 = 25401,

х = = (25401)0,5 = 159,38 (ден. ед.).

Свойства дисперсии случайной величины:

1) D(C) = 0, где С – постоянная величина;

2) D(kX) = k2D(X);

3) D(X) = М(X2) – а2, где а = M(X);

4) D(X + Y) = D(X – Y) = D(X) + D(Y), где Х и Y – независимые случайные величины.

Особого внимания заслуживает второе свойство, которое показывает, что за скобку выносится квадрат константы, умножаемой на случайную величину.

Пример 2.4 [12]. Найти математическое ожидание и дисперсию случайной величины Z= 8X – 5Y+ 7, если даны значения М(Х) = 3, M(Y) = 2, D(X) = 1,5 и D(Y) = 1 и известно, что Х и Y – независимые случайные величины.

Решение. Используя свойства математического ожидания и дисперсии, вычислим:

M(Z) = 8M(X) – 5М(Y) + 7 = 83–52 + 7 = 21;

D(Z) = 82D(X) + 52D(Y) + 0 = 821,5 + 521 = 121.
^ 2.2. Функция распределения случайной величины. Непрерывные случайные величины
Функцией распределения случайной величины X называется функция F(x), выражающая для каждого х вероятность того, что случайная величина X примет значение, меньшее х:

F(x) = P(X
Пример 2.5. Дан ряд распределения случайной величины X:

xi

1

4

5

pi

0,4

0,1

0,5

Найти и изобразить графически ее функцию распределения.

Решение. В соответствии с определением

F(х) = 0 при х  1;

F(x) = 0,4 при 1 < х  4;

F(x) = 0,4 + 0,1 = 0,5 при 4<х5 ;

F(x)=0,5 + 0,5 = 1 при х > 5.

Итак:


Рис. 2.1. График дискретной функции распределения

Свойства функции распределения:

1. Функция распределения случайной величины есть неотрицательная функция, заключенная между нулем и единицей:

0F(x)l.

2. Функция распределения случайной величины есть неубывающая функция на всей числовой оси, т.е. при x21

F(x2)>F(x1).

3. На минус бесконечности функция распределения равна нулю, на плюс бесконечности – единице, т.е.

.

4. Вероятность попадания случайной величины X в интервал [х1,х2) (включая х1) равна приращению ее функции распределения на этом интервале, т.е.

P(xl 2) = F(x2)-F(xl). (2.7)

Пример 2.6. Функция распределения случайной величины X имеет вид:



Найти вероятность того, что случайная величина X примет значение в интервале [1;3).

Решение. По формуле (2.7)

P(1
Случайная величина X называется непрерывной, если ее функция распределения непрерывна в любой точке и дифференцируема всюду, кроме, быть может, отдельных точек.

Для непрерывной случайной величины X вероятность любого отдельно взятого значения равна нулю, т.е. P(X =x1) = 0, а вероятность попадания X в интервал (х1, х2) не зависит от того, является ли этот интервал открытым или закрытым (т.е., например, P(xl< x < х2) = P(хl  X  х2)).

Плотностью вероятности (плотностью распределения или просто плотностью) (х) непрерывной случайной величины X называется производная ее функции распределения

(х) = F'(x). (2.8)

Плотность вероятности (х), как и функция распределения F(х), является одной из форм закона распределения, но в отличие от функции распределения она существует только для непрерывных случайных величин.

График плотности вероятности называется кривой распределения.

Пример 2.7. По данным примера 2.6 найти плотность вероятности случайной величины X.

Решение. Плотность вероятности (х) = F'(x), т. е.



Свойства плотности вероятности непрерывной случайной величины:

1. Плотность вероятности — неотрицательная функция, т.е. (x)>0.

2. Вероятность попадания непрерывной случайной величины в интервал [a, b] равна определенному интегралу от ее плотности вероятности в пределах от а до b (см. рис. 2.2), т.е.

. (2.9)



Рис. 2.2. Вероятность попадания непрерывной случайной величины в интервал [a, b]
3. Функция распределения непрерывной случайной величины (см. рис. 2.3) может быть выражена через плотность вероятности по формуле:

. (2.10)

В этом смысле значение функции распределения в точке x, т.е. F(x) является площадью под функцией плотности (x) до точки x.



Рис. 2.3. Функция распределения непрерывной случайной величины F(x) как интеграл от плотности (x)
График самой функции распределения выглядит например, следующим образом:
Рис. 2.4. График функции распределения случайной величины, распределённой по нормальному закону распределения
Случайная величина X полностью определяется заданием своей функции распределения F(x), которая иногда называется интегральной функцией распределения.

^ 2.3. Основные понятия проверки статистических гипотез
Нахождение точечных и интервальных оценок является только предварительной стадией исследования. Конечная цель исследования может заключаться в сравнительной оценке различных технологических процессов по их производительности, точности или экономичности. Относительно эконометрических моделей это может быть более высокая надёжность или точность полученных моделей [1, 3, 4].

Большинство эконометрических моделей требуют многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок, анализом качества найденных оценок, достоверностью полученных выводов. Обычно эти расчеты проводятся по схеме статистической проверки гипотез. Поэтому знание основных принципов проверки гипотез является обязательным для эконометриста.

Во многих случаях необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), выдвигают гипотезу: генеральная совокупность случайной величины X распределена по закону распределения А. Например, можно выдвинуть предположение, что доход населения, ежедневное количество покупателей в магазине, размер выпускаемых деталей имеют нормальный закон распределения.

Статистической гипотезой называется гипотеза о предполагаемом виде закона неизвестного распределения или о параметрах известных распределений.

Например, статистическими являются гипотезы о том, что генеральная совокупность распределена по закону Пуассона или о том, математические ожидания двух нормальных совокупностей равны между собой.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.

Метод использования выборки для проверки истинности (ложности) статистической гипотезы называется статистическим доказательством истинности выдвинутой гипотезы.

Наряду с выдвинутой гипотезой рассматривают одну или несколько альтернативных гипотез. Если выдвинутая гипотеза отвергается, то ее место занимает альтернативная гипотеза. Поэтому статистические гипотезы подразделяются на нулевые и альтернативные.

Нулевой (или основной) гипотезой H0 называется гипотеза, которая утверждает, что различие между сравниваемыми величинами отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

Альтернативной (или конкурирующей) гипотезой H1 называется гипотеза, которая противоречит основной.

Статистическая гипотеза называется простой, если она содержит только одно предположение, т.е. если ей соответствует одно распределение или одна точка пространства параметров. Гипотеза называется сложной, если она сводится к выбору какого-либо распределения из целого множества или выбору точки из интервала конечного или бесконечного.

Очевидно, что на основе статистических данных очень трудно, а иногда и невозможно делать безошибочные выводы. Ошибки при проверке гипотез могут быть двух родов.

Ошибка первого рода состоит в том, что отвергается основная гипотеза, когда на самом деле она верна. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Возможные результаты статистических выводов представлены следующей таблицей:

Результаты проверки гипотезы

Возможные состояния гипотезы

верна H0

верна H1

Гипотеза H0 отклоняется

Ошибка первого рода

Правильный вывод

Гипотеза Н0 не отклоняется

Правильный вывод

Ошибка второго рода


Для проверки нулевой гипотезы используют специально подобранную случайную величину – выборочную статистику K, точное или приближенное распределение которой известны.

Случайная величина K, которая служит для проверки нулевой гипотезы, называется статистическим критерием.

Пусть определен статистический критерий K и пусть плотность вероятностей выборочной статистики K при условии истинности нулевой гипотезы H0 равна f(KH0), математическое ожидание K равно K0. Тогда вероятность попадания критерия K в интервал (K/2; K1-/2) можно найти по формуле:

. (2.11)

Зададим эту вероятность равной 1- и вычислим критические точки (квантили) K-распределения K/2 и K1-/2 из условия:

; (2.12)

, (2.13)

где значение  задается достаточно малым (0,05 или 0,01), чтобы попадание случайной величины K за пределы интервала (K/2, K1-/2) можно было бы считать маловероятным событием.

Следовательно,

,

а значит

.


Рис. 2.5. Двусторонняя критическая область

Область (K/2, K1-/2) называется областью допустимых значений. Области (-;K/2) и (K1-/2, +) называются критическими областями критерия, т.е. критической областью называется совокупность значений критерия K, при попадании в которую наблюдаемого значения К нулевую гипотезу отвергают.

Точки, отделяющие критические области от области принятия гипотезы, называются критическими точками.



Рис. 2.6. Правосторонняя критическая область

Критическая область называется двусторонней, если она располагается слева и справа от математического ожидания, правосторонней, если Р(K> K1-) = , (рис. 2.6),

и левосторонней, если Р(K) = , (рис. 2.7).


Рис. 2.7. Левосторонняя критическая область

Итак, основной принцип проверки статистической гипотезы можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области допустимых значений – гипотезу принимают.

^ Вероятность  совершить ошибку первого рода называется уровнем значимости или размером критерия.

Вероятность 1- не совершить ошибку второго рода называется мощностью критерия K.

Дадим геометрическую интерпретацию вероятностей ошибок первого и второго рода и мощности критерия, имеющего левостороннюю критическую область: передвигая квантиль K влево – уменьшая ошибку первого рода, – увеличиваем ошибку второго рода (рис. 2.8). Единственным способом одновременного уменьшения вероятностей ошибок первого и второго рода является увеличение числа выборок.


Рис. 2.8. Ошибки первого и второго рода

В общем случае задача проверки истинности нулевой гипотезы рассматривается так: любую выборку объема n можно изобразить как точку в n-мерном пространстве Rn, которое называется выборочным. Если наблюдается несколько выборок из генеральной совокупности N(a, 2), то точки в n-мерном пространстве будут концентрироваться около точки с координатами (a, a, ..., a). Например, для n = 2 (рис. 2.9) – число точек равно числу выборок, а «облако» точек около точки (0, 0) соответствует выборкам из нормальной совокупности N(0, 2), и «облако» около точки (a, a) – выборкам из совокупности N(а, 2). По расположению точек можно узнать, какая гипотеза верна.



Рис. 2.9. Расположение выборок

Значит, n-мерное пространство можно разделить на две области: основной гипотезе соответствует одна область, а альтернативной – другая. Если выборочная точка принадлежит области, соответствующей конкурирующей гипотезе, то основная гипотеза отклоняется.

Область S, при попадании в которую выборочной точки отвергается основная гипотеза, называется критической.

Вероятность P(SH0) отвергнуть верную основную гипотезу есть вероятность ошибки первого рода, она называется уровнем значимости или размером критерия. Уровень значимости задается заранее и достаточно мал – 0,05; 0,01 и т.д.

Если уровень значимости  достаточно мал, то высока надежность критерия, т.е. вероятность принять основную гипотезу, когда она верна.

Если – множество, при попадании в которое выборочной точки отвергается конкурирующая гипотеза, т.е. принимается верная основная гипотеза, то надежность критерия равна:

.

Зафиксируем уровень значимости  и будем рассматривать только критические множества S с этим фиксированным уровнем. Вероятность ошибки второго рода – вероятность отвергнуть верную конкурирующую гипотезу (а значит, принять нулевую гипотезу, когда она неверна).

Основным (хорошим) свойством статистического критерия должна быть минимальность ошибки второго рода при фиксированной ошибке первого рода. Так как , то при min, вероятность отвергнуть основную гипотезу, если верна конкурирующая, будет максимальной.

Вероятность попадания точки (выборки) в критическое множество, когда верна конкурирующая гипотеза, называется мощностью критерия, т.е. если

,

то S0 – наилучшая критическая область (НКО).
^ 2.4. Схема проверки статистических гипотез
По своему назначению и характеру решаемых задач статистические критерии чрезвычайно разнообразны, однако построены они по единой логической схеме. Коротко эту логическую схему можно описать так:

1) выдвижение нулевой гипотезы H0;

2) задание уровня значимости критерия ;

3) задание некоторой функции от результатов наблюдения

Kn = Kn1, х2, ..., хn) – статистического критерия, который в предположении истинности нулевой гипотезы подчинен закону распределения с плотностью f(KH0);

4) нахождение из таблиц распределения f(KH0) по заданному уровню значимости критических точек, делящих область допустимых значений критерия Kn на три: область неправдоподобно малых, неправдоподобно больших и правдоподобных значений;

5) расчет значения Kn подстановкой конкретных выборочных данных в функцию Kn и сравнение его с критическими точками. Если полученное значение принадлежит области правдоподобных значений, то нулевая гипотеза считается не противоречащей выборочным данным, в противном случае она отвергается в пользу альтернативной.

Вопрос свелся к построению такого статистического критерия Kn, который при заданной ошибке первого рода  имел бы наибольшую мощность 1-, или, что то же самое – наименьшую ошибку второго рода. Задача построения такого статистического критерия решается с помощью отношения правдоподобия.

Выше всех добродетелей – рассуждение,

ибо всякая добродетель без разума – пуста.

Петр I

1   2   3   4

Похожие:

Эконометрические модели iconИсследование особенностей лица модели
Успех студийного портрета и степень его воздействия на зрителя являются результатом взаимного влияния правильного освещения, композиции...

Эконометрические модели icon1 Модели науки. Модели генезиса науки
Существует несколько моделей ин, которые классифицируются по различным основаниям: (1) по характеру: (а) статическими – раскрывается,...

Эконометрические модели iconПокраска и старение модели гражданской транспортной техники
Покраска модели гражданской техники не слишком отличается от покраски модели боевого танка

Эконометрические модели icon6 1 Типы пассажирских вагонов
К; мягкий (СВ) купейный модели 61-4165; некупейный со спальными местами модели 61-826

Эконометрические модели iconМодели анализа конфликтов Модель Спитсероу
Под источниками модели в данном случае понимаются внутренние причины конфликтности отношений

Эконометрические модели iconАугустинавичюте А
Рассмотрены модели информационного и энергетического метаболизма в организме и психике, статические и динамические, ментальные и...

Эконометрические модели iconВ пособии рассмотрены основные эконометрические вопросы, связанные:...
Рекомендовано к изданию научно-методическим советом учреждения образования «Белорусский торгово-экономический университет потребительской...

Эконометрические модели iconЗабайкальская Международная Модель Организации Объединенных Наций...
Настоящие правила процедуры VIII забайкальской международной модели ООН (далее – «Правила процедуры», «Правила») утверждается до...

Эконометрические модели iconМатематические модели в форме нелинейных алгебраических и трансцендентных уравнений
Исход моделирования в значительной степени определяется выбором метода решения модели и умением правильно интерпретировать полученные...

Эконометрические модели iconПрограмма наименование дисциплины
Он должен успешно использовать математические модели различных физических, механических и экономических процессов, уметь правильно...

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
zadocs.ru
Главная страница

Разработка сайта — Веб студия Адаманов