Оценка адекватности и точности моделей

В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование основных направлений экономической политики, предвидение последствий принимаемых решений.

Социально-экономическое прогнозирование является одним из решающих научных факторов формирования стратегии и тактики общественного развития. Актуальность данной темы, как в условиях развитой рыночной экономики, так и переходной экономики, определяется тем, что уровень прогнозирования процессов общественного развития обуславливает эффективность планирования и управления экономикой и другими сферами.

Целью данной контрольной работы является анализ статистических данных социально-экономических показателей Томской области, а также вывод прогнозных значений по рассматриваемому региону на будущие периоды.

Данная работа будет проводиться с применением различных способов и методов разработки социально-экономических прогнозов.

Для достижения главной цели работы необходимо решить следующие задачи:

  • провести общий анализ социально-экономического положения региона, описать стратегию его развития;
  • рассчитать показатели динамики социально-экономических процессов;
  • выявить аномальные наблюдения и исключить их;
  • проверить наличие тренда в показателях;
  • построить на основе данных необходимые модели и прогнозы, оценить их точность и качество;
  • изобразить всё графически и сделать выводы.

В процессе исследования использовались данные Федеральной службы Государственной статистики по России и Томской области.

Задание №1.

Конспект на тему: «Оценка адекватности и точности модели»

  1. Оценка адекватности модели.

Независимо от вида и способа построения экономико-математической модели вопрос о возможности её применения в целях анализа и прогнозирования экономического явления может быть решен только после установления адекватности, то есть соответствия модели исследуемому процессу или объекту. Так как полного соответствия модели реальному процессу или объекту быть не может, адекватность — в какой-то мере условное понятие. При моделировании имеется в виду адекватность не вообще, а по тем свойствам модели, которые считаются существенными для исследования.

Анализ качества эмпирического уравнения парной и множественной линейной регрессии начинают с построения эмпирического уравнения регрессии, то есть модели, которая является начальным этапом эконометрического анализа. После того, как модель построена, необходимо удостовериться в её качестве, поскольку уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. С этой целью выполняют проверку точности этой модели и её адекватности процессу, объекту или явлению, для которых она построена.

5 стр., 2104 слов

Социально-экономическое развитие Германии

... город на правах земли. Социально-экономическая концепция развития страны, Социально-экономическая концепция:, Политическое устройство, Государственное управление Германия — республика, имеющая федеративное ... Даля общего бюджетного профицит/дефицита (% от ВВП),1997............................................................-1,4 Характеристика важнейших отраслей народного хозяйства Из 1 тыс. занятых ...

Проверить адекватность модели – значит установить, насколько хорошо модель описывает реальные процессы, происходящие в системе, насколько качественно она будет прогнозировать развитие данных процессов.

Проверка адекватности проводится на основании некоторой экспериментальной информации, полученной на этапе функционирования системы или при проведении специального эксперимента, в ходе которого наблюдаются интересующие процессы. Проверка адекватности заключается в доказательстве факта, что точность результатов, полученных по модели, будет не хуже точности расчетов, произведенных на основании экспериментальных данных.

В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

  • проверка статистической значимости коэффициентов уравнения регрессии;
  • проверка общего качества уравнения регрессии;
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК);

Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.

Параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Для практического использования моделей регрессии большое значение имеет их адекватность, тo есть соответствие фактическим статистическим данным.

При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:

1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.

2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.

3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На её основе не принимаются решения и не осуществляются прогнозы.

Проверить значимость (качество) уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).

24 стр., 11758 слов

Математические модели химических реакторов

... уравнения, описывающие тепловой режим, изменение фазового состояния реагентов, конструктивные и другие особенности. 2. Математические модели реакторов идеального вытеснения 2.1 Модель идеального вытеснения Модель идеального вытеснения - это теоретическая модель с идеализированной структурой движущегося потока. В соответствии с моделью идеального вытеснения ...

Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели.

Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной (y) от среднего значения (y ср .) раскладывается на две части: «объясненную» и «необъясненную»:

Схема дисперсионного анализа имеет следующий вид:

где n –число наблюдений, m–число параметров при переменной x

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера. Фактическое значение F -критерия Фишера сравнивается с табличным значением F табл. (α, k1 , k2 ) при заданном уровне значимости α и степенях свободы k1 = m и k2 =n-m-1. При этом, если фактическое значение F-критерия больше табличного Fфакт > Fтабл , то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:

Эта формула в общем виде может выглядеть так:

Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:

Коэффициент детерминации R 2 принимает значения в диапазоне от нуля до единицы 0≤ R2 ≤1. Коэффициент детерминации R2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2 , тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные.

При отсутствии зависимости между (у) и (x) коэффициент детерминации R 2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).

Чтобы определить, при каких значениях R 2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор — делаем вывод о статистической значимости уравнения регрессии. Величина F-критерия связана с коэффициентом детерминации и её можно рассчитать

Либо при оценке значимости индекса детерминации (аналог коэффициента детерминации):

8 стр., 3818 слов

Коэффициент интеллекта

... проблем, затронутых в нашей работе. Коэффициент интеллекта (IQ) Развитие стандартизированных тестов интеллекта началось с работы Альфреда Бине ... его нет”. С этого угла зрения видно два значения интеллекта: (1) данное знание или информация; (2) способность ... но мы искренне надеялись, что этот реферат поможет человеку, интересующемуся интеллектом, креативностью и когнитивными свойствами человека, ...

где i 2 — индекс (коэффициент) детерминации, который рассчитывается:

Использование коэффициента множественной детерминации R 2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2 . Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый, улучшенный, скорректированный коэффициент множественной детерминации R2 , определяемый соотношением:

где p – число факторов в уравнении регрессии, n – число наблюдений.

Чем больше величина p, тем сильнее различия между множественным коэффициентом детерминации R 2 и скорректированным R2 .

При использовании скорректированного R2 , для оценки целесообразности включения фактора в уравнение регрессии, следует учитывать, что увеличение его величины (значения), при включении нового фактора, не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы (|t|>1).

При заданном объёме наблюдений и при прочих равных условиях, с увеличением числа независимых переменных (параметров), скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений, скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R 2 может быть обусловлено следующими причинами:

  • в регрессионную модель не включены существенные факторы;
  • неверно выбрана форма аналитической зависимости, которая нереально отражает соотношения между переменными, включенными в модель.

Следует также обратить внимание на важность анализа остатков (остаточной, «необъясненной» дисперсии).

Остаток представляет собой отклонение фактического значения зависимой переменной от значения, полученного расчетным путем. При построении уравнения регрессии, мы можем разбить значение (у) в каждом наблюдении на 2 составляющие:

Отсюда:

Если ε i =0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции у=а01 x) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи.