22. Выбор формы связей. Уравнение регрессии, вычисление и интерпретация его параметров
При статистических исследованиях корреляционных связей одной из главных задач является определение формы корреляционной связи, т.е. построение модели связи.
Для аналитических целей корреляционную связь представляют при помощи математических функций, т.е. придают ей функциональную форму. Под формой связи понимают тенденцию, которая проявляется в изменении результативного признака в связи с изменением признака-фактора.
Построение и анализ корреляционной модели связи осуществляются с помощью корреляционно-регрессионного анализа, который состоит из следующих этапов:
предварительного априорного анализа;
сбора информации и ее первичной обработки;
построения модели (уравнения регрессии);
оценки и анализа модели.
Все этапы связаны между собой, границы их часто переплетаются и носят условный характер.
Форма корреляционной связи может быть выражена различными математическими функциями. Выбор формы связи решается на основе теоретического анализа существа изучаемых явлений и исследования эмпирических данных.
Эмпирическое исследование формы связи включает построение графиков корреляционных полей, эмпирических линий регрессии, а также анализ параллельных рядов. Изучение эмпирического материала дает возможность установить направление и форму связи. Для определения видов функции необходимо применять комплекс приемов: экономический, логический, графический и математический.
Линейная форма связи может быть выражена уравнением прямой: yх=a0+a1х
Нелинейная форма связи показана:
1) уравнением параболы второго порядка ух=a0+a1х+а2 х2
2) уравнением гиперболы yх=a0+a1 /x
3) показательной функцией yх=a0+a1х
4) степенной функцией yх=a0×xa
и другими функциями.
Главной проблемой при построении модели связи является определение вида аналитической функции, которая отразит механизм связи между факторным и результативным признаками и даст количественную оценку этой связи.
Наиболее часто для определения формы корреляционной связи используют уравнение прямой yх=a0+a1х
где ух - теоретические значения результативного признака;
х - факторный признак;
а0 и а1, - параметры уравнения связи.
Уравнением связи называется уравнение регрессии, а анализ, производимый с помощью уравнения регрессии, называется регрессионным анализом.
После установления вида функции для модели связи определяются параметры уравнения регрессии а0 и а1. Параметры уравнения регрессии определяются методом наименьших квадратов, суть которого состоит в том, что теоретическая линия регрессии должна быть проведена так, чтобы сумма квадратов отклонений эмпирических данных от теоретических была величиной минимальной. Исчисляя первые производные по а0 и а1 от функции Σ(у -а0 –а1х)2 —> min и приравнивая их к нулю, получаем систему нормальных уравнений вида:
Решая систему нормальных уравнений, определяем параметры а0 и а1 :
Параметр а1 называется коэффициентом регрессии и показывает изменения результативного признака при изменении факторного признака на единицу. Параметр а0 не имеет экономического содержания, так как может принимать отрицательные значения.
Очень часто исследуемые признаки имеют разные единицы измерения, поэтому для оценки влияния факторного признака на результативный применяется коэффициент эластичности. Он вычисляется для каждой точки и в среднем для всей совокупности.
Теоретический коэффициент эластичности вычисляют по формуле:
где - первая производная уравнения регрессии ух
Средний коэффициент эластичности для уравнения прямой вычисляется так:
Коэффициент эластичности показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на один процент.
Уравнение регрессии имеет практическое значение. Сравнивая фактический объем продукции у отдельных предприятий с теоретическим, мы получаем возможность его оценки с точки зрения средних условий существующих в данной совокупности предприятий. Регрессионную модель можно использовать для прогноза выпуска продукции в зависимости от изменения основных фондов тогда, когда не изменяются условия формирования уровней исследуемого признака.
Измерение тесноты корреляционной связи. Важное место в анализе регрессионной модели занимает оценка тесноты корреляционной связи между изучаемыми признаками.
Для измерения тесноты корреляционной связи между признаками при линейной форме связи применяется линейный коэффициент корреляции:
Он изменяется в пределах от -1 до +1 и показывает тесноту и направление корреляционной связи. Чем ближе коэффициент корреляции к 1 (по модулю), тем связь теснее. Отрицательное значение свидетельствует об обратной связи между признаками. Коэффициент корреляции можно вычислять и по формулам:
При любой форме связи для измерения тесноты корреляционной связи применяются теоретическое корреляционное отношение и индекс корреляции. Теоретическое корреляционное отношение определяется по формуле:
,где ή - теоретическое корреляционное отношение.
Факторная дисперсия, характеризующая вариацию результативного признака под влиянием вариации признака-фактора определяется по следующей формуле:
Общая дисперсия, характеризующая вариацию результативно- го признака под влиянием всех факторов, вызывающих эту вариацию, определяется по формуле
Представим индекс корреляции:
Остаточная дисперсия, характеризующая вариацию результативного признака под влиянием прочих неучтенных факторов, определяется по формуле
Индекс корреляции и теоретическое корреляционное отношение изменяются от 0 до 1 и показывают не только тесноту связи, но и степень пригодности подобранных функций связи.
ή, R - называются коэффициентами детерминации, которые показывают долю вариации результативного признака под влиянием вариации признака-фактора. Коэффициент детерминации используют в качестве критерия оценки подбора наилучшей модели связи.
Показатели тесноты корреляционной связи используются не только для оценки уже построенной модели связи (уравнения регрессии), но и для выбора оптимального варианта формы связи. Если теоретический анализ не дает возможности дать однозначный ответ о форме связи, то необходимо строить уравнения регрессии с различными формами связи - линейные и нелинейные. Оценка пригодности модели связи осуществляется путем анализа коэффициента детерминации или индекса корреляции. Наилучшей считается модель с наибольшими значениями этих показателей.
При линейной форме связи теоретическое корреляционное отношение и линейный коэффициент корреляции равны.
- 5. Понятие, задачи и организация статистической сводки.
- Структурные средние (мода и медиана)
- 11. Понятие вариации массовых явлений. Показатели вариации, их свойства, формулы расчета и экономический смысл.
- Правило сложения дисперсии и его использование в анализе взаимосвязей
- 12. Сущность выборочного метода наблюдения, сферы применения, виды выборки и способы формирования выборочной совокупности.
- 13. Ошибки выборки. Расчет необходимой численности выборки. Влияние вида выборки на величину ошибки репрезентативности.
- 14.Понятие о рядах динамики, их виды, элементы ряда и правила построения.
- 20. Индексы с постоянными и переменными весами. Индексы структуры.
- Индексы структурных сдвигов.
- 21. Виды и формы связей. Основные статистические методы изучения связей.
- Основные статистические методы выявления корреляционной связи
- 22. Выбор формы связей. Уравнение регрессии, вычисление и интерпретация его параметров
- 23. Основные показатели измерения тесноты связи между признаками.
- 24.Изучение численности и состава населения. Основные источники статистической информации о населении.
- 25. Методы расчета численности населения и трудовых ресурсов на перспективу.
- 27. Статистика занятости и безработицы. Классификация рабочей силы по экономической активности и статусу в занятости.
- 29. Понятие национального богатства. Изучение его объема и структуры.
- 31 .Изучение динамики и использования основных фондов.
- 32.Балансы основных фондов. Методы оценки основных фондов.
- 34. Статистика продукции сельского хозяйства. ( Статистика растениеводства, животноводства, урожая и урожайности, посевных площадей.)
- 37. Производительность труда. Основные показатели и методы расчета.
- 41. Показатели статистики издержек обращения.
- В настоящее время используется следующая номенклатура статей издержек обращения:
- Основные задачи анализа издержек обращения:
- 43. Основные показатели рентабельности, их сущность и способы расчета.
- 44. Сущность и методы исчисления валового внутреннего продукта.
- 45. Сущность и методы расчета национального дохода
- Показатели образования доходов
- 46. Система показателей национальных счетов
- Показатели распределения первичных доходов. Определение валового и чистого национального дохода
- 48. Статистика денежного обращения
- Наиболее важными показателями в анализе кредитных отношений являются:
- 17.3.Атистика банковской и биржевой деятельности