Парный регрессионный анализ
Исходные данные
Таблица 3.1 Исходные данные
x |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
y |
0,84 |
3,81 |
4,73 |
5,11 |
5,81 |
7,23 |
8,85 |
Система двух случайных величин имеет пять основных статистических характеристик: средние значения и
, дисперсии
и
и корреляционный момент (или ковариацию)
, которые вычисляются по формулам:
(3.1)
(3.2)
. (3.3)
Особый интерес представляет формула корреляционного момента, которая отражает взаимосвязь между случайными величинами x и y. Поскольку корреляционный момент имеет размерность, его преобразуют в безразмерную величину по формуле:
. (3.4)
Величина играет чрезвычайно большую роль в статистических исследованиях и называется коэффициентом корреляции. Его значения заключены в интервале между +1 и -1. Если коэффициент корреляции равен нулю, то линейная связь между случайными величинами отсутствует. При
связь функциональная положительная. При
связь функциональная отрицательная. В реальных условиях коэффициент корреляции не бывает равен единице (или минус единице) и характеризует степень статистической связи между свойствами х и у. Чем ближе по абсолютной величине
к единице, тем сильнее связь между свойствами; она может быть положительной (
> 0) и отрицательной (
< 0). Таким образом, коэффициент корреляции является мерой линейной зависимости между двумя величинами.
Если значения более 0,7-0,8, то можно считать связь сильной, при
= 0,5-0,7 - связь средняя, а при
=0,2-0,5 - связь слабая. Принято считать, что линейной корреляции нет, если
<0,4. Таким образом, для прямолинейной связи коэффициент корреляции определяет меру связи между величинами. При малом значении коэффициента корреляции теснота прямолинейной связи между исследуемыми признаками оценивается критерием Стьюдента.
Различают два вида связи: 1) функциональная, 2) вероятностная (стохастическая).
Уравнение множественной регрессии должно быть адекватно изучаемому процессу. Коэффициенты в уравнении регрессии вычисляются методами матричной алгебры.
Задачу решают проведением прямой линии через набор опытных точек и в определении уравнения описывающего эту прямую. Обычно используется метод наименьших квадратов. Суть метода состоит в том, что изучаемая зависимость аппроксимируется таким алгебраическим выражением (трендом), который даёт наименьшее расхождение с наблюдаемыми значениями.
Другие статьи
Планирование технико-экономических показателей работы цеха
продукция выпуск планирование
себестоимость
В
условиях рыночной экономики устойчивость и успех любого хозяйствующего субъекта
может обеспечить только эффективное планирование его экономической
деятельности. Планирование функционирует в таких сферах, как планирование
деятель ...