Понятие корреляционной зависимости

Один из наиболее общих законов объективного мира — закон всеобщей связи и зависимости между явлениями. Исследуя явления в самых различных областях, статистика неизбежно сталкивается с зависимостями, как между количественными, так и между качественными показателями. Ее задача — выявить такие зависимости и дать им количественную характеристику.

Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как определенные факторы, влияющие на изменение других (факторные), а вторые (результативные) как следствие влияния первых.

Существует два вида связи между отдельными признаками: функциональная и стохастическая (статистическая), частным случаем которой является корреляционная связь.

Термин «стохастический» происходит от греч. «stochos» — мишень. Стреляя в мишень, даже хороший стрелок редко попадает в ее центр, выстрелы ложатся в некоторой близости от него. То есть стохастическая связь означает приблизительный характер значений какого-либо признака).

Связь между двумя переменными x и y называется функциональной, если определенному значению переменной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.

Такие связи обычно встречаются в точных науках. Например, известно, что площадь квадрата равна квадрату его стороны (S = a2).

Это соотношение характерно для каждого единичного случая (квадрата), это так называемая жестко детерминированная связь.

Такие связи можно встретить и в области экономических явлений.

Например, при сдельной оплате труда связь между оплатой труда y и количеством изготовленных изделий x при фиксированной расценке за одну деталь, например 5 руб., легко выразить формулой у = 5х (для изучения функциональных связей применяется индексный метод).

Интересно
Существуют и иного рода связи, где взаимно действуют многие факторы, комбинация которых приводит к разбросу значений результативного признака (показателя) при одинаковом значении факторного признака. Например, при изучении зависимости величины платежей, поступающих в государственный бюджет от количества транспортных средств, прошедших через кассовые боксы платных дорог, последние будут рассматриваться как факторный признак, а величина поступаемых средств — как результативный признак.

Между ними нет жестко детерминированной связи, т. е. при одном и том же количестве автотранспортных средств, прошедших через кассовые боксы платных дорог, величина платежей, перечисленных с разных дорог, будет различной, так как кроме числа автомобилей, на эту величину влияет много других факторов (различные габариты, для которых применяются различные проездные сборы и льготы), комбинация которых вызывает вариацию величины поступаемых средств.

Там, где взаимодействует множество факторов, в том числе и случайных, выявить зависимости, рассматривая единичный случай, невозможно. Такие связи можно обнаружить только при массовом наблюдении. Выявленная таким образом связь именуется стохастической.

Проявление стохастических связей подчиняется действию закона больших чисел: лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимно погасятся и зависимость, если она имеет существенную силу, проявится достаточно отчетливо.

Корреляционная связь — понятие более узкое, чем стохастическая связь, являясь ее частным случаем. Именно корреляционные связи являются предметом изучения статистики.

Корреляционная связь — это связь, проявляющаяся при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами.

То есть, корреляционную связь условно можно рассматривать как функциональную связь средней величины одного признака (результативного) со значением другого (или других).

При этом, если рассматривается связь средней величины результативного показателя y с одним признаком-фактором x, корреляция называется парной, а если таких признаков два и более (x1, x2, …, xm) —  множественной.

Интересно
Термин «корреляция» ввел в статистику английский биолог и статистик Ф. Гальтон в конце XIX в., под которым понималась «как бы связь», т. е. связь в форме, отличающейся от функциональной. Еще ранее этот термин применил француз Ж. Кювье в палеонтологии, где под законом корреляции частей животных он понимал возможность восстановить по найденным в раскопках частям облик всего животного.

По характеру изменений x и y в парной корреляции различают прямую и обратную связь. При прямой связи значения обоих признаков изменяются в одном направлении, т. е. с увеличением (или уменьшением) значений x увеличиваются (или уменьшаются) и значения y. При обратной связи значения факторного и результативного признаков изменяются в разных направлениях.

Изучение корреляционных связей сводится в основном к решению трех задач:

  • выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками;
  • измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
  • определение уравнения регрессии — математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных — факторных признаков (эта часть исследования именуется регрессионным анализом).

Термин «корреляционно-регрессионный анализ» подразумевает всестороннее исследование корреляционных связей (т. е. решение всех трех задач).

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)