Совет 1: Как посчитать корреляцию

Корреляцией называют взаимную зависимость двух случайных величин (чаще - двух групп величин), при которой изменение одной из них приводит и к изменению другой. Коэффициент корреляции показывает, насколько вероятно изменение второй величины при смене значений первой, т.е. степень ее зависимости. Самый простой способ вычисления этой величины - воспользоваться соответствующей функцией, встроенной в табличный редактор Microsoft Office Excel.
Вам понадобится
  • Табличный редактор Microsoft Office Excel.
Инструкция
1
Запустите Excel и откройте документ, содержащий группы данных, коэффициент корреляции между которыми требуется вычислить. Если такого документа еще не создано, то введите данные в пустую таблицу - табличный редактор создает ее автоматически при запуске программы. Каждую из групп значений, корреляция между которыми вас интересует, вводите в отдельную колонку. Это не обязательно должны быть соседние колонки, вы свободны оформить таблицу наиболее удобным образом - добавить дополнительные столбцы с пояснениями к данным, заголовки колонок, итоговые ячейки с суммарными или средними значениями и т.д. Можно даже располагать данные не в вертикальном (в колонках), а в горизонтальном (в строках) направлении. Единственное требование, которое надо соблюдать - ячейки с данными каждой группы должны располагаться последовательно одна за другой, чтобы таким образом создавался непрерывный массив.
2
Перейдите в ячейку, которая должна будет содержать значение корреляции данных двух массивов, и кликните в меню Excel закладку «Формулы». В группе команд «Библиотека функций» щелкните по самой последней пиктограмме - «Другие функции». Раскроется выпадающий список, в котором вам следует перейти в раздел «Статистические» и выбрать функцию КОРРЕЛ. В результате откроется окно мастера функций с формой, предназначенной для заполнения. Это же окно можно вызвать и без вкладки «Формулы», просто щелкнув по пиктограмме вставки функции, размещенной левее строки формул.
3
Укажите первую группу коррелирующих данных в поле «Массив1» мастера формул. Чтобы ввести диапазон ячеек вручную наберите адрес первой и последней клеток, разделив их двоеточием (без пробелов). Другой вариант - просто выделите нужный диапазон мышкой, а нужную запись в это поле формы Excel поместит самостоятельно. Такую же операцию надо проделать и со второй группой данных в поле «Массив2».
4
Нажмите кнопку OK. Табличный редактор рассчитает и отобразит значение корреляции в ячейке с формулой. При необходимости вы можете сохранить этот документ для дальнейшего использования (сочетание клавиш Ctrl + S).

Совет 2: Как рассчитать коэффициент корреляции

По определению, коэффициентом корреляции (нормированным корреляционным моментом) называется отношение корреляционного момента системы двух случайных величин (ССВ) к его максимальному значению. Для того чтобы разобраться в сути этого вопроса, необходимо, прежде всего, познакомиться с понятием корреляционного момента.
Вам понадобится
  • - бумага;
  • - ручка.
Инструкция
1
Определение: Корреляционным моментом ССВ X и Y называется смешанный центральный момент второго порядка (см. рис.1)
Здесь W(x,y) – совместная плотность вероятности ССВ
Корреляционный момент является характеристикой: а) взаимного разброса значений ССВ относительно точки средних значений или математических ожиданий (mx, my); б) степени линейной связи между СВ Х и Y.
Как рассчитать коэффициент корреляции
2
Свойства корреляционного момента.
1. R(xy)=R(yx) – из определения.
2. Rxx=Dx (дисперсии) - из определения.
3. Для независимых Х и Y R(xy)=0.
Действительно, при этом M{Xц,Yц}=M{Xц}M{Yц}=0. В данном случае это отсутствие линейной связи, но не любой, а, скажем, квадратичной.
4. При наличии «жесткой линейной связи между X и Y, Y=aX+b – |R(xy)|=бxбy=max.
5. –бxбy≤R(xy)≤бxбy.
3
Теперь вернемся к рассмотрению коэффициента корреляции r(xy), смысл которого заключается в линейной связи между СВ. Его значение изменяется от -1 до 1, кроме того он не обладает размерностью. В соответствии со сказанным, можно записать:
R(xy)= R(xy)/бxбy (1)
4
Для пояснения смысла нормированного корреляционного момента, представьте себе, что полученные опытным путем значения СВ Х и Y являются координатами точки на плоскости. При наличии «жесткой» линейной связи эти точки в точности лягут на прямую линию Y=aX+b. Возьмтие только положительные значения корреляции (при а
Как рассчитать коэффициент корреляции
5
При r(xy)=0 все полученные точки окажутся внутри эллипса с центром в (mx, my), величина полуосей которого определяется значениями дисперсий СВ.
На этом вопрос о расчете r(xy), казалось бы, можно считать исчерпанным (см. формулу (1)). Проблема заключается в том, что исследователь, получивший значения СВ экспериментально, не может на все 100% знать плотность вероятности W(x,y). Поэтому лучше считать, что в поставленной задаче рассматриваются выборочные значения СВ (то есть полученными в опыте), и использовать оценки нужных величин. Тогда оценка
mx*=(1/n)(x1+x2+…+xn) (для СВ Y аналогично). Dx*=(1/(n-1))((x1- mx*)^2+ (x2- mx*)^2+…
+(xn- mx*)^2). R*x=(1/(n-1))((x1- mx*)(y1- my*)+(x2- mx*)(y2- my*)+…+(xn- mx*)(yn- my*)). бx*=sqrtDx (то же для СВ Y).
Теперь можно смело для оценок использовать формулу (1).
Источники:
  • Свойства коэффициента корреляции
Поиск
Совет полезен?
Добавить комментарий к статье
Осталось символов: 500