Коэффициент спирмена пример

Коэффициент спирмена пример

Метод ранговой корреляции Спирмена позволяет определить силу и направление корреляционной связи между двумя признаками или двумя иерархиями признаков.

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами могут быть:

Два признака, измеренные в одной и той же группе переменных (наиболее часто в этом качестве выступает группа людей, которых принято тогда именовать испытуемыми или респондентами. Естественно, под переменными подразумеваются не сами люди, а данные ими ответы на те или иные вопросы).

  • Б) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (скажем, по ответам на пункты анкеты или теста).
  • В) Две групповые иерархии признаков (например, соответствие каких-либо выборов, сделанных одной группой людей выборам другой группы).
  • Г) Индивидуальная и групповая иерархии признаков (например, сопоставление индивидуальной иерархии жизненных ценностей сотрудника усредненному мнению группы на этот же счет; сопоставление последовательности товаров, которые приобрели бы (в среднем) жители города А и города Б при условии получения премии, на которую заранее не рассчитывали).

Методика расчета коэффициента корреляции рангов Спирмэна.

Теснота связи, как между количественными, так и между качественными признаками, при условии, что значения этих признаков могут быть проранжированы по степени убывания или возрастания, оценивается коэффициентом корреляции рангов Спирмэна:

,

где разность между величинами рангов признака-фактора и результативного признака; число наблюдаемых единиц (объём выборочной совокупности).

Коэффициент корреляции рангов Спирмэна изменяется в пределах от -1 до +1.

Ранговый коэффициент обычно исчисляется на основе небольшого объёма исходной информации, поэтому необходимо выполнить проверку его существенности (значимости). Приводится таблица предельных значений коэффициента корреляции рангов Спирмэна при условии верности нулевой гипотезы об отсутствии корреляционной связи при заданном уровне значимости и определённом объёме выборочной совокупности (выборочных данные).

Если полученное значение по модулю превышает критическую величину при данном уровне значимости, то нулевая гипотеза может быть отвергнута, то есть, величина не является результатом случайных совпадений рангов.

То есть, если

,

то нулевая гипотеза отвергается при данном уровне значимости и числе степеней свободы , количество наблюдений. Это условие можно записать следующим образом:

.

Прямая трактовка коэффициента корреляции рангов Спирмэна состоит в том, что если , то связь между изучаемыми признаками отсутствует. Если величина положительная правильная дробь, то есть, , то между изучаемыми признаками имеется прямая связь. Если величина отрицательная правильная дробь, то есть, , то между изучаемыми признаками имеется обратная связь.

Пример 1

Пусть в процессе системного анализа нам пришлось учитывать некоторую величину U, измерение которой возможно лишь по порядковой шкале (Ord). Например, нам приходится учитывать 10 целей функционирования системы и требуется выяснить их относительную значимость, удельные веса.

Если имеется группа лиц, компетентность которых в данной области не вызывает сомнений, то можно опросить каждого из экспертов, предложив им расположить цели по важности или “проранжировать” их. В простейшем случае можно не разрешать повторять ранги, хотя это не обязательно — повторение рангов всегда можно учесть.

Результаты экспертной оценки в нашем примере представим таблицей рангов целей:

Таблица 1

Эксперты

1

2

3

4

5

6

7

8

9

10

Сумма

A

3

5

1

8

7

10

9

2

4

6

55

B

5

1

2

6

8

9

10

3

4

7

55

Сумма рангов

8

6

3

14

15

19

19

5

8

13

Суммарный ранг

4.5

3

1

7

8

9.5

9.5

2

4.5

6

55

Итак, для каждой из целей Ti мы можем найти сумму рангов, определенных экспертами, и затем суммарный или результирующий ранг цели Ri. Если суммы рангов совпадают — назначается среднее значение. Метод ранговой корреляции позволяет ответить на вопрос — насколько коррелированы, неслучайны ранжировки каждого из двух экспертов, а значит — насколько можно доверять результирующим рангам? Как обычно, выдвигается основная гипотеза — об отсутствии связи между ранжировками и устанавливается вероятность справедливости этой гипотезы. Для этого можно использовать два подхода: определение коэффициентов ранговой корреляции Спирмэна или Кендэлла.

Более простым в реализации является первый — вычисляется значение коэффициента Спирмэна

Rs=1-

где di определяются разностями рангов первой и второй ранжировок по n объектов в каждой.

В нашем примере сумма квадратов разностей рангов составляет 30, а коэффициент корреляции Спирмэна около 0.8, что дает значение вероятности гипотезы о полной независимости двух ранжировок всего лишь 0.004.

При необходимости можно воспользоваться услугами группы из m экспертов, установить результирующие ранги целей, но тогда возникнет вопрос о согласованности мнений этих экспертов или конкордации.

Пусть у нас имеются ранжировки 4 экспертов по отношению к 6 факторам, которые определяют эффективность некоторой системы.

Таблица 2

Факторы —>

Эксперты

1

2

3

4

5

6

Сумма

A

5

4

1

6

3

2

21

B

2

3

1

5

6

4

21

C

4

1

6

3

2

5

21

D

4

3

2

3

2

5

21

Сумма рангов

Сум. ранг

84

Отклонение суммы

от среднего

+1

1

+5

25

+3

9

Заметим, что полная сумма рангов составляет 84, что дает в среднем по 14 на фактор.

Для общего случая n факторов и m экспертов среднее значение суммы рангов для любого фактора определится выражением

D=

Теперь можно оценить степень согласованности мнений экспертов по отношению к шести факторам. Для каждого из факторов наблюдается отклонение суммы рангов, указанных экспертами, от среднего значения такой суммы. Поскольку сумма этих отклонений всегда равна нулю, для их усреднения разумно использовать квадраты значений.

В нашем случае сумма таких квадратов составит S= 64, а в общем случае эта сумма будет наибольшей только при полном совпадении мнений всех экспертов по отношению ко всем факторам:

Smax=

М. Кэндэллом предложен показатель согласованности или коэффициент конкордации, определяемый как

В нашем примере значение коэффициента конкордации составляет около 0.229, что при четырех экспертах и шести факторах достаточно, чтобы с вероятностью не более 0.05 считать мнения экспертов несогласованными. Дело в том, что как раз случайность ранжировок, их некоррелированность просчитывается достаточно просто. Так для нашего примера указанная вероятность соответствует сумме квадратов отклонений S= 143.3 , что намного больше 64.

В заключение вопроса об особенностях метода экспертных оценок в системном анализе отметим еще два обстоятельства.

В первом примере мы получили результирующие ранги 10 целей функционирования некоторой системы. Как воспользоваться этой результируюзей ранжировкой? Как перейти от ранговой (Ord) шкалы целей к шкале весовых коэффициентов — в диапазоне от 0 до 1?

Здесь обычно используются элементарные приемы нормирования. Если цель 3 имеет ранг 1, цель 8 имеет ранг 2 и т. д., а сумма рангов составляет 55, то весовой коэффициент для цели 3 будет наибольшим и сумма весов всех 10 целей составит 1.

Вес цели придется определять как

  • (11-1) / 55 для 3 цели;
  • (11-2) / 55 для 8 цели и т. д.

При использовании групповой экспертной оценки можно не только выяснять мнение экспертов о показателях, необходимых для системного анализа. Очень часто в подобных ситуациях используют так называемый метод Дельфы (от легенды о дельфийском оракуле).

Опрос экспертов проводят в несколько этапов, как правило — анонимно. После очередного этапа от эксперта требуется не просто ранжировка, но и ее обоснование. Эти обоснования сообщаются всем экспертам перед очередным этапом без указания авторов обоснований.

Имеющийся опыт свидетельствует о возможностях существенно повысить представительность, обоснованность и, главное, достоверность суждений экспертов. В качестве “побочного эффекта” можно составить мнение о профессиональности каждого эксперта.

Пример 2 (случай не повторяющихся рангов)

Для примера рассмотрим зависимость между успеваемостью студентов ВУЗа по естественным и гуманитарным наукам.

Таблица 3

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарным,

Иванов А.

5

7

Петров В.

4

4

Семёнова И.

8

1

Комков А.

2

10

Шулейкин Е.

10

2

Краснов П.

1

3

Белкин С.

9

6

Кандыба Н.

3

8

Марченко А.

7

9

Якупов Ф.

6

5

В таблице 5 дана оценка успеваемости каждого студента в группе. То есть, каждому студенту приписан ранг от 1 до 10. Ранжируем исходные данные по признаку успеваемость студента по естественным дисциплинам

Таблица 4. Расчёты

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарные,

Краснов П.

1

9

-8

64

Комков А.

2

10

-8

64

Кандыба Н.

3

8

-5

25

Петров В.

4

5

-1

1

Иванов А.

5

4

1

1

Якупов Ф.

6

7

-1

1

Марченко А.

7

6

1

1

Семёнова И.

8

1

7

49

Белкин С.

9

2

7

49

Шулейкин Е.

10

3

7

49

Итого:

55

55

304

Вычисляем коэффициент корреляции рангов Спирмэна по формуле:

В нашем случае имеем . Тогда,

.

Таким образом, между способностями студентов к естественным и гуманитарным наукам имеется обратная, весьма существенная, связь.

Табличные значения коэффициента корреляции рангов Спирмэна при уровне значимости , числе наблюдений и числе степеней свободы , есть: , при уровне значимости и числе наблюдений и числе степеней свободы , есть: .

Так как, расчётное значение коэффициента корреляции рангов Спирмэна равно и, следовательно,

,

то можно заключить, что сделанный нами вывод о существовании обратной и весьма существенной связи между способностями студентов к естественным и гуманитарным наукам, гарантирован с доверительной вероятностью больше 0,98 , но меньшей 0,99 . То есть, получили статистически значимый результат.



Источник: studwood.ru


Добавить комментарий