Open Library - открытая библиотека учебной информации. Проверка правильности ранжирования Правила ранжирования

Ранжирование данных, то есть присваивание рангов элементам упорядоченного списка, происходит по определённым правилам.

Сначала вы определяете направление ранжирования – от большего к меньшему или от меньшего к большему.

Выбор направления ранжирования осуществляется в соответствии с целью проводимого исследования. Если вы хотите проранжировать результаты решения творческих задач, то на первое место оптимальнее поставить лучший результат, на второе – лучший из оставшихся и т.д. Таким образом, будет осуществляться ранжировка по убыванию результатов (набранных баллов при решении творческих задач).

Если вы ранжируете результаты диагностики уровня внимания (например, полученные с помощью корректурной пробы), то лучшим результатом будет отсутствие ошибок (или их минимальное число, если в выборке нет безошибочного варианта). Выбрав самое меньшее число ошибок, вы присваиваете этому результату ранг 1, затем из оставшихся выбираете результат с минимальным количеством ошибок, присваиваете ему ранг 2 и т.д. Таким образом, получится ранжирование по возрастанию ошибок (хотя с точки зрения результатов – тоже по убыванию).

Выбрав направление ранжирования, вы приступаете к осуществлению его процедуры – каждому числовому значению присваиваете ранг, то есть место в упорядоченном перечне.

Например, вы хотите проранжировать по убыванию результаты теста интеллекта. В выборке 11 человек полученные баллы колеблются от 98 до 127 (таблица 1).

Ранжирование результатов диагностики интеллекта Таблица 1

Поскольку выбрано направление ранжирования от большего к меньшему (чтобы более высокие ранги были присвоены лучшим результатам), то нужно найти самое большое значение (лучший результат) и присвоить ему ранг 1. В нашем случае это 127. Напротив его мы указываем ранг 1. Затем выбираем максимальный результат из оставшихся – 120 – и присваиваем ему ранг 2. Следующее значение 119 получает ранг 3. Результату 118 приписываем ранг 4 и так далее. Полностью результаты ранжирования представлены в таблице 1.

Если встречаются совпадающие результаты, например, несколько человек получили одинаковые баллы (таблица 2), то процедура ранжирования осуществляется следующем образом: выбрав направление ранжирования (предположим, по возрастанию) определяете число, соответствующее 1 рангу.

Ранжирование результатов диагностики интеллекта Таблица 2

В соответствии с выбранным направлением (по возрастанию) выбираем наименьший результат (104) и присваиваем ему ранг 1. Затем выбираем наименьшее значение из оставшихся. Это 105, но этих значений два. Если бы одно из них было 105, а другое 106, то мы присвоили бы им ранги 2 и 3 соответственно. Но в случае одинаковых значений мы не можем присвоить им разные ранги. Поэтому поступаем следующим образом: те ранги, которые были бы присвоены, будь значения различными, назовем активными. В нашем случае это ранги 2 и 3. Активные ранги усредняются и одинаковые значения получают усреднённый ранг. Таким образом,

правило ранжирования одинаковых результатов: одинаковые значения получают совпадающие ранги, представляющие собой усреднённые «активные» ранги.

Усредненный ранг (2+3):2=2,5 присваивается двум значениям 105. Следующее значение 109, оно получает ранг 4. Особое внимание следует уделить на то, что после усреднённого ранга 2,5 можно ошибочно приписать следующему значению ранг 3. Но ранг 3 мы уже использовали при подсчёте усреднённого ранга. Поэтому ранжирование продолжается со следующего по порядку значения, в нашем случае это 4. Результат в 111 баллов получает ранг 5. Следующее значение 112, но в выборке 3 таких значения. Их активные ранги 6, 7 и 8. Усредненный ранг (6+7+8): 3=7. Таким образом, все значения 112 получают ранг 7, а продолжаем ранжирование с ранга 9 (следующего за наибольшим активным рангом). Этот ранг приписывается значению 118, значение 119 получает ранг 10, 121 – ранг 11, 127 – ранг 12, 128 – ранг 13, 129 – ранг 14, 130 – ранг 15 (таблица 2).

Чтобы проверить, не допущена ли ошибка, можно сложить приписанные нами ранги и сравнить с суммой порядковых номеров (совпадающей с суммой рангов без сходных значений). Сумма порядковых номеров равна 120:

Сумма проставленных нами рангов также равна 120:

Следовательно, ранжирование проведено верно.


Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов , которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получа­ет средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя дейст­вовать по строгому алгоритму.

АЛГОРИТМ 4

Подсчет критерия U Манна-Уитни.

1. Перенести все данные испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим.

3. Разложить все карточки в единый ряд по степени нарастания при­знака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2 ).

5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд , синие - в другой.

7. Определить большую из двух ранговых сумм.

8. Определить значение U по формуле:

где n 1 - количество испытуемых в выборке 1;

n 2 - количество испытуемых в выборке 2;

Т х - большая из двух ранговых сумм;

n х - количество испытуемых в группе с большей суммой рангов.

9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп U к p _ 005 , Н о от­вергается. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психа-логического факультетов



Студенты-физики (n 1 =14)

Студенты-психологи (n 2 =12)

Показатель невербального

интеллекта



Ранг

Показатель невербального

интеллекта



Ранг

127

26

123

25

122

24

117

23

116

22

115

20,5

115

20,5

114

19

113

18

112

17

111

15,5

111

15.5

108

14"

107

11.5

107

11,5

107

11,5

107

11,5

106

9

105

8

104

6.5

104

6,5

102

4,5

102

4,5

99

3

95

2

90

1

Суммы

1501

165

1338

186

Средние

107,2

111,5

Общая сумма рангов: 165+186=351. Расчетная сумма :

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H 0 : Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпи­рическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х :

Такую проверку рекомендуется производить в некоторых руководствах (Рунион Р., 1982; Greene J., D"Olivera M., 1989). Для сопоставления с критическим значе­нием выбираем меньшую величину U: U эмп =60.

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп U к p

Построим "ось значимости".

U эмп = 60

U эмп > U к p

Ответ: H 0 принимается. Группа студентов-психологов не превос­ходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физи­ков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).


2.4. Н - критерий Крускала-Уоллиса

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих из­менений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический ана­лог метода дисперсионного однофакторного анализа для несвязных вы­борок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на боль­шее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выбор­ка. Затем все индивидуальные значения возвращаются в свои первона­чальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случай­ны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между вы­борками. Но если в одной из выборок будут преобладать низкие значе­ния рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H 0 : Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз­личия по уровню исследуемого признака.

Н 1 : Между выборками 1, 2, 3 и т. д. существуют неслучайные разли­чия по уровню исследуемого признака.

Графическое представление критерия Н

Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная об­ласть наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными.

Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штри­ховкой отмечены зоны наложения

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п-Ъ, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р≤ 0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по край­ней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица преду­смотрена только для трех выборок и { n 1 , n 2 , n 3 } 5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ 2 , поскольку критерий Крускала-Уоллиса асимптотически прибли­жается к распределению χ 2 (Носенко И.А., 1981; J. Greene, M. D"Olivera, 1982).

Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказать­ся стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½·[c ·(c-1)]* 6 таких попарных сопоставлений используется, ес­тественно, критерий для двух выборок, например U или φ* .

АЛГОРИТМ 5 Подсчет критерия Н Крускала-Уоллиса

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (Можно использо­вать, естественно, и любые другие обозначения.)

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5. Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

где N - общее количество испытуемых в объединенной выборке;

Т - суммы рангов по каждой группе.

8а. При количестве групп с=3, n 1 n 2 n 3 ≤5 определить критические значения и со­ответствующий им уровень значимости по Табл. IV Приложения 1.

Если Н эмп равен или превышает критическое значение H 0,05 , H 0 отвергается.

8б. При количестве групп с>3 или количестве испытуемых n 1 n 2 n 3 >5, определить критические значения χ 2 по Табл. IX Приложения 1.

Если Н эмп равен или превышает критическое значение χ 2 , H 0 отвергается.
Воспользуемся этим алгоритмом при решении задачи о неразре­шимых анаграммах. Результаты работы по 1-6 шагам алгоритма пред­ставлены в Табл. 2.6.

Таблица 2.6

Подсчет ранговых сумм по группам испытуемых, работавших над четырьмя неразрешимыми анаграммами



Группа 1: анаграмма

ФОЛИТОЫ (n 1 =4)



Группа 2: анаграмма

КАМУСТО (n 2 =8)



Группа 3: анаграмма

СНЕРАКО (n 3 =6)



Группа 4: анаграмма

ГРУТОСИЛ (n 4 =4)



Длительность

Ранг

Длительность

Ранг

Длительность

Ранг

Длительность

Ранг

60

1

128

2

145

3.5

145

3.5

194

5

210

6

236

7

283

8

385

9

469

10

482

11

720

12

731

13

848

14

905

15

1080

16

1200

17

1678

18

2081

19

2361

20

2416

21

3600

22

Суммы

38,5

82,5

68

64

Средние

9,6

10,3

11,3

16,0

Общая сумма рангов =38,5+82,5+68+64=253. Расчетная сумма рангов:

Равенство реальной и расчетной сумм соблюдено.

Поскольку таблицы критических значений критерия Н преду­смотрены только для количества групп с = 3, а в данном случае у нас 4 группы, придется сопоставлять полученное эмпирическое значение Н с критическими значениями у}. Для этого вначале определим количест­во степеней свободы V для c=4:

v=c- 1 = 4 - 1 = 3

Теперь определим критические значения по Табл. IX Приложе­ния 1 для v =3:

Ответ: Н 0 принимается: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности по­пыток их решения.

А. Ранжирование качественных признаков

Пример 1.

Испытуемому предлагается задание, в котором семь личностных качеств необходимо упорядочить (проранжировать) в двух столбцах: в левом столбце в соответствии с особенностями его «Я реального», а в правом столбце в соответствии с особенностями его «Я идеального». Результаты ранжирования даны в таблице 2.

Таблица 2.

Я реальное

Качества личности

Я идеальное

ответственность

общительность

настойчивость

энергичность

жизнерадостность

терпеливость

решительность

Б. Ранжирование количественных признаков

Пример 2.

В результате диагностики невроза у пяти испытуемых по методике К.Хека и Х. Хесса были получены следующие баллы: 24, 25, 37, 13, 12. Этому ряду чисел можно проставить ранги двумя способами:

    большему числу в ряду ставится больший ранг, в этом случае получится: 3, 4, 5, 2, 1;

    большему числу в ряду ставится меньший ранг: в этом случае получится: 3, 2, 1, 4, 5.

4.2. Проверка правильности ранжирования

А. Формула для подсчета суммы рангов по столбцу (строчке)

Если ранжируется N чисел, то сумма рангов расчитывается по формуле (1.1):

1+2+3+...+N =N(N+ 1)/2 (1.1)

В случае примера 1 число ранжируемых признаков было равно N =7, поэтому сумма рангов, подсчитанная по формуле (1.1), должна равняться 7(7+1)/2=28.

Сложим величины рангов отдельно для левого и правого столбца таблицы:

7 + 1 + 3+ 2 + 5 + 4 + 6 = 28 - для левого столбца и

1 + 5+ 7+ 6 + 4 + 3 + 2 = 28 - для правого столбца.

Суммы рангов совпали.

Б. Формула для расчета суммы рангов в таблице

Ранжирование по столбцам.

Пример 3. Результаты тестирования двух групп испытуемых по 5 человек в каждой по методике дифференциальной диагностики депрессивных состояний В. А. Жмурова представлены в таблице 3.

Таблица 3.

Номер испытуемого

Задача: проранжировать обе группы испытуемых как одну, т. е. объединить выборки и проставить ранги объединенной выборке, сохраняя, однако различие между группами. Сделаем это в таблице 4, причем так, что максимальной величине будем ставить минимальный ранг.

Таблица 4.

Номер испытеумого

Поскольку у нас получены суммы ранга по столбцам, то общую сумму рангов можно получить, сложив эти суммы: 31+24= 55.

Чтобы применить формулу (1.1), нужно подсчитать общее количество испытуемых - это 5+5=10.

Тогда по формуле (1.1) получаем: 10(10+1)/2=55.

Ранжирование прведено правильно.

Если в таблице имеется большое число строк и столбцов, то можно использовать модификацию формулы (1.1)

Сумма рангов в таблице

= (kc+1)kc/2 , (1.2)

где k - число строк, с - число столбцов.

Вычислим сумму рангов по формуле (1.2.) для нашего примера. В таблице 2 имеется 5 строк и 2 столбца, сумма рангов = ((5·2+1)·5·2)/2=55

Ранжирование по строкам

Пример 4.

Таблица 5. Проведем ранжирование по строчкам.

Номер испытуемого

Суммы по столбцам

В этой таблице минимальному по величине числу ставится минимальный ранг. Сумма рангов по каждой строчке должна быть равна 6, поскольку у нас ранжируется три величины: 1+2+3= 6. В нашем случае так оно и есть. Теперь просуммируем ранги по каждому столбцу отдельно и сложим их.

Расчетная формула общей суммы рангов для ранжирования по строчкам для таблицы определяется по формуле:

Сумма рангов = nc(c+1)/2, (1.3.)

где n – количество испытуемых в столбце, с - количество столбцов (групп).

Проверим правильность ранжирования для нашего примера.

Реальная сумма рангов в таблице 8+10+12= 30

По формуле (1.3): 5·3·(3+1)/2=30.

Следовательно, ранжирование проведено правильно.

Случай одинаковых рангов

Ранжирование качественных признаков

А. Ранжирование качественных признаков

Модифицируем пример 1. и перепишем его в табл. 6. Предположим, что при оценке особенностей «Я реального» испытуемый считает, что такие качества, как «настойчи­вость» и «энергичность», должны иметь один и тот же ранг. При проведении ранжирования (столбец 1 табл. 6) этим качествам необходимо проставить мысленные ранги (М.Р.), как числа, обязательно идущие по порядку друг за другом, и от­метить эти ранги круглыми скобками - (). Однако посколь­ку эти качества, по мнению испытуемого, должны иметь одинаковые ранги, то во втором столбце табл. 6, относяще­муся к «Я реальному», следует поместить среднее арифмети­ческое рангов, проставленных в скобках, т.е. (2 + 3)/2 = 2,5. Таким образом, второй столбец табл. 6 и будет окончатель­ным итогом ранжирования особенностей «Я реального», данным испытуемым, а проставленные в этом столбце ран­ги будут носить название - реальные ранги (P.P.).

Аналогично при ранжировании «Я идеального» испыту­емый считает, что такие качества, как «общительность», «энергичность» и «жизнерадостность», должны иметь один и тот же ранг. Тогда при проведении ранжирования (см. столбец 5 табл. 6) этим качествам необходимо проставить мысленные ранги, как числа, обязательно идущие по поряд­ку друг за другом, и отметить эти ранги круглыми скобка­ми - (). Однако поскольку эти качества, по мнению испы­туемого, должны иметь одинаковые ранги - то в четвертом столбце табл. 6, относящемся к «Я идеальному», следует поместить среднее арифметическое рангов, проставленных в скобках, т.е. (4 + 5 + 6)/3 = 5. Таким образом, четвертый столбец таблицы 6 и будет окончательным итогом ранжи­рования особенностей «Я идеального», данным испытуе­мым, а проставленные в этом столбце ранги будут носить название - реальные ранги. Подчеркнем еще раз, что мыс­ленные (условные) ранги, как числа, должны располагаться друг за другом по порядку, несмотря на то что ранжируемые качества в таблице данных не находятся рядом друг с дру­гом.

Таблица 6.

Я реальное

Качества личности

Я идеальное

Ответственность

Общительность

Настойчивость

Энергичность

Жизнерадостность

Терпеливость

Решительность

Обозначения: М.Р. - мысленные, или условные, ранги; P.P. - ре­альные ранги.

Проверим правильность ранжирования во втором столб­це табл. 6, т.е. реальные ранги, относящиеся к «Я реаль­ному»:

1 + 2,5 + 2,5 + 5 + 4 + 6 = 28.

Проверим правильность ранжирования в четвертом столбце табл. 6, т.е. реальные ранги, относящиеся к «Я идеальному»:

1 + 2 + 3 + 5 + 5 + 5 + 7 = 28.

По формуле (1.1) сумма рангов также равняется 28. Сле­довательно, ранжирование проведено правильно.

Б. Ранжирование количественных характеристик (чисел)

Ранжирование чисел рассмотрим на примере.

Пример. Психолог получил у 11 испытуемых следующие значения показателя невербального интеллекта: 113,102,123,122, 117, 117, 102, 108, 114, 102, 104. Необходимо проранжировать эти показатели, и лучше всего это сделать в таблице 7.

Таблица 7

Номер испытуемых

Показатели интеллекта

Мысленные ранги (М.Р.)

Реальные ранги (P.P.)

В примере встретились две группы из равных чисел (102, 102 и 102; 117 и 117), поскольку числа в группах раз­личны, то и скобки, проставленные этим группам чисел, также различны.

Проверим правильность ранжирования по формуле (1.1). Под­ставив исходные значения в формулу, получим: 11·12/2 = 66. Суммируя реальные ранги, получим:

6 + 2 + 11 + 10 + 8,5 + 8,5 + 2 + 5 + 7 + 2 + 4 = 66.

Поскольку суммы совпали, следовательно, ранжирование про­ведено правильно.

Правила ранжирования чисел таковы.

1. Наименьшему (наибольшему) числовому значению приписывается ранг 1.

2. Наибольшему (наименьшему) числовому значению приписывается ранг, равный количеству ранжируемых ве­личин.

3. Одинаковым по величине числам должны проставлять­ся одинаковые ранги.

4. Если в ранжируемом ряду несколько чисел оказались равными, то им приписывается реальный ранг, равный средней арифметической величине тех рангов, которые эти числа получили бы, если бы стояли по порядку друг за дру­гом.

5. Если в ранжируемом ряду имеется две и больше групп равных между собой чисел, то для каждой такой группы применяется правило 4, и мысленные ранги каждой группы заключаются в разные скобки.

6. Общая сумма реальных рангов должна совпадать с расчетной, определяемой по формуле (1.1).

При необходимости ранжирования достаточно большого числа объектов следует объединять их по какому-либо при­знаку в достаточно однородные классы (группы), а затем уже ранжировать полученные классы (группы).

Наиболее часто к измерениям, полученным в ранговой шкале, применяются коэффициенты корреляции Спирмена и Кэндалла, и, кроме того, используются разнообразные критерии различий.

Процедура ранжирования достаточно проста, однако ошибки могут возникнуть совершенно неожиданно. Поэтому всегда, когда проводится ранжирование, необходима проверка правильности реализации этой процедуры. В наиболее общем случае для проверки правильности ранжирования столбца (или строчки) признаков применяется следующая формула:

Если ранжируется N признаков, то сумма всех полученных рангов должна быть равна:

где N - количество ранжируемых признаков.

Эта формула широко используется в дальнейшем, поэтому ее следует хорошо запомнить.

Совпадение итогов подсчета рангов по формуле (1.1) и по реальным результатам ранжирования экспериментальных данных является подтверждением правильности ранжирования.

В случае примера 1 число ранжируемых признаков было N=7, поэтому сумма рангов, подсчитанная по формуле (1.1) должна равняться 7*8/ 2= 28.

Сложим величины рангов отдельно для левого и правого столбца таблицы 1.2:

7 + 1 + 3 + 2 + 5 + 4 + 6 = 28- для левого столбца и

1 + 5 + 7 + 6 + 4 + 3 + 2 = 28 - для правого столбца.

Суммы рангов, подсчитанные по формуле (1.1) и в результате реального ранжирования, совпали, следовательно, ранжирование проведено правильно. Подобную проверку следует обязательно делать после каждого ранжирования.

В дальнейшем нам встретиться еще несколько разных вариантов ранжирования. Например, ранжирование таблицы чисел. Подобные таблицы будут в дальнейшем использоваться достаточно часто, поэтому следует хорошо усвоить правила проверки правильности ранжирования табличных данных.

1 Вариант. Предположим, что у нас были протестированы две группы испытуемых по 5 человек в каждой группе по методике дифференциальной диагностики депрессивных состояний В.А. Жмурова и у них получены следующие тестовые баллы, которые сразу же занесем в таблицу 1.3:

Таблица 1.3

Проверим правильность ранжирования. Поскольку у нас уже получены суммы рангов по столбцам, то общую реальную сумму рангов можно получить просто сложив эти суммы, итак 31 + 24 = 55.



Следовательно, ранжирование проведено правильно.

В том случае, если в таблице имеется большое количество строк и столбцов, для подсчета рангов можно использовать модификацию формулы (1.1), она будет выглядеть так:

где k - число строк, с - число столбцов.

Проведем вычисление суммы рангов по формуле (1.2) для нашего примера. У нас 5 строк и 2 столбца, следовательно, сумма рангов будет равна

2 Вариант. В ряде статистических методов ранжирование табличных данных осуществляется по каждой строчке отдельно. Проиллюстрируем это положение на предыдущем примере, добавив еще одну группу испытуемых из 5 человек. Получится таблица 1.5 в которой проведем ранжирование по строчкам:

Таблица 1.5

№ испытуемых п/п Группа 1 Ранги Группа 2 Ранги Группа 3 Ранги
Суммы

Обратите внимание, что в таблице 1.5 минимальному по величине числу ставится минимальный ранг.

В случае такого ранжирования сумма всех рангов по каждой строчке должна быть равна 6, поскольку у нас ранжируется всего три величины:

Расчетная формула общей суммы рангов для такого способа ранжирования определяется по формуле:

(1.3)

Где п - количество испытуемых в столбце

с - количество столбцов (групп испытуемых, измерений и т.п.).

Правильность ранжирования вновь определяется условием совпадения расчетных сумм реальных рангов, полученных по таблице и по расчетной формуле (1.3).

Проверим правильность ранжирования для нашего примера.

Реальная сумма рангов такова: 8 + 10 + 12 = 30

По формуле (1.3) она такова:

Следовательно, ранжирование было проведено правильно.

1.3.3. Случай одинаковых рангов

При выставлении экспертных оценок или в других случаях ранжирования возникают ситуации, когда двум или большему числу качеств приписываются одинаковые ранги. Рассмотрим такой случай применительно к примеру 1.2, в котором ранжировались семь личностных качеств. Для иллюстрации разобьем первый и второй столбцы в таблице 1.2 на две части, представив ее в виде таблицы 1.6:



Таблица 1.6

Предположим, что при оценке особенностей «Я реального» испытуемый считает, что такие качества как «настойчивость» и «энергичность» должны иметь один и тот же ранг. Тогда при проведении ранжирования (см. столбец № 1 таблицы 1.6) этим качествам необходимо проставить условные ранги, обязательно идущие по порядку друг за другом - и отметить эти ранги круглыми скобками - (). Однако, поскольку эти качества, по мнению испытуемого, должны иметь одинаковые ранги, во втором столбце таблицы 1.6, относящемуся к «Я реальному» следует поместить среднее арифметическое рангов, проставленных в скобках, т.е. (2+3)/2=2,5 . Таким образом, второй столбец таблицы 1.6 и будет окончательным итогом ранжирования особенностей «Я реального» данным испытуемым.

Проверим правильность ранжирования. Вначале складываем реальные ранги, полученные во втором столбце таблицы 1.6: 1 + 2, 5 + 2, 5 + 5 + 4 + 6 = 28

Предположим, что при ранжировании качеств, относящихся к «Я идеальному», испытуемый считает, что таким качествам как: «общительность», «энергичность» и «жизнерадостность» нужно проставить одинаковые ранги. В таком случае этим качествам он ставит условные ранги по порядку в круглых скобках в последнем пятом столбце таблицы 1.6.

Среднее арифметическое условных рангов (4 + 5 + 6)/3 = 5 и есть искомый ранг, который приписывается трем вышеназванным качествам, в четвертом столбце таблицы 1.6

Подчеркнем еще раз, что условные ранги должны располагаться по порядку величин, несмотря на то, что ранжируемые качества не находятся рядом друг с другом.

Проверим опять правильность ранжирования, суммируя полученные в четвертом столбце ранги: 1 + 2 + 3 + 5 + 5 + 5 + 7 = 28

Мы помним, что по формуле (1.1) сумма рангов также равнялась 28. Следовательно, ранжирование проведено правильно.

Одинаковые ранги можно присваивать любому числу ранжируемых величин. В таком случае им также приписывается величина среднего арифметического от количества условных рангов, проставляемых по порядку их величин.

Рассмотрим особенности ранжирования количественных характеристик. Несмотря на то, что ранжирование широко используется применительно к количественным показателям, следует помнить, что в порядковой шкале операции с числами - это по сути дела операции с рангами (порядками), но не с количественным выражением свойств (качеств, признаков и т.п.) как таковых.

В этом случае правила ранжирования таковы:

1. Наименьшему числовому значению приписывается ранг 1.

2. Наибольшему числовому значению приписывается ранг, равный количеству ранжируемых величин.

3. В случае если несколько исходных числовых значений оказались равными, то им приписывается ранг, равный средней величине тех рангов, которые эти величины получили бы, если бы они стояли по порядку друг за другом и не были бы равны.

Отметим, что под этот случай могут попасть как первые, так и последние величины исходного ряда для ранжирования.

4. Общая сумма реальных рангов должна совпадать с расчетной, определяемой по формуле (1.1).

6. При необходимости ранжирования достаточно большого числа объектов их следует объединять по какому-либо признаку в достаточно однородные классы (группы), а затем уже ранжировать полученные классы (группы).

Пример 1.2. Психолог получил у 11 испытуемых следующие значения показателя невербального интеллекта: 113, 107, 123, 122, 117, 117, 105, 108, 114, 102, 104. Необходимо проранжировать эти показатели, и лучше всего это сделать в таблице:

Таблица 1.7

В этой таблице условные и реальные ранги располагались в одном столбце, что удобнее и экономит много места.

Проверим правильность ранжирования по формуле (1.1): подставляем исходные значения в формулу, получаем: 11∙12/2=66.

Суммируем реальные ранги, получаем:

6 + 4 + 11 + 10 + 8,5 + + 8,5 + 3 + 5 + 7 + 1 + 2 = 66.

Поскольку суммы совпали, следовательно, ранжирование проведено правильно.

В ранговой шкале применяется множество разнообразных статистических методов, часть из которых будет описана ниже. Наиболее часто к измерениям, полученным в этой шкале, применяются коэффициенты корреляции Спирмена и Кэндалла, кроме того, применительно к данным, полученным в этой шкале, используют разнообразные критерии различий.

Шкала интервалов

В шкале интервалов, или интервальной шкале, каждое из возможных значений измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы - интервал, который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале. Размер интервала - величина фиксированная и постоянная на всех участках шкалы. Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения; в психологии это стены и стенайны. При работе с этой шкалой измеряемому свойству или предмету присваивается число, равное количеству единиц измерения, эквивалентное количеству имеющегося свойства. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства).

Так, в психологии часто используется семантический дифференциал Ч. Осгуда, который является примером измерения по интервальной шкале различных психологических особенностей личности, социальных установок, ценностных ориентации, субъективно-личностного смысла, различных аспектов самооценки и т.п:

Однако, как подчеркивают С. Стивене и ряд других исследователей, психологические измерения в шкале интервалов по сущности нередко оказываются измерениями, выполненными в шкале порядков. Основанием для этого утверждения служит тот факт, что функциональные возможности человека меняются в зависимости от разных условий. При измерении, например, силы с помощью динамометра или устойчивости внимания с помощью секундомера, результаты измерения в начале и в конце опыта по причине усталости испытуемого не будут квантифи-цироваться равными интервалами.

Только измерение по строго стандартизированной тестовой методике, при условии того, что распределение значений в репрезентативной (см. ниже) выборке достаточно близко к нормальному (см. ниже), может считаться измерением в интервальной шкале. Примером последнего могут служить стандартизованные тесты интеллекта, где условная единица измерения IQ эквивален­тна как при низких, так и при высоких значениях интеллекта.

Принципиально важным является и то, что к экспериментальным данным, полученным в этой шкале, применимо достаточно большое число статистических методов.

Шкала отношений

Шкалу отношений называют также шкалой равных отношений. Особенностью этой шкалы является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства или признака. Шакала отношений является наиболее информативной шкалой, допускающей любые математические операции и использование разнообразных статистических методов.

Шкала отношений по сути очень близка интервальной, поскольку если строго фиксировать начало отсчета, то любая интервальная шкала превращается в шкалу отношений.

Именно в шкале отношений производятся точные и сверхточные измерения в таких науках, как физика, химия, микробиология и др. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психофизиология, психогенетика.


Глава 2

ПОНЯТИЕ ВЫБОРКИ

Психолог-экспериментатор в большинстве случаев изучает какую-то определенную выборку людей, которая всегда отбирается из большей по численности группы. Такая объемлющая группа называется в статистике генеральной совокупностью. Таким образом, генеральная совокупность - это любая группа людей, которую психолог изучает по выборке. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать психологу.

Выборкой называется любая подгруппа элементов (испытуемых, респондентов), выделенная из генеральной совокупности для проведения эксперимента. При этом отдельный индивид из выборки, с которым работает психолог, называется испытуемым (респондентом ).

Объем выборки, обычно обозначаемой буквой я, может быть любым, но не меньшим чем два респондента. В статистике различают малую (n ≤ 30), среднюю 30 < n < 100 и большую выборку (n ≥ 100).

2.1. Полное исследование

Если психологическому исследованию (наблюдению, измерению, эксперименту) подвергаются все представители изучаемой генеральной совокупности, то такое исследование называют полным, или сплошным.

Предполагается, что, в соответствии с задачами, гипотезами и планом, полное обследование генеральной совокупности позволяет получить исчерпывающую информацию об изучаемых в ней психологических закономерностях. Однако в отечественной и зарубежной психологии еще никогда не проводилось сплошного исследования по той причине, что на практике определить размеры той или иной генеральной совокупности и тем более исследовать её - задача нереальная и, кроме того, в определенной степени избыточная. Если выборка испытуемых по своим характеристикам репрезентативна генеральной совокупности, то есть основания полученные при её изучении результаты распространить на всю генеральную совокупность. Нельзя упускать из вида также и то, что работа психолога, по существу, представляет собой сложный вид деятельности, требующий высокой профессиональной компетентности и нередко много времени для работы с каждым испытуемым.

2.2. Выборочное исследование

Если психолог производит выбор ограниченного числа элементов из изучаемой (генеральной) совокупности, то такое исследование называют частичным, или выборочным.

Выборочный метод является основным в экспериментальной работе психолога при изучении генеральных совокупностей. Его преимущество перед полным (сплошным) исследованием всех элементов генеральной совокупности заключается в том, что он сокращает как время, так и затраты труда, а главное - позволяет получать информацию о таких группах, полное обследование которых принципиально невозможно или нецелесообразно.

Пример

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 n 2 ≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 n 2 ≤60. Однако уже при n 1 n 2 >20 ранжирование становиться достаточно трудоемким.

На наш взгляд, в случае, если n 1 n 2 >20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального ин­теллекта. С помощью критерия Q Розенбаума мы в предыдущем па­раграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот резуль­тат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 2.3

Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2 = 12) факультетов

Студенты-физики Студенты-психологи
Код имени испытуемого Код имени испытуемого Показатель невербального интеллекта
1. И.А. 1. Н.Т. ИЗ
2. К.А. 2. О.В.
3. К.Е. 3. Е.В.
4. П.А. 4. Ф.О.
5. С.А. 5. И.Н.
6. Ст.А. 6. И.Ч.
7. Т.А. 7. И.В.
8. Ф.А. 8. К.О.
9. Ч.И. 9. P.P.
10. ЦА. 10. Р.И.
11. См.А. 11. O.K.
12. К.Ан. 12. Н.К.
13. Б.Л.
14. Ф.В.

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.



Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получа­ет средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя дейст­вовать по строгому алгоритму.

АЛГОРИТМ 4 Подсчет критерия U Манна-Уитни. 1. Перенести все данные испытуемых на индивидуальные карточки. 2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим. 3. Разложить все карточки в единый ряд по степени нарастания при­знака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой. 4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2). 5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой. 6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли об­щая сумма рангов с расчетной. 7. Определить большую из двух ранговых сумм. 8. Определить значение U по формуле: где n 1 - количество испытуемых в выборке 1; n 2 - количество испытуемых в выборке 2; Т х - большая из двух ранговых сумм; n х - количество испытуемых в группе с большей суммой рангов. 9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп U к p _ 005 , Н о от­вергается. Чем меньше значенияU, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Ads by OffersWizardAd Options

Студенты-физики (n 1 =14) Студенты-психологи (n 2 =12)
Показатель невербального интеллекта Ранг Показатель невербального интеллекта Ранг
20,5
20,5
15,5 15.5
14"
11.5 11,5
11,5
11,5
6.5 6,5
4,5 4,5
Суммы
Средние 107,2 111,5

Общая сумма рангов: 165+186=351. Расчетная сумма:

Равенство реальной и расчетной сумм соблюдено.

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H 0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпи­рическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х:

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп U к p

Построим "ось значимости".

U эмп = 60

U эмп > U к p

Ответ: H 0 принимается. Группа студентов-психологов не превос­ходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физи­ков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).