» » Нормальное распределение в психологии. Кривая нормального распределения Гаусса и гистограмма

Нормальное распределение в психологии. Кривая нормального распределения Гаусса и гистограмма

Читатель наверняка уже обратил внимание на особенности распределения, представленного в таблице 1 и на рисунке 2. Большинство случаев расположены в центре ряда, а приближаясь к крайним значениям, происходит долгий плавный спад. На графике нет разрывов - нет классов, которые были бы отделены друг от друга. Кроме этого, график по обе стороны симметричен; это означает, что если его разделить вертикальной линией по центру, то получившиеся две половинки окажутся примерно одинаковыми. Такой график распределения своей формой похож на колокол, это так называемое «нормальное распределение», которое чаще всего встречается при измерениях индивидуальных различий. В своем идеальном виде нормальное распределение изображено на рисунке 3.

Понятие нормального распределения в статистике используется уже давно. Вероятность какого-либо события представляет собой частоту его наступления, зафиксированного очень большим количеством наблюдений. Эта вероятность представляет собой определенное соотношение, точнее, дробь, числителем которой является ожидаемый результат, а знаменателем - все возможные результаты. Таким образом, вероятность, или шансы, того, что две монеты выпадут одной и той же стороной, например решкой, будет один к четырем, или 1 / 4 . Это следует из того факта, что существует всего четыре возможные комбинации выпадения монет РР, РО, ОР, ОО, где Р - решка, а О - орел. Одна из четырех, РР, означает выпадение только решек. Вероятность выпадения двух орлов будет также составлять 1 / 4 , а вероятность выпадения решки какой-либо одной монеты при выпадении орла другой составит один к двум, или 1 / 2 . Даже если число монет увеличить, скажем, до 100, и количество возможных комбинаций станет очень большим, то мы по-прежнему сможем математически определить вероятность возникновения каждой комбинации, например, выпадения всех решек или 20 решек и 80 орлов. Эти вероятности, или ожидаемую частоту выпадений, можно изобразить графически описанным выше методом. Если число монет будет очень велико, то построенный график окажется колокольной формы, то есть графиком нормального распределения.


0 1 2 3 4 5 6 Количество выпадений решек

Рис. 4. Теоретическое (пунктир, линия) и фактически наблюдаемое (сплошная линия) распределение количества выпадений решек в 128 случаях подбрасывания шести монет. (Данные из Гилфорда, 10, с. 119.)


Рис. 3. График нормального распределения

На рисунке 4 можно найти теоретический и фактический графики, показывающие количество выпадения решек в 128 случаях подбрасывания шести монет. При каждом броске число решек, естественно, может варьироваться от 0 до 6. Чаще всего будет выпадать комбинация из трех решек (и трех орлов). Частота возрастает или понижается, когда число решек становится меньше или больше трех. На рисунке 4 теоретически вычисленные вероятности обозначены пунктирной линией, в то время как реальная частота, полученная в результате 128 последовательных подбрасываний шести монет, начерчена непрерывной линией. Необходимо заметить, что ожидаемые и фактически полученные результаты достаточно близки друг к другу. Чем больше количество наблюдений (или бросков), тем больше вероятность их совпадения.

Чем большее количество монет подбрасывается, тем ближе будет график теоретически ожидаемого распределения к графику нормальной вероятности. Говорят, что результаты, получаемые при подбрасывании монет или бросании игральных костей, зависят от «случайности». Под этим подразумевается, что результат определяется большим количеством независимых факторов, влияние которых учесть невозможно. Высота, с которой бросают монету или игральную кость, ее вес и размер, подкрутка, которую делает бросающий, и многие другие подобные факторы определяют в каждом отдельном случае, какой стороной упадет монета. График нормального распределения был впервые построен математиками Лапласом и Гауссом в связи с исследованиями ими игры случая, распределения отклонений в наблюдениях и других типов случайных изменений.

Уже в девятнадцатом веке бельгийский статистик Адольф Кутелет первым применил понятие нормального распределения к исследованию качеств человека (ср. 4). Кутелет обратил внимание на то, что определенные измерения роста, объема грудной клетки армейских призывников распределялись в соответствии с графиком вероятности колокольной формы. На основании сходства этого графика с данными человеческой изменчивости, он построил теорию, согласно которой такая человеческая изменчивость имеет место, когда природа стремилась воплотить «идеал», или норму, но в силу различных обстоятельств потерпела неудачу. Иными словами, человеческий рост, вес, уровень интеллектуального развития зависят от огромного количества независимых факторов, так что конечный результат окажется распределенным в соответствии с теорией вероятности. Опыт Кутелета по применению графика нормального распределения был переосмыслен и развит Гальтоном, чей вклад в дифференциальную психологию уже обсуждался нами в главе 1. У Гальтона график нормального распределения получил широкое и разнообразное применение, многие наработки были связаны с квантификацией и преобразованием данных, касающихся как индивидуальных, так и групповых различий.

Определить, является ли распределение, воспроизведенное в таблице 1 и на рисунке 2, «нормальным» можно путем применения соответствующих математических процедур. Несмотря на незначительные отклонения, этот график не отличается существенно от графика нормального распределения. Таким образом, мы можем сделать вывод, что его расхождение с нормой находится в пределах ожидаемых флуктуации, и считать его графиком нормального распределения. Многие распределения, открытые в дифференциальной психологии, так же соответствуют математическим вариантам нормального распределения, особенно когда они получаются в результате применения тщательно сконструированных измерительных приборов на больших репрезентативных выборках. В остальных случаях распределение может соответствовать нормальному лишь приблизительно. Оно может представлять собой некую непрерывность и быть более или менее симметричным, отражая то, что большинство индивидов находятся в центре ряда, а ближе к крайним значениям их количество постепенно и плавно снижается.

На рисунках 5-10 мы видим примеры графиков распределения, отражающих широкое разнообразие свойств человека. Эти распределения были выбраны специально, потому что они основаны на больших репрезентативных выборках, большинство из которых включало в себя 1000 и более случаев. Два графика, построенные для меньших групп, приводятся для того, чтобы показать распределение физиологических и личностных характеристик в таких областях, где данные для больших групп сравнительно скудные.


Рис. 5. Распределение роста у 8585 коренных англичан. (Данные из Юля и Кенделла, 34, с. 95.)


Рис. 6. Распределение качества, связанного с возможностями легких, у 1633 студентов мужского колледжа. (Данные из Харриса и др., 12, с. 94.)

Пример распределения слабоструктурированного качества дан на рисунке 5, который показывает рост в дюймах 8585 коренных англичан. Можно заметить, что график практически совпадает с математически нормальным графиком. На рисунке 6 представлен частотный график более функционального, физиологического качества, связанного с возможностями легких. Это измеряющийся в кубических сантиметрах объем воздуха, который выдувается из легких после максимально глубокого вдоха. Необходимые для построения графика измерения были сделаны на 1633 студентах мужского колледжа. Общее соответствие нормальному графику здесь так же очевидно.

Рисунок 7 связан с физиологическими измерениями, которые, как считается, имеют отношение к эмоциональным и личностным свойствам. На нем показано распределение показателей 87 детей по данным композиционного измерения автономного баланса. Высокие результаты в этом исследовании показывают функциональное преобладание парасимпатического отдела периферической нервной системы; низкие значения - функциональное преобладание ее симпатического отдела. Для психологов периферическая нервная система представляет особый интерес, он связан с той ролью, которую она играет в эмоциональном поведении.

График, представленный на рисунке 8 иллюстрирует распределение результатов теста на скорость и точность восприятия. Результатом является общее число вычеркнутых за одну минуту букв А на пестром листе. Этот тест считается просто тестом на внимание и восприятие, хотя скорость и координация движений здесь тоже имеют значение. В этой связи можно вспомнить данные теста на простое научение, зафиксированные в таблице 1 и на рисунке 2. Этот тест требовал применения кода, состоявшего из парных, не имеющих смысла слогов. Оба теста предлагались одной и той же группе, состоящей из 1000 студентов колледжа, и оба дали распределения, лежащие в пределах ожидаемых математических значений нормального графика.


Показатель автономного баланса

Рис. 7. Распределение значений оценок автономного баланса у 87 детей в возрасте от 6 До 12 лет. (Данные из Уингера и Эллингтона, 33, с. 252.)


Рис. 8. Количество вычеркнутых за одну минуту букв А 1000 студентами колледжа. (Данные из Анастази, 2, с. 32.)


Рис. 9. Измерение IQ репрезентативной выборки, состоящей из 2904 детей в возрасте от 2 до 18 лет, по шкале Стэнфорд - Бине. (Данные от Термена и Меррилла, 27, с. 37.)

На рисунке 9 мы видим типичные результаты применения интеллектуального теста в условиях большой выборки. Она показывает распределение IQ (Стэнфорд - Бине, редакция 1937 года) 2904 детей в возрасте от 2 до 18 лет. График показывает, что в наибольшем проценте случаев IQ испытуемых находится в пределах среднего интервала, от 95 до 104 баллов. Процент постепенно снижается до 1, поскольку IQ лишь очень малого числа детей находится в пределах между 35 и 44 и между 165 и 174 баллами. В данное распределение не включались данные по находящимся в интернатах слабоумным детям, выборка была также ограничена и по ряду других параметров. Так, в нее вошли только белые американцы с несколько преувеличенной (по сравнению с реальным населением страны) пропорцией городских жителей. Большую часть выборки составили учащиеся начальной школы, и хотя организаторы стремились к тому, чтобы обеспечить полноценное участие в тестировании групп старших и самых младших возрастов, их число едва ли соответствовало числу тестируемых учащихся начальной школы. Отметим, что весь ряд IQ для целостной популяции, на самом деле, как свидетельствуют данные, полученные разными исследователями, простирается от значений, близких к 0, до значений, несколько превышающих 200.



Рис. 10. Распределение 600 учениц колледжа по результатам теста Оллпорта на доминирование-подчинение. (Данные из Рагглза и Оллпорта, 24, с. 520.)

В качестве последней иллюстрации рассмотрим рисунок 10, содержащий распределение результатов широко используемого личностного опросника. График показывает распределение 600 учениц колледжа по результатам теста Оллпорта на доминирование-подчинение. Целью этого личностного опросника было исследование стремления индивида доминировать над другими членами группы в повседневной жизни или подчиняться им. Рисунок 10 показывает, что, несмотря на биполярное определение качества (противопоставление доминирования и подчинения), большинство результатов испытуемых располагаются вокруг середины шкалы и распределение приближается к нормальному. Иными словами, биполярное наименование качества не должно вводить нас в заблуждение, что индивидов можно классифицировать на доминирующих и подчиняющихся. Как и другие измеряемые свойства человека, данное личностное качество имеет множество степеней проявления; и при этом большинство людей относятся к промежуточным типам.


Рис. 11. Скошенное распределение


Закон нормального распределения, или как его еще называют – кривая Гаусса, является одним из основных столпов в теории вероятности. Его применение можно проследить практически во всех сферах современного человеческого знания, от физики до философии. Я же попробую в кратком обзоре на примерах, объяснить как можно применить этот принцип, при аналитике народных процессов в социологии.

Хотя точное вычисление кривой Гаусса и требует решения довольно сложного уравнения, в этом тексте знания высшей математики вам не потребуются. И так, давайте для начала поймем, в общих чертах, в чем смысл этого графика, на примере изображения, показанного в заголовке статьи. Закон нормального распределения показывает вероятность некоторого значения из некоторой градации этих самых значений. Ось X является цифровым представлением этой самой градации и уходит от нуля в обе стороны до относительной бесконечности (но в некоторых случая она жестка ограничена). Ось Y является показателем величины вероятности значения из градации и может быть от нуля до одного. Сложно? Нет, все просто, взгляните вот на этот график и вам станет все довольно ясно.



Допустим, вы идете по улице, хотите спросить что-то умное у прохожего, и обращаясь к случайному человеку, вы можете быть уверены в том, что с максимально вероятностью он будет человеком среднего ума, в меньшей вероятности, что он будет дураком или умником и в практически минимальной возможности – гением или откровенным тупицей.

Одним словом этот график показывает вероятностное распределение интеллектуальности общества. Таким образом, обратившись к любой позиции на графике, можно сказать, какова вероятность при переборе людей, встретить гения, умного или дурака.

Естественно этот график является просто примером, и может не иметь никакого отношения к реальности. Для реальной же картины подобного рода, должен работать целый статистический комитет. Как можно понять из приведенного примера, график может деформироваться, в ту или иную сторону, и представлять уже иную вероятность. Показанный же график, называется – Стандартным нормальным распределением, потому что такая форма кривой вероятности установлена самой природой. И если мы обратимся в мир биосферы, и будем оценивать разные вероятности, то обнаружим, что данная форма кривой будут доминировать.

В определении ЗНР я указал, что ось X уходит по обе стороны в бесконечность. Дело в том, что оценка, каких либо общественных величин методом живой статистики, является явлением, находящемся только в настоящем времени. Общество не стоит на месте, оно постоянно движется, развивается или деградирует, поэтому сейчас оно одно, завтра другое, а значит, будет и другая форма и положение кривой Гаусса. Если не уходить с позиции стандартного нормального распределения, то для демонстрации вышесказанного можно опереться на ту же кривую вероятности интеллектуальной развитости общества.

График представляет собой пример оценки интеллектуального развития общества за некоторый необъявленный промежуток времени. Зеленая кривая, находящаяся на нуле, показывает положение дел «раньше». Красная и синяя кривые показывают момент «сейчас». Две кривые (красная и синяя) показаны исключительно в качестве иллюстрации, так как в реальной ситуации будет только одна из них, ведь общество не может одновременно развиться и деградировать по одному и тому же критерию оценки. Разбор одной из кривых, например красной, покажет вот такую картину. Общество поумнело на две единицы градации, что стало причиной того, чтоте люди, которые раньше считались очень умными, стали обычным явлением, те, кого раньше считали гениями, стали частенько встречаться и уже не являются чем-то необычным, а не очень умные в былые времена люди стали считаться чуть ли не дегенератами. Полностью противоположная картина будет при оценке синей кривой. Ее кстати очень хорошо продемонстрировал фильм «Идиократия», в котором «человек со средним умом» попав в будущее, оказался умнейшим человеком на земле, потому что за столетия, общество умственно деградировало настолько, что уровень дегенерата в нем стал среднестатистическим.

На основе понимания и умения выстраивать эти графики, можно не только оценивать движение общества в прошлом, но и строить планы на будущее на основе осознания того, как должно быть. Например, усиленно рассматриваемую мной в последнее время проблему алкоголизации общества, можно привести вот в такой форме. (Это чисто мое субъективное мнение, сформированное не математической статистикой, а тем, что я лично вижу вокруг себя.)

Тут присутствует жесткое ограничение оси X , за пределами которого, толкование кривой становится бессмысленно. На приведенном графике я определил четкие границы рассматриваемого явления – от идейного трезвенника до запойного алкоголика. Ясно, что попытка оценить точку кривой за этим диапазоном невозможна, из-за отсутствия величины оценки. В умственном развитии, конечно, тоже есть границы диапазона, но правда такова, что он настолько велик, что проще определить его как бесконечность, нежели как ограниченную величину. Так же на графике видна деформация одной из кривых, что является естественным положением дел в отношении описываемого явления.

И так, на графике красной кривой, показано приблизительное положение дел с алкоголизацией Российского общества на данный момент времени. Зеленой линией демонстрируется положение вещей с употреблением алкоголя «как должно быть» в нормальном (здоровом и думающем) обществе. Таким образом, мы видим, очень печальное положение вещей в данный момент. Если начать перебирать людей поштучно, мы выясним, что наиболее часто среди них будут встречаться пассивные алкоголики (термин определенный мной в прошлой статье «Алкогольная арифметика с картинками», обозначающий человека регулярно (через день, раз в неделю, раз в месяц, неважно, важно то, что ему это нравиться и он на этом сидит) выпивающего независимо от количества выпиваемого).Приблизительно с равной вероятностью будут встречаться позволяющий себе выпить (т. е. равнодушные – предложат, выпьет, не предложат не будет) и алкоголики. С еще чуть меньшей вероятностью – совсем падшие и запойные алкоголики. Трезвенник при таком положение вещей - откровенный рецидив, а идейный трезвенник, так вообще явление крайне редкое. (Идейный трезвенник – человек который не просто ведет трезвый образ жизни, а несет при этом некую идеологию, например, прямо заявляет о принципах здорового общества.)

В нормальном же обществе (зеленая кривая), трезвенник должен быть нормой. С минимальным отрывом от него должен идти идейный трезвенник. А вот равнодушный человек, позволяющий не отказаться от рюмочки, уходит в область рецидива, и становиться чуть ли не врагом общества. Пассивных алкоголиков как вы понимаете в том обществе вообще нет, так как они не смогут в нем существовать (они будут откровенными врагами народа, из-за того что понижают этику и демографию общества). Последнее как раз и выражено деформацией зеленой кривой Гаусса.

Ясное дело, что в этом крохотном тексте просто невозможно уложить всю полноту возможных вариантов применения закона нормального распределения в социологии. Но я надеюсь, что почву для размышлений я дал.

На мой взгляд, знанием данного закона, должен обладать любой человек, хотя бы чуть-чуть задумывающийся о своем будущем. А ведь, как известно – свое будущее, прямо зависит от будущего общества в целом, т. е. среды, в которой мы все живем. И если каждый будет знать, куда, а главное как нужно идти, то это уже гарантия уверенности, что мы идем к чему-то лучшему.

________________________________________ ________________________________________ ____

Большинство экспериментальных исследований, связанных с измерениями, в том числе и в психологии, способных принимать практически любые значения в заданном интервале (что зависит от величины выборки) описываются моделью случайных непрерывных величин и соответственно – непрерывном распределении.

Одним из непрерывных распределений, имеющим основополагающую роль в математической статистике является нормальное (или Гауссово) распределение. Нормальное распределение является самым важным в статистике, что объясняется рядом причин:

    Многие экспериментальные наблюдения можно успешно описать с помощью близкого к нормальному распределению.

    Большинство распределений, связанных со случайной выборкой, при увеличение объёма последней переходят к нормальному распределению.

    Нормальное распределение обладает рядом благоприятных математических свойств, во многом обеспечивающих его широкое применение в статистике:

    1. Имеет колоколообразную форму, симметричную относительно точки M=X,cточками перегиба, абсциссы которых отстоят отMна +.

      Для нормального распределения математическое ожидание, дисперсия и стандартное отклонение генеральной совокупности равно (сигма).

      нормальное распределение полностью определяется двумя параметрами: математическим ожиданием (средним) и стандартным отклонением.

      мода, медиана и среднее арифметическое нормального распределения совпадают и равны математическому ожиданию M.

Исходя из того, что нормальное распределение полностью определяется двумя параметрами Mи(сигма), то при измерении этих параметров можно получить целое семейство нормальных кривых. Чтобы избежать неудобств, связанных с расчётами для каждого конкретного случая, в психологии используют так называемоенормированное (или чаще стандартное)нормальное распределение , которое и применяется для стандартизации шкал (психометрических линеек).

Нормированное нормальное распределение, имея параметры M= 0 и= 1, имеет колоколообразную форму.

Особенностью данной кривой является то, что площадь под кривой имеет постоянное значение (как показано на рисунке 1). Эта особенность является основной для стандартной интерпретации в эмпирических исследованиях с целью постановки психологического диагноза: так при изучении проявления, какого – либо признака, при попадании индивидуального результата в диапазон составляет 68,2% от всех случаев (т.е. у 68,2% испытуемых генеральной совокупности, степень проявления изучаемого признака будет находиться именно в этом диапазоне), что может оцениваться как среднее проявление изучаемого признака и интерпретироваться какнорма , в проявлении признака.

Рис.1. Процентное распределение случаев под нормальной кривой.

    1. Стандартизированные шкалы.

Показатели психометрических тестов, применяемых в практической психологии с целью постановки психологического диагноза, переводятся из первичных ("сырых" – не подвергнутых обработке) и полученных испытуемым по данному тесту в стандартные показатели, которые рассчитываются на основе линейного или нелинейного преобразования первичных показателей (при условии их распределения близкого к нормальному закону). При этом исторически сложилось наличие ряда наиболее распространённых стандартных показателей, связанных с особенностями преобразования, и отсюда – наличие "семейства" стандартных шкал, переводимых друг в друга и несводимых кZ-шкале.

Z-шкала образуется в результате центрирования, понимаемого как линейная трансформация величин признака, при которой средняя величина распределения становится равная нулю, и процедуры нормирования посредством среднеквадратических отклонений.

Z-шкала состоит из непрерывного континуумаZ-показателей, определяемых в виде разности между индивидуальными первичными результатами и средним значением для генеральной совокупности, делённые на стандартное отклонение распределения.

где X– необработанные, сырые баллы,

– Среднее,

 – стандартное отклонение.

При этом полученная Z-шкала будет иметь среднюю точкуM=0 и единицу измерения (масштаб) 1стандартного (единичного) нормального распределения как показано на рисунке 2.

Z-показатель может принимать как положительные, так и отрицательные значения. Большинство случаев (99,72%) значения показателей уменьшаются в пределах -3+3 и могут принимать любые значения. К достоинствамZ-показателя относится простота интерпретации и сравнения индивидуальных результатов: чем больше показатель, тем дальше от среднего (нормы) он может находиться, при этом знак указывает (+) – выше среднего; (-) – ниже среднего. Но недостатки, особенно в области прикладной (практической) психологии, к которым относят: сложность интерпретации для испытуемого (клиента), крупность масштаба единиц измерения, оперирование отрицательными и положительными величинами, побудили разработчиков тестов использовать нормализованные преобразования по форме:
, гдеZp– преобразованный стандартный показатель;b– стандартное отклонение преобразованного распределения;Z–Z-показатель;A– среднее значение преобразованного распределения. Такой переход правомерен, так как стандартная шкала представляет собой интервальную шкалу, что позволяет выполнить линейные преобразования, при условии, что константыbиA– действительные числа.

Разберём процедуру получения преобразованных стандартных показателей на ряде примеров:

Было проведено эмпирическое исследование уровня уверенности в себе (опросник Рейзаса – 0-90) на выборке учителей (50 человек) из различных школ г. Н. Новгорода. В результате первичной статистической обработки были получены результаты:

    Распределение первичных результатов ("сырых баллов") по форме близко к нормальному распределению (после процедур группировки и анализа кривой распределения – полигона частот).

    Вычислены характеристики для данной выборки –

Предлагается провести линейное преобразование и определить для различных шкал значение одного первичного результата X=45 ("сырой балл" одного из испытуемых).

    Преобразование в Z-показатель производится по формуле:

где Z– стандартныйZ-показатель;

X– первичный результат тестового измерения;

M x – средняя величина результатов выборки (в нашем случае медианаMe);

S x – стандартное отклонение для данной выборки. Найдите полученный показатель наZ-шкале (рисунок 2) и сделайте вывод о проявлении изучаемого признака у данного испытуемого.

    Преобразование в T-шкалу для опросников Мак-Колла производится по уже известной формуле (Zp=A+bZ), подставляя вместо константA=M = 50;b== 10 – полученные Мак-Коллом в результате нормализации эмпирических распределений собственных опросников, переведём результат испытуемого (X=45) в стандартныеT-баллы по формуле:

Таким образом, результат – 25 T-баллов (стандартных баллов).

    Преобразование в шкалу станайнов Гилфорда (англ.standardnine– стандартная девятка), где оценкам присваивают целые значения от 1 до 9, приM = 5, = 2 производятся по формуле:

В данном случае результат испытуемого будет 1 станайн (т.к. полученный результат C = 0 попал в интервал 1-го станайна).

Данная C-шкала обладает таким замечательным свойством (см. рисунок 2), что в 1 и 9 станайны попадает по 4% испытуемых всей выборки, во 2 и 8 станайны – по 7%, и т.д. Таким образом, при ранжированном упорядочивании в сторону возрастания первичных тестовых результатов и условии их нормального (или близкому к нормальному) распределения первым 4% данных присваивается 1 станайн, последующим 7% данных – 2-ой станайн, следующим 12% данных – 3-й станайн и т.д., таким образом, данные будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

    Преобразование в шкалу стенов Кэттела (от англ.standardten– стандартная десятка) для опросника 16PF, где оценкам присваивают целые значения от 1 до 10, приM = 5;= 2 производят по формуле:

В данном случае результат испытуемого попадает в интервал 1-го стена.

В тестировании интеллекта используются нормализованные шкалы:

    Шкала Векслера представленнаяIQ-стандартными баллами:

    Шкала структуры интеллекта Амтхауэра по формуле:

С целью интерпретации данных для работников образования представляет интерес шкала Линерта:

    Шкала школьных оценок Линерта:

Рис.2. Нормальная кривая и стандартные показатели.

Рис. 1.1. Схема вычисления стандартных оценок (стенов) по фактору N 16-

факторного личностного опросника Р. Б. Кеттелла; снизу указаны интервалы в единицах 1/2 стан­дартного отклонения

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значе­ния будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; δ=2,4, вправо мы откладываем 1/2δ т.е. 1,2 "сырых" балла. Таким образом, гра­ница интервала составит: (10,2 + 1,2) = 11,4 "сырых" балла. Итак, границы ин­тервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4 баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2δ и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения - 9 и 10. Если испы­туемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он по­лучил 11 "сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т. д.

В принципе, шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки п>200 и нормальном рас­пределении признака 2 .

Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении при­знака в окрестности среднего значения группируется большая часть всех наблюде­ний, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2). Следовательно, такая процентнльная шкала является равноинтервальной толь­ко относительно накопленной частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).

Рис. 1.2. Процентильная шкала; сверху для сравнения указаны интервалы в единицах стандартного отклонения

О нормальном распределении см. Пояснения в вопросе 3.

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закрепле­на. Однако каким путем мы оказались на ней? Измерили некую психо­логическую переменную по шкале порядка, подсчитали средние и стан­дартные отклонения, а затем получили, наконец, интервальную шкалу. "Такому нелегальному использованию статистики может быть дано из­вестное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам" (Стивенс С, 1960, с. 56).

Многие исследователи не проверяют степень совпадения получен­ного ими эмпирического распределения с нормальным распределением, и тем более не переводят получаемые значения в единицы долей стан­дартного отклонения или процентили, предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают скошенное, срезан­ное по краям или двухвершинное распределение. На Рис. 1.3 представле­но распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью мож­но считать нормальным (х 2 =12,7 при v=9, М=89,75, δ= 25,1).

Рис. 1.3. Гистограмма и плавная кривая распределения показателя мышечного волевого усилия (п=102)

На Рис. 1.4 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини "Уровень успеха, ко­торого я должен был достичь уже сейчас" (n=356). Распределение зна­чимо отличается от нормального

(χ 2 = 58,8, при v=7; p

Рис. 1.4. Гистограмма и плавная кривая распределения показателя должного успеха (n =356)

С такими "ненормальными" распределениями приходится встре­чаться очень часто, чаще, может быть, чем с классическими нормаль­ными. И дело здесь не в каком-то изъяне, а в самой специфике психо­логических признаков. По некоторым методикам от 10 до 20% испы­туемых получают оценку "ноль" - например, в их рассказах не встреча­ется ни одной словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки (см. в. 5.3).

Методы статистической обработки, предлагаемые в настоящем руководстве, в большинстве своем не требуют проверки совпадения по­лученного эмпирического распределения с нормальным. Они построены на подсчете частот и ранжирования. Проверка необходима только в случае применения дисперсионного анализа. Именно поэтому соответст­вующая глава сопровождается описанием процедуры подсчета необхо­димых критериев.

Во всех остальных случаях нет необходимости проверять степень совпадения полученного эмпирического распределения с нормальным, и тем более стремиться преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были измерены переменные - в се­кундах, миллиметрах, градусах, количестве выборов и т. п. - все эти данные могут быть обработаны с помощь непараметрических критери­ев 3 , составляющих основу данного руководства.

Определение и описание («параметрических критериев дано ниже в данной главе.

Шкала равных отношений - это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности изме­ряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике абсолютная нулевая точка отсчета встречается при измерении длин от­резков или физических объектов и при измерении температуры по шка­ле Кельвина с абсолютным нулем температур. Считается, что в психо­логии примерами шкал равных отношений являются шкалы порогов аб­солютной чувствительности (Стивене С, 1960; Гайда В. К., Захаров В. П., 1982). Возможности человеческой психики столь велики, что трудно представить себе абсолютный нуль в какой-либо измеряемой психологической переменной. Абсолютная глупость и абсолютная чест­ность - понятия скорее житейской психологии.

То же относится и к установлению равных отношений: только метафора обыденной речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.

Абсолютный нуль, правда, может иметь место при подсчете ко­личества объектов или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем альтернативу Б. Однако при этом измерено не психологическое свойст­во человека, а соотношение выборов у 42 человек.

По отношению к показателям частот возможно применять все арифметические операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале отношений - 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали: к универсальной шкале измерения в частотах встречаемости того или иного значения признака и к единице измерения, которая представляет собой 1 наблю­дение. Расклассифицировав испытуемых по ячейкам номинативной шка­лы, мы можем применить потом высшую шкалу измерения - шкалу от­ношений между частотами.

Вопрос 3 Распределение признака. Параметры распределения

Распределением признака называется закономерность встречаемо­сти разных его значений (Плохинский Н.А., 1970, с. 12).

В психологических исследованиях чаще всего ссылаются на нор­мальное распределение.

Нормальное распределение характеризуется тем, что крайние зна­чения признака в нем встречаются достаточно редко, а значения, близ­кие к средней величине - достаточно часто. Нормальным такое распре­деление называется потому, что оно очень часто встречалось в естест­венно-научных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального распределения представляет собой привычную глазу психолога-исследователя так на­зываемую колоколообразную кривую (см, напр., Рис. 1.1, 1.2).

Параметры распределения - это его числовые характеристики, указывающие, где "в среднем" располагаются значения признака, на­сколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не па­раметрами, а их приближенными значениями, так называемыми оценка­ми параметров. Это объясняется ограниченностью обследованных выбо­рок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду юс оценки.

Среднее арифметическое (оценка математического ожидания) вы­числяется по формуле:

где x i - каждое наблюдаемое значение признака;

i - индекс, указывающий на порядковый номер данного зна­чения признака;

n - количество наблюдений;

∑ - знак суммирования.

Оценка дисперсии определяется по формуле:

где X i - каждое наблюдаемое значение признака;

x - среднее арифметическое значение признака;

п - количество наблюдений.

Величина, представляющая собой квадратный корень из несме­щенной оценки дисперсии (S), называется стандартным отклонением или средним квадратнческим отклонением. Для большинства исследова­телей привычно обозначать эту величину греческой буквой δ (сигма), а не S. На самом деле, δ - это стандартное отклонение в генеральной совокупности, a S - несмещенная оценка этого параметра в исследован­ной выборке. Но, поскольку S - лучшая оценка δ (Fisher R.A., 1938), эту оценку стали часто обозначать уже не как S, а как δ:

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторон­ней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрица­тельной - более высокие (см. Рис. 1.5).

Показатель асимметрии (А) вычисляется по формуле:

Для симметричных распределений А=0.


Рис. 1.5. Асимметрия распределений.

А) Левая, положительная

Б) правая, отрицательная

В тех случаях, когда какие-либо причины способствуют преиму­щественному появлению средних или близких к средним значений, об­разуется распределение с положительным эксцессом. Если же в рас­пределении преобладают крайние значения, причем одновременно и бо­лее низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (Е) определяется по формуле:

Рис. 1.6. Эксцесс: а) положительный; б) отрицательный

В распределениях с нормальной выпуклостью Е=0.

Параметры распределения оказывается возможным определить только по отношению к данным, представленным по крайней мере в интервальной шкале. Как мы убедились ранее, физические шкалы длин, времени, углов являются интервальными шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней мере, с формальной точки зрения. Параметры распределения не учитывают

истинной психологической неравномерности секунд, миллиметров и других физических единиц измерения.

На практике психолог-исследователь может рассчитывать пара­метры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.


Полученные в исследовании эмпирические данные подлежат проверке на распределение их в выборках по отношению к средней (арифметической, медиане или моде).

Распределением признака называется закономерность встречаемости разных его значений . В психологических исследованиях чаще всего ссылаются на нормальное распределение.

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение – модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Число таких факторов велико, а эффект влияния каждого из них в отдельности очень мал. Такой характер взаимовлияний весьма характерен для психических явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако так бывает не всегда, поэтому в каждом случае форма распределения должна быть проверена. Характер распределения выявляется главным образом с целью определиться в методах математико-статистической обработки данных.

Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось «нормой» всякого массового случайного проявления признаков. График нормального распределения представляет собой привычную глазу психолога-исследователя так называемую колоколообразную кривую (рис. А).

Рис. А. Кривая нормального распределения

Параметры распределения – это его числовые характеристики, указывающие, где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака . Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не параметрами, а их приближенными значениями, так называемыми оценками параметров. Это объясняется ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду их оценки.

Для определения способов математико-статистической обработки прежде всего необходимо оценить характер распределения данных по всем используемым параметрам (признакам). Для параметров (признаков), имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики, которые во многих случаях являются более мощными, чем методы непараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения.

Если характер распределения показателей психологического признака является нормальным или близким к нормальной форме распределения признака, описываемой кривой Гаусса, то мы можем использовать параметрические методы математической статистики как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками по f-критерию Стьюдента, F-критерию Фишера, коэффициент корреляции Пирсона и др.

Если кривая распределения показателей психологического признака далека от нормальной, то мы вынуждены будем использовать методы непараметрической статистики: расчет достоверности отличий по критерию Q Розенбаума (для малых выборок), по критерию U Манна – Уитни, коэффициент ранговой корреляции Спирмена, факторный, многофакторный, кластерный и другие методы анализа.

Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, насколько данная методика соответствует (т. е. «работает», валидна) данной выборке.

Для нормального распределения характерно следующее:

а) все три средние совпадают;

б) кривая распределения частот и значений совершенно симметрична по отношению к средней, т. е. слева и справа от нее лежит 50% вариантов; в интервале от М -lo до М +1о находится 68,26% всех вариантов; в интервале от М -2о до М +2о лежит 95,44% вариантов.

В психологии существует ряд шкал, основанных на нормальном распределении и имеющих разные значения М и σ. Распределения различных измеренных в эксперименте признаков имеют разные величины М и σ. Переводя полученные первичные оценки разных признаков к распределению с одними и теми же М и σ, мы получаем больше возможностей для оценки и сопоставления их варьирования. Сделать это нам позволяет использование нормированного отклонения . Нормированное отклонение показывает, на сколько сигм отклоняется та или иная варианта от среднего уровня варьирующего признака (средней арифметической) , и выражается формулой:

где Хi

М

σ – стандартное отклонение.

С помощью нормированного отклонения можно оценить любое полученное значение по отношению к группе в целом, взвесить его отклонение и одновременно освободиться от именованных величин. Для того чтобы избавиться от отрицательных чисел, к полученной величине t обычно прибавляют какую-либо константу.

С учетом этих соображений весьма удобна шкала Г-баллов. Для этой шкалы принято нормальное распределение, имеющее М = 0, σ = 10.

Рис. Б. Расчет нормального распространения по шкале Г-баллов

Для пересчета берется константа, равная 50. Формула преобразования сырых оценок в Г-баллы следующая:

где Хi – значение признака (в «сырых» баллах);

М – средняя арифметическая признака;

σ – стандартное отклонение.

Для облегчения и алгоритмизации практической работы психолога существуют специальные таблицы перевода «сырых» баллов, например, базовых шкал теста СМИЛ (адаптированный вариант теста MMPI, разработан Л. Н. Собчик), теста МЛО «Адаптивность» в стандартные Г-баллы.

Наиболее широкое распространение получил способ приведения нормированных оценок к виду, удобному для практического применения, предложенный Р. Б. Кэттеллом (1970, 1973), который представляет перевод исходных тестовых оценок в 10-балльную равноинтервальную шкалу. Это достигается путем разбиения оси тестовых оценок на 10 интервалов, соответствующих долям стандартного отклонения.

Рис. В. Нормальное распространение для равноинтервальных шкал

При этом среднее арифметическое по группе принимается за среднюю точку и ей присваивается значение, равное 5,5 балла по стандартной 10-балльной шкале. Всякая оценка в интервале (М + 0,25 σ) переводятся в 6 баллов, а оценка в (М – 0,25 σ) дает стандартный балл, равный 5,0. Любое дальнейшее увеличение или уменьшение тестовой оценки на 0,5 σ увеличивает или уменьшает стандартную оценку на 1 балл.

Таким образом, для создания стеновой шкалы и вычисления ее пограничных значений «сырых» баллов можно использовать следующую таблицу (при условии нормального распределения признака или близкого к нормальному).

1 стен = М – 2,25 σ

2 стен = М – 1,75 σ

3 стен = М – 1,25 σ

4 стен = М – 0,75 σ

5 стен = М – 0,25 σ

6 стен = М + 0,25 σ

7 стен = М + 0,75 σ

8 стен = М + 1,25 σ

9 стен = М + 1,75 σ 10 стен = М + 2,25 σ

Перевод отдельных «сырых» баллов в стены может выполняться и без создания стеновой шкалы, а непосредственно по общей формуле:

где Хi – значение признака (в «сырых» баллах);

М – средняя арифметическая признака;

А – заданное стандартное отклонение;

С – заданное среднее значение;

σ – стандартное отклонение значений признака.

Таким образом, практический смысл процедуры нормирования состоит, например, в том, что выражение «сырых» значений шкал в Г-баллах позволяет сравнивать шкалы профиля личности между собой (для опросников СМИЛ, МЛО «Адаптивность» и др.). Так, в пределах нормы считаются личностные характеристики, показатели которых не выходят за пределы 40 –70 Г-баллов. Все значения, превышающие эти границы, рассматриваются как акцентуации характера той или иной степени выраженности (в отдельных случаях – до уровня патологических проявлений).