» » Какие виды связи между переменными вы знаете. Виды связи между переменными

Какие виды связи между переменными вы знаете. Виды связи между переменными
  • PR - public relations (общественные связи): цели и задачи, области их использования, инструменты PR.
  • V. Виды обязательств по их содержанию, в связи с основаниями возникновения обязательств
  • VII. Министерствам и ведомствам по молодежной политике стран-участниц Международной конференции
  • Зависимая переменная не чувствительна к изменениям независимой.

    Монотонно возрастающая зависимость: увеличению значений независимой переменной соответствует изменение зависимой переменной.

    Монотонно убывающая зависимость: увеличению значений независимой переменной соответствует уменьшение уровня зависимой переменной.

    Аналитическая форма зависимости между изучаемой парой

    признаков (регрессионная функция) определяется с помощью

    следующих методов:

    1) на основе визуальной оценки характера связи. На линей$

    ном графике по оси абсцисс откладываются значения фактор$

    ного (независимого) признака x, по оси ординат - значения

    результативного признака y. На пересечении соответствую$

    щих значений отмечаются точки. Полученный точечный гра$

    фик в указанной системе координат называется корреляцион$

    ным полем. При соединении полученных точек получается

    эмпирическая линия, по виду которой можно судить не только

    о наличии, но и о форме зависимости между изучаемыми пе$

    ременными;
    3.Экономические модели и типы статистических данных, используемых в них
    К наиболее распространённым эконометрическим моделям относятся:

    модели потребительского и сберегательного потребления;
    модели взаимосвязи риска и доходности ценных бумаг;
    модели предложения труда;
    макроэкономические модели (модель роста);
    модели инвестиций;
    маркетинговые модели;
    модели валютных курсов и валютных кризисов и др.

    Статистические и математические модели экономических явлений и процессов определяются спецификой той или иной области экономических исследований. Так, в экономике качества модели, на которых основаны статистические методы сертификации и управления качеством - модели статистического приемочного контроля, статистического контроля (статистического регулирования) технологических процессов (обычно с помощью контрольных карт Шухарта или кумулятивных контрольных карт), планирования экспериментов, оценки и контроля надежности и другие - используют как технические, так и экономические характеристики, а потому относятся к эконометрике, равно как и многие модели теории массового обслуживания (теории очередей). Экономический эффект только от использования статистического контроля в промышленности США оценивается как 0,8 % валового национального продукта (20 миллиардов долларов в год), что существенно больше, чем от любого иного экономико-математического или эконометрического метода.
    Каждой области экономических исследований, связанной с анализом эмпирических данных, как правило, соответствуют свои эконометрические модели. Например, для моделирования процессов налогообложения с целью оценки результатов применения управляющих воздействий (например, изменения ставок налогов) на процессы налогообложения должен быть разработан комплекс соответствующих эконометрических моделей. Кроме системы уравнений, описывающей динамику системы налогообложения под влиянием общей экономической ситуации, управляющих воздействий и случайных отклонений, необходим блок экспертных оценок. Полезен блок статистического контроля, включающий как методы выборочного контроля правильности уплаты налогов (налогового аудита), так и блок выявления резких отклонений параметров, описывающих работу налоговых служб. Подходам к проблеме математического моделирования процессов налогообложения посвящена монография , содержащая также информацию о современных статистических (эконометрических) методах и экономико-математических моделях, в том числе имитационных.

    С помощью эконометрических методов следует оценивать различные величины и зависимости, используемые при построении имитационных моделей процессов налогообложения, в частности, функции распределения предприятий по различным параметрам налоговой базы. При анализе потоков платежей необходимо использовать эконометрические модели инфляционных процессов, поскольку без оценки индекса инфляции невозможно вычислить дисконт-функцию, а потому нельзя установить реальное соотношение авансовых и «итоговых» платежей.

    Прогнозирование сбора налогов может осуществляться с помощью системы временных рядов - на первом этапе по каждому одномерному параметру отдельно, а затем - с помощью некоторой линейной эконометрической системы уравнений, дающей возможность прогнозировать векторный параметр с учетом связей между координатами и лагов, то есть влияния значений переменных в определенные прошлые моменты времени. Возможно, более полезными окажутся имитационные модели более общего вида, основанные на интенсивном использовании современной вычислительной техники.
    4. Основные этапы эконометрического моделирования
    Выделяют семь основных этапов эконометрического моделирования:

    1) постановочный этап, в процессе осуществления которого определяются конечные цели и задачи исследования, а также совокупность включённых в модель факторных и результативных экономических переменных. При этом включение в эконометрическую модель той или иной переменной должно быть теоретически обоснованно и не должно быть слишком большим. Между факторными переменными не должно быть функциональной или тесной корреляционной связи, потому что это приводит к наличию в модели мультиколлинеарности и негативно сказывается на результатах всего процесса моделирования;

    2) априорный этап, в процессе осуществления которого проводится теоретический анализ сущности исследуемого процесса, а также формирование и формализация известной до начала моделирования (априорной) информации и исходных допущений, касающихся в частности природы исходных статистических данных и случайных остаточных составляющих в виде ряда гипотез;

    3) этап параметризации (моделирования), в процессе осуществления которого выбирается общий вид модели и определяется состав и формы входящих в неё связей, т. е. происходит непосредственно моделирование.

    К основным задачам этапа параметризации относятся:

    а) выбор наиболее оптимальной функции зависимости результативной переменной от факторных переменных. При возникновении ситуации выбора между нелинейной и линейной функциями зависимости, предпочтение всегда отдаётся линейной функции, как наиболее простой и надёжной;

    б) задача спецификации модели, в которую входят такие подзадачи, как аппроксимация математической формой выявленных связей и соотношений между переменными, определение результативных и факторных переменных, формулировка исходных предпосылок и ограничений модели.

    4) информационный этап, в процессе осуществления которого происходит сбор необходимых статистических данных, а также анализируется качество собранной информации;

    5) этап идентификации модели, в ходе осуществления которого происходит статистический анализ модели и оцененивание неизвестных параметров. Данный этап непосредственно связан с проблемой идентифицируемостимодели, т. е. ответа на вопрос «Возможно ли восстановить значения неизвестных параметров модели по имеющимся исходным данным в соответствии с решением, принятым на этапе параметризацииβ». После положительного ответа на этот вопрос решается проблема идентификации модели, т. е. реализуется математически корректная процедура оценивания неизвестных параметров модели по имеющимся исходным данным;

    6) этап оценки качества модели, в ходе осуществления которого проверяется достоверность и адекватность модели, т. е. определяется, насколько успешно решены задачи спецификации и идентификации модели, какова точность расчётов, полученных на её основе. Построенная модель

    должна быть адекватна реальному экономическому процессу. Если качество модели является неудовлетворительным, то происходит возврат ко второму этапу моделирования;

    7) этап интерпретации результатов моделирования.

    №5 Эконометрический анализ производственного процесса

    Рассматривая эконометрическое исследование в целом, в нем можно выделить следующие этапы:

    1. Постановка проблемы, т. е. определение цели и задач исследования, выделение зависимых (уj) и независимых (xk) экономических переменных на основе качественного анализа изучаемых взаимосвязей методами экономической

    2. Сбор необходимых исходных данных.

    3. Построение эконометрической модели и оценка ее адекватности и степени соответствия исходным данным.

    4. Использование модели для целей анализа и прогнозирования параметров исследуемого явления.

    5. Качественная и количественная интерпретация полученных на основе модели результатов.

    6. Практическое использование результатов. В процессе экономической интерпретации результатов необходимо ответить на следующие вопросы: 12

    – являются ли статистически значимыми объясняющие факторы, важные с теоретической точки зрения?

    – соответствуют ли оценки параметров модели качественным представлениям?

    №6. Парный регрессионный анализ

    Регрессией в теории вероятностей и математической статистике принято называть зависимость среднего значения какой-либо величины (y) от некоторой другой величины или от нескольких величин (хi).

    Парной регрессией называется модель, выражающая зависимость среднего значения зависимой переменной y от одной независимой переменной х

    где у – зависимая переменная (результативный признак); х – независимая,

    объясняющая переменная (признак–фактор).

    Парная регрессия применяется, если имеется доминирующий фактор, обуславливающий большую долю изменения изучаемой объясняемой переменной, который и используется в качестве объясняющей переменной.

    Множественной регрессией называют модель, выражающую зависимость среднего значения зависимой переменной y от нескольких независимых переменных х1, х2, …, хp

    ŷ = f (x1,x2,...,xp).

    Классическая нормальная модель линейной множественной регрессии.

    По виду аналитической зависимости различают линейные и нелинейные регрессии.

    Линейная парная регрессия описывается уравнением: ŷ=a+bx

    Если между экономическими явлениями существуют нели­нейные соотношения, то они выражаются с помощью соответ­ствующих нелинейных функций: например, равносторонней ги­перболы , параболы второй степени и д.р.

    №7. . Линейная парная регрессия. Определение параметров уравнения регрессии

    Линейная парная регрессия описывается уравнением: ŷ=a+bx, согласно которому изменение Δy переменной y прямопропорционально изменению Δx переменной x (Δy = b·Δx). Для оценки параметров a и b уравнения регрессии (2.6) воспользуемся методом наименьших квадратов (МНК). При определенных предположениях относительно ошибки ε МНК дает наилучшие оценки параметров линейной

    модели. Модель парной линейной регрессии : y = a +b*x +u (y- зависимая переменная, a +b*x – неслучайная составляющая, х – независимая переменная, u- случайная составляющая)


    1 | | | | | | | |

    Анализ данных начинается с перевода «сырых» данных в осмысленную информации и включает их введение в компьютер, проверку на предмет ошибок, кодирование, представление в матричной форме (табулирование). Все это называется преобразованием исходных данных.

    Далее проводится статистический анализ, т.е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов. После сбора данных необходимо их преобразовать, т.е. привести к более сжатому виду, удобному для анализа и обладающему достаточной для заказчика информацией. Обычно закодированные исходные данные представляются в виде матрицы, столбцы которой содержат ответы на различные вопросы анкеты, а ряды -- респондентов или изучаемые ситуации. Преобразование заключается в описании данных матрицы на языке ограниченного числа мер, характеризующих собранные данные. Табулирование помогает исследователю понять, что означают собранные данные. Одновременный анализ двух и более категорий опрашиваемых называется перекрестной табуляцией. Исследователь, осуществляя преобразование, старается найти зави­симости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения.

    Выделяют, по крайней мере, следующие четыре функции преобра­зования данных: обобщение, определение концепции (концептуализация), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция). Из-за неспособности человека анализировать большие массивы ин­формации необходимо исходные собранные данные представить в удобном для осмысления виде, т.е. их необходимо обобщить, выразить через ограниченное число понятных параметров.

    Большинство статистических мер основано на конкретных предпо­ложениях, которые определяют базу анализа собранных данных. Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок определенной марки продукта вырабатывает у исследователя одно суждение (концепцию), сильный -- другое.

    Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера, как «мода», то она исполь­зуется при представлении полученных результатов, если нет, то результаты описываются на общепринятом языке.

    Экстраполяция в данном случае предполагает определение, в какой степени данные выборки можно обобщить на всю совокупность. Определение и интерпретация связей между двумя переменными В связях не всегда имеются причинно-следственный характер, а могут иметь просто статистическую природу. В поставленных вопросах можно определенно говорить о влиянии одного фактора на другой. Однако степень влияния изучаемых факторов может быть различной; скорее всего, влияние могут оказывать также какие-то другие факторы. Выделяют четыре типа связей между двумя переменными: немонотонная, монотонная, линейная и криволинейная.

    Немонотонная связь характеризуется тем, что присутствие (отсутствие) одной переменной систематически связано с присутствием (отсут­ствием) другой переменной, но ничего неизвестно о направлении этого взаимодействия (приводит ли, например, увеличение одной переменной к увеличению или уменьшению другой). Например, известно, что посетители закусочных в утренние часы предпочитают заказывать кофе, а в середине дня -- чай.

    Немонотонная связь просто показывает, что утренние посетители предпочитают также заказывать яйца, бутерброды и бисквиты, а в обеденное время скорее заказывают мясные блюда с гарниром.

    Монотонная связь характеризуется возможностью указать только общее направление связи между двумя переменными без использования каких-либо количественных характеристик. Нельзя сказать, насколько, например, определенное увеличение одной переменной приводит к увеличению другой переменной.

    Существуют только два типа таких связей: увеличение и уменьшение. Например, владельцу обувного магазина известно, что более взрослые дети обычно требуют обувь больших размеров. Однако невозможно четко установить связь между конкретным возрастом и точным размером обуви.

    Линейная связь характеризует прямолинейную зависимость между двумя переменными. Знание количественной характеристики одной переменной автоматически предопределяет знание величины другой переменной:

    Где у -- оцениваемая или прогнозируемая зависимая переменная (ре­зультативный признак); а -- свободный член уравнения; х -- независимая переменная (факторный признак), используемая для определения зависимой переменной. b -- коэффициент регрессии, измеряющий среднее отношение от­клонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения -- вариация у, приходящаяся на единицу вариации х.

    Коэффициенты а и b рассчитываются на основе наблюдений величин у и х с помощью метода наименьших квадратов.

    Криволинейная связь характеризует связь между переменными, носящую более сложный характер по сравнению с прямой линией. Например, связь между переменными может описываться S-об разно и кривой.

    В зависимости от своего типа связь может быть охарактеризована путем определения: ее присутствия (отсутствия), направления и силы (тесноты) связи. Присутствие характеризует наличие или отсутствие систематической связи между двумя изучаемыми переменными; оно имеет статистическую природу. Проведя испытание статистической значимости, определяют, существует ли зависимость между данными. Если результаты исследования отвергают нулевую гипотезу, это говорит о том, что зависимость между данными существует.

    В случае монотонных линейных связей последние могут быть описаны с точки зрения их направления -- в сторону увеличения или уменьшения. Связь между двумя переменными может быть сильной, умеренной, слабой или отсутствовать. Сильная зависимость характеризуется высокой вероятностью существования связи между двумя переменными, слабая -- малой вероятностью.

    Существуют специальные процедуры для определения указанных выше характеристик связей. Первоначально надо решить, какой тип связей может существовать между двумя изучаемыми переменными. Ответ на этот вопрос зависит от выбранной шкалы измерений.

    Шкала низкого уровня (наименований) может отразить только не­точные связи, в то время как шкала отношений, или интервальная, -- очень точные связи. Определив тип связи (монотонная, немонотонная), надо установить, существует ли эта связь для генеральной совокупности в целом. Для этого проводятся статистические испытания.

    После того как найдено, что для генеральной совокупности суще­ствует определенный тип связи, устанавливается ее направление. Наконец, необходимо установить силу (тесноту) связи.


    Наиболее распространенным способом социологического анализа является выявление взаимосвязи между переменными.

    Термин переменная заимствован социологией из области математики и логики. Однако используется он в социологии в ином значении. Если в математике под переменной используется символ, вместо которого могут быть подставлены любые числа, то в социологии под переменной понимается то свойство или отношение исследуемых социальных явлений, которое может иметь большую или меньшую степень интенсивности и тем самым может быть редуцировано к числу. Так, свойство «возраст» может иметь множество значений. Свойство «биологический пол» имеет два значения

    Понятие переменной относительно, так как зависит и от природы исследуемого свойства, допускающей тот или иной спектр дробления, и от принятой системы измерения.

    Для переменных в социологии существует определенная классификация, использование которой значительно облегчает задачи выравнивания условий функционирования экспериментальной и контрольных групп и последующий контроль за ними в ходе эксперимента.

    В процессе исследования следует различать Экспериментальные и Не экспериментальные Переменные. Экспериментальные переменные в свою очередь, делятся на Зависимые И Независимые переменные.

    Независимую переменную можно рассматривать как причину (фактор), а зависимую как следствие (результат) воздействия независимой переменной.

    Неэкспериментальные Переменные отражают те свойства и отношения исследуемого объекта, которые в равной степени действуют и в экспериментальной и в контрольной группах. Поэтому их называют Нейтральными.

    Среди нейтральных переменных выделяются Неизменяющиеся и изменяющиеся переменные. К первым относятся те характеристики объекта, о которых известно, что в течение всего периода исследования они останутся без изменения. Следовательно, они требуют меньшего контроля. Ко вторым - те переменные, изменения которых возможны, и часто трудно прогнозируемы. Основное внимание (в отношении контроля) должно быть уделено этим переменным. Типологию переменных Г. А.Андреева представила в следующей схеме:

    Связь различных переменных специфику и механизм функционирования исследуемого объекта. Социолог прослеживает, как изменяются одни переменные с изменением других. Если увеличение, например, такой независимой переменной как возраст ведет к увеличению производительности труда (зависимая переменная), то можно прийти к выводу о положительной (прямой) зависимости между переменными. Обратная зависимость (большеи меньше) свидетельствует об отрицательной связи.

    Однако существует опасность прийти к ложному выводу, если не учитываетсяСкрытая переменная - незамеченная причина (обстоятельство), влияющее на исследуемое свойство. Так, у женщин, или у молодых рабочих могут оказаться низкие показатели в труде, что может дать повод к выводу об определяющей роли пола и возраста в труде. В то же время могут оказаться незамеченными исследователем такие скрытые независимые переменные, как квалификация и опыт.

    Макс Вебер обнаружил у англичан - протестантов более высокую степень предпринимательской активности чем у англичан - католиков. Отсюда он пришел к выводу об определяющей роли протестантской этики в развитии капитализма. Однако он не учитывал такую Скрытую Переменную, как отстранение в XVIII веке протестантов от государственной деятельности, что способствовало ориентации их активности на другие сферы, в том числе и предпринимательскую.

    социологический исследование выборка

    Виды взаимосвязей между признаками. 3

    Коэффициент корреляции. 8

    Коэффициент корреляции Бравэ-Пирсона. 11

    Ограничения использования коэффициента корреляции. 13

    Проверка значимости корреляции. 14

    Ранговая корреляция. 15

    Множественная корреляция. 16

    Библиографический список. 20


    Виды взаимосвязей между признаками

    Еще Гиппократ обратил внимание на то, что между телосложением и темпераментом людей, между строением их тела и предрасположенностью к заболеваниям существует определенная связь.
    Чаще всего рассматриваются простейшие ситуации, когда в ходе исследования измеряют значения только одного варьирующего признака генеральной совокупности. Остальные признаки либо считаются постоянными для данной совокупности, либо относятся к случайным факторам, определяющим варьирование исследуемого признака. Как правило, исследования в спорте значительно сложнее и носят комплексный характер. Например, при контроле за ходом тренировочного процесса измеряется спортивный результат, и одновременно может оцениваться целый ряд биомеханических, физиологических, биохимических и других параметров (скорость и ускорения общего центра масс и отдельных звеньев тела, углы в суставах, сила мышц, показатели систем дыхания и кровообращения, объем физической нагрузки и энергозатраты организма на ее выполнение и т. д.). При этом часто возникает вопрос о взаимосвязи отдельных признаков. Например, как зависит спортивный результат от некоторых элементов техники спортивных движений? как связаны энергозатраты организма с объемом физической нагрузки определенного вида? насколько точно по результатам выполнения некоторых стандартных упражнений можно судить о потенциальных возможностях человека в конкретном виде спортивной деятельности? и т. п. Во всех этих случаях внимание исследователя привлекает зависимость между различными величинами, описывающими интересующие его признаки.

    Этой цели служит математическое понятие функции, имеющее в виду случаи, когда определенному значению одной (независимой) переменной Х, называемой аргументом , соответствует определенное значение другой (зависимой) переменной Y, называемой функцией . Однозначная зависимость между переменными величинами Y и X называется функциональной , т.е. Y = f(X) (“игрек есть функция от икс”).
    Например, в функции Y = 2X каждому значению X соответствует в два раза большее значение Y . В функции Y = 2X 2 каждому значению Y соответствует 2 определенных значения X .

    Но такого рода однозначные или функциональные связи между переменными величинами встречаются не всегда. Известно, например, что между ростом (длиной тела) и массой человека существует положительная связь: более высокие индивиды имеют обычно и большую массу, чем индивиды низкого роста. То же наблюдается и в отношении качественных признаков: блондины, как правило, имеют голубые, а брюнеты - карие глаза. Однако из этого правила имеются исключения, когда сравнительно низкорослые индивиды оказываются тяжелее высокорослых, и среди населения хотя и нечасто, но встречаются кареглазые блондины и голубоглазые брюнеты. Причина таких “исключений” в том, что каждый биологический признак, выражаясь математическим языком, является функцией многих переменных; на его величине сказывается влияние и генетических и средовых факторов, в том числе и случайных, что вызывает варьирование признаков. Отсюда зависимость между ними приобретает не функциональный, а статистический характер , когда определенному значению одного признака, рассматриваемого в качестве независимой переменной, соответствует не одно и то же числовое значение, а целая гамма распределяемых в вариационный ряд числовых значений другого признака, рассматриваемого в качестве независимой переменной. Такого рода зависимость между переменными величинами называется корреляционной или корреляцией (термин “корреляция” происходит от лат. correlatio - соотношение, связь). При этом данный вид взаимосвязи между признаками проявляется в том, что при изменении одной из величин изменяется среднее значение другой.
    Если функциональные связи одинаково легко обнаружить и на единичных, и на групповых объектах, то этого нельзя сказать о связях корреляционных, которые изучаются только на групповых объектах методами математической статистики.

    · Существует ли связь между исследуемыми переменными?

    · Как измерить тесноту связей?

    Общая схема взаимосвязи параметров при статистическом исследовании приведена на рис. 1.

    Рис 1. Взаимосвязь параметров при статистическом исследовании

    На рисунке S – модель исследуемого реального объекта, Объясняющие (независимые, факторные) переменные описывают условия функционирования объекта. Случайные факторы – это факторы, влияние которых трудно учесть или влиянием которых в данный момент пренебрегают. Результирующие (зависимые, объясняемые) переменные характеризуют результат функционирования объекта.

    Выбор метода анализа взаимосвязи осуществляется с учетом природы анализируемых переменных.

    Корреляция – это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

    Различают парную, частную и множественную корреляцию.

    Парная корреляция – это связь между двумя признаками (результативным и факторным или между двумя факторными).

    Частная корреляция – это связь между двумя признаками (результативным и факторным или между двумя факторными) при фиксированном значении других факторных признаков.

    Множественная корреляция – это связь между результативным и двумя или более факторными признаками, включенными в исследование.

    В зависимость от количества признаков, включенных в модель, корреляционная связь может быть однофакторной (или парной) и многофакторной (или множественной).

    Корреляционный анализ – это раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Корреляционный анализ заключается в количественном

    Задача корреляционного анализа сводится к установлению направления и формы связи между признаками, измерению ее тесноты и к оценке достоверности выборочных показателей корреляции.
    Корреляционная связь между признаками может быть линейной и криволинейной (нелинейной), положительной и отрицательной.

    Прямая корреляция отражает однотипность в изменении признаков: с увеличением значений первого признака увеличиваются значения и другого, или с уменьшением первого уменьшается второй.

    Обратная корреляция указывает на увеличение первого признака при уменьшении второго или уменьшение первого признака при увеличении второго.
    Например, больший прыжок и большее количество тренировок - прямая корреляция, уменьшение времени, затраченного на преодоление дистанции, и большее количество тренировок - обратная корреляция.

    Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения (x i , y i ) двух признаков. Если экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений x i и y i . При этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.
    Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения x i и y i .
    Когда исследуется корреляция между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель отображает зависимость между переменными величинами x i и y i г рафически в виде геометрического места точек в системе прямоугольных координат. Эту графическую зависимость называются также диаграммой рассеивания или корреляционным полем .

    При исследования корреляции используются графический и аналитический подходы.

    Графический анализ начинается с построения корреляционного поля. Корреляционное поле (или диаграмма рассеяния) является графической зависимостью между результатами измерений двух признаков. Для ее построения исходные данные наносят на график, отображая каждую пару значений (xi,yi) в виде точки с координатами xi и yi в прямоугольной системе координат.

    Визуальный анализ корреляционного поля позволяет сделать предположение о форме и направлении взаимосвязи двух исследуемых показателей. По форме взаимосвязи корреляционные зависимости принято разделять на линейные (см. рис. 2) и нелинейные (см. рис. 3). При линейной зависимости огибающая корреляционного поля близка к эллипсу. Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (или убывать) по линейному закону.

    Рис 2. Линейная статистическая связь Рис 3. Нелинейная статистическая связь

    Направление связи является положительным, если увеличение значения одного признака приводит к увеличению значения второго (см. рис. 4) и отрицательным, если увеличение значения одного признака приводит к уменьшению значения второго (см. рис. 5).

    Зависимости, имеющие только положительные или только отрицательные направленности, называются монотонными.

    Коэффициент корреляции

    Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Вид коэффициента корреляции и, следовательно, алгоритм его вычисления зависят от шкалы, в которой производятся измерения изучаемых показателей и от формы зависимости.

    Значение коэффициента корреляции может изменяться в диапазоне от -1 до +1:

    Абсолютное значение коэффициента корреляции показывает силу взаимосвязи. Чем меньше его абсолютное значение, тем слабее связь. Если он равен нулю, то связь вообще отсутствует. Чем больше значение модуля коэффициента корреляции, тем сильнее связь и тем меньше разброс в значениях при каждом фиксированном значении . Знак коэффициента корреляции определяет направленность взаимосвязи: минус – отрицательная, плюс – положительная (см. рис. 6).

    Рис.6. Корреляционные поля при различных значениях коэффициента корреляции

    Рис.7. Коэффициенты корреляции при различной форме корреляционного поля.

    Коэффициент корреляции отражает линейную зависимость и совсем не подходит для описания сложных, нелинейных зависимостей (нижняя строка).

    Достаточно условно может быть использована следующая классификация взаимосвязей по значению коэффициента корреляции (см. табл. 1).

    Таблица 1. Интерпретация значений коэффициент корреляции

    Согласно исследованию научных публикаций в наиболее престижных зарубежных журналах, посвященных социальным и поведенческим наукам (Ч.Теддли, М.Элайс, 2010), 77% всех социологических исследований проведены в рамках количественного подхода. Из них 71% является корреляционными исследованиями или исследованиями, посвященными изучению связей между социальными явлениями.

    Самый простой вид корреляционных исследований - изучение парных взаимосвязей или совместной изменчивости двух переменных. Такого рода исследования пригодны для решения двух научных задач:

    а) доказательства существования причинно-следственной связи между переменными (наличие связи является важным, но не единственным, условием причинно-следственной зависимости);

    б) предсказания: в случае наличия связи между переменными можно с определенным уровнем точности предсказывать значения одной переменной, если нам известно значение другой.

    Связь между двумя переменными есть в том случае, когда изменение категории одной переменной ведет к изменению распределения второй:

    Легко заметить, что в зависимости от категории переменной "Удовлетворенность работой" переменная "Продуктивность труда" меняет свое распределение. Следовательно, мы можем сделать вывод о существовании связи между переменными.

    Также из этого примера видно, что каждому из значений одной переменной отвечает несколько значений другой. Такие связи называются статистическими или вероятностными. В данном случае, связь между переменными не является абсолютной. В нашем случае это означает, что кроме удовлетворенности работой есть и другие факторы, влияющие на продуктивность труда.

    В случае же, когда одному значению первой переменной соответствует лишь одно значение второй, говорят о функциональных связях. Вместе с тем, даже когда есть основания говорить о функциональной связи, невозможно на все 100% продемонстрировать ее в эмпирической действительности по двум причинам: а) из-за погрешности измерительных инструментов; б) из-за невозможности контроля всех условий окружающей среды, влияющих на эту связь. И поскольку в социальных науках ученые имеют дело именно с вероятностными связями, постольку ниже речь пойдет именно о них.

    Парные связи владеют тремя характеристиками: силой, направлением и формой.

    Сила показывает насколько согласованна изменчивость двух переменных. Сила связи может изменяться в диапазоне от 0 до +1 (если хотя бы одна из переменных относится к номинальной шкале) или от -1 до +1 (если обе переменные относятся, по крайней мере, к порядковой шкале). При этом 0 и близкие к ней величины говорят об отсутствии связи между переменными, а величины близкие к +1 (прямая связь) или -1 (обратная связь) - о сильной связи. Один из вариантов интерпретации связи, с точки зрения ее силы, выглядит следующим образом:

    Все значения в таблице приведены в модуле, т.е. должны анализироваться безотносительно к знаку. Так, например, связь -0,67 и +0,67 являются одинаковыми по силе, но разными по направлению.

    Сила связи определяется с помощью коэффициентов корреляции. К коэффициентам корреляции относятся, например, фи и V-крамера (номинальные переменные, мало категорий/табличный вид), Гамма (порядковые переменные, мало категорий/табличный вид), Кендалла и Спирмена (порядковые переменные, много категорий), Пирсона (метрические переменные, много категорий).

    Направление говорит о характере взаимного изменения категорий переменных. Если с увеличением значений одной переменной значения другой переменной также увеличиваются, то связь является прямой (или положительной). Если же ситуация противоположная и увеличение значений одной переменной ведет к уменьшению значений второй, то связь обратная (или отрицательная).

    Направление связи может иметь место только в тех случаях, когда речи идет о порядковых и/или метрических переменных, то есть тех переменных, значения которых можно упорядочить от меньших к большим или наоборот. Таким образом, если хотя бы одна переменная относится к номинальной шкале, то можно говорить только о силе связи и ее форме, но не о направлении.

    Направление связи можно определить либо с помощью таблиц сопряженности (мало категорий), либо с помощью диаграммы рассеяния (много категорий), либо с помощью знака коэффициента корреляции (количество категорий переменных не имеет значения):

    А. Определение направления связи с помощью таблицы сопряженности.

    Б. Определение направления связи с помощью диаграммы рассеяния.

    В. Определение направления связи с помощью коэффициентов корреляции.

    Форма связи указывает на особенности совместной изменчивости двух переменных. В зависимости от того, к какой шкале относится переменная, форму связи можно проанализировать либо с помощью столбчатой диаграммы/таблицы сопряженности (если хотя бы одна переменная является номинальной), либо с помощью диаграммы рассеяния (для порядковых и метрических шкал).

    Выделяют несколько видов связи между переменными.

    · Корреляционная зависимость предполагает взаимную согласованность изменений переменных величин, а также то, что эти изменения можно измерить однократно или многократно (в данном случае говорят о плотности связи переменных, но не о причинно-следственных связях); например, в современном российском обществе чем выше возраст, тем ниже социальный статус человека; отдельные проявления геронтократии эту закономерность не нарушают



    · Функциональное воздействие предполагает, что изменения независимой переменной сопровождаются все более ускоряющимися изменениями зависимой переменной (причинно-следственные связи фиксируют влияние независимой переменной на зависимую); например, чем более радикальными политическими взглядами обладает человек, тем в большей степени он не приемлет существующий политический режим; в то же время нельзя утверждать, что чем в большей степени человек негативно оценивает власть, тем более радикальными взглядами он обладает

    · Функциональная зависимость - связь переменных, означающая, что изменение одной переменной оказывает воздействие на изменение другой, которая в свою очередь воздействует на первую переменную, т.е. это связи взаимодействия; например, информированность человека

    о политике напрямую связана с интересом к ней; чем больше человек политикой интересуется, тем больше в ней разбирается. Связь может быть нелинейной и немонотонной

    Каким бы в итоге ни оказался тип связи между переменными, необходимо убедиться в ее наличии в принципе. Корреляционный анализ применяется для выяснения взаимодействия и тенденций изменения характеристик изучаемого явления.

    Корреляция - наличие статистической взаимосвязи признаков, когда каждому определенному значению одного признака X соответствует определенное значение Y (или комплекс значений У-ряда распределения). Корреляционный анализ выясняет функциональную зависимость между переменными величинами, которая характеризуется тем, что каждому значению одной из них соответствует вполне определенное значение другой. Однако корреляционный анализ не предполагает выявления каузальных связей, поэтому при интерпретации результатов формулировки типа «переменная х влияет на переменную у» или «переменная х зависит от переменной у» недопустимы. Различают парную и множественную корреляции. Парная корреляция

    характеризует тип, форму и плотность связи между двумя признаками, множественная - между несколькими. Корреляционная зависимость возникает чаще всего там, где одно явление находится под воздействием большого числа факторов, действующих с разной силой, поэтому существуют специальные меры корреляционной связи, называемые коэффициентами корреляции. Коэффициенты (в статистике их общее количество исчисляется десятками) показывают степень взаимосвязи явлений (плотность корреляционной связи, иногда исследователи говорят об интенсивности связи) и характер этой связи (направленность). Связь может быть прямой и обратной. Например, чем старше избиратель, тем более активно он участвует в выборах. Чем выше уровень доходов людей, тем в меньшей степени они склонны участвовать в выборах в качестве избирателей (обратная связь). Чем выше коэффициент корреляции между двумя переменными, тем точнее можно предсказать значения одной из них по значениям другой. Характер связи также определяется в категориях «монотонная» (направление изменения одной переменной не меняется при изменении второй переменной) и «немонотонная» связь. Помимо оценки плотности и направленности связи необходимо учитывать надежность (достоверность) связи.

    44 . Корреляционный анализ. Проблема ложной корреляции. Коэффициенты корреляции: виды и условия использования.

    Корреляционный анализ применяется для выяснения взаимодействия и тенденций изменения характеристик изучаемого явления.

    Первоначальной стадией его развития считается период 1870- 1880-х годов, а автором понятия «коэффициент корреляции» - Фрэнсис Гальтон. Наиболее серьезные разработки в области корреляционного анализа на рубеже XIX-XX вв. выполнил Карл Пирсон. Традиционно корреляционный анализ используется для проверки гипотезы о статистической зависимости двух или нескольких переменных. В качестве вспомогательного средства анализ корреляций можно использовать при проверке пригодности экспериментальных гипотез и для включения переменных в факторный и регрессионный анализ.

    Корреляционный анализ осуществляется с помощью сравнения и сопоставления рядов распределения, построенных на основании группировок по различным признакам.

    Корреляция - наличие статистической взаимосвязи признаков, когда каждому определенному значению одного признака X соответствует определенное значение Y (или комплекс значений У-ряда распределения). Корреляционный анализ выясняет функциональную зависимость между переменными величинами, которая характеризуется тем, что каждому значению одной из них соответствует вполне определенное значение другой. Однако корреляционный анализ не предполагает выявления каузальных связей, поэтому при интерпретации результатов формулировки типа «переменная х влияет на переменную у» или «переменная х зависит от переменной у» недопустимы. Различают парную и множественную корреляции. Парная корреляция характеризует тип, форму и плотность связи между двумя признаками, множественная - между несколькими. Корреляционная зависимость возникает чаще всего там, где одно явление находится под воздействием большого числа факторов, действующих с разной силой, поэтому существуют специальные меры корреляционной связи, называемые коэффициентами корреляции. Коэффициенты (в статистике их общее количество исчисляется десятками) показывают степень взаимосвязи явлений (плотность корреляционной связи, иногда исследователи говорят об интенсивности связи) и характер этой связи (направленность). Связь может быть прямой и обратной. Например, чем старше избиратель, тем более активно он участвует в выборах. Чем выше уровень доходов людей, тем в меньшей степени они склонны участвовать в выборах в качестве избирателей (обратная связь). Чем выше коэффициент корреляции между двумя переменными, тем точнее можно предсказать значения одной из них по значениям другой. Характер связи также определяется в категориях «монотонная» (направление изменения одной переменной не меняется при изменении второй переменной) и «немонотонная» связь. Помимо оценки плотности и направленности связи необходимо учитывать надежность (достоверность) связи.

    Корреляционный анализ последовательно решает три практические задачи:

    1) определение корреляционного поля и составление корреляционной (в данном случае это комбинированная) таблицы;

    2) вычисление выборочных корреляционных отношений или коэффициентов корреляции;

    3) проверка статистической гипотезы значимости связи.

    Коэффициент корреляции не содержит информации о том, является ли данная связь между ними причинно-следственной или сопутствующей (порожденной общей причиной).

    Для установления корреляционной связи между двумя признаками необходимо доказать, что все другие переменные не оказывают воздействия на отношения двух переменных, являющихся предметом изучения. В противном случае возникает ситуация ложной корреляции. Секрет возникновения ложной корреляции заключается в том, что у двух явлений, связь которых формально подкрепляется наличием статистической связи, есть общая причина, в равной степени влияющая на каждое из них.

    Во многих случаях статистически фиксируемая связь между признаками может быть объяснена третьей переменной.

    Для выяснения типа связи является перспективным представление данных в виде графика, который позволяет визуально оценить степень рассеяния значений переменных. Особое внимание следует обратить на наличие «выбросов» (экстремально большие или малые значения признака), показывающих существенные отклонения от линии регрессии - условной прямой, которая показывает характер связи между

    признаками на графике. Для выяснения факторов, определяющих причинно-следственную связь между переменными, прибегают к пат-анализу. Чтобы избежать ошибки в ситуации ложной корреляции, используют анализ взаимосвязи двух переменных с помощью контрольного (опосредующего) фактора. Итак, корреляционный анализ позволяет отбросить несуществующие или несущественные связи.

    Специально следует оговорить, что для получения достоверных данных необходимо обеспечить достаточно большое число наблюдений, поскольку необоснованно сокращая объем выборки, мы снижаем уровень надежности полученных выводов о статистических зависимостях. Следовательно, необходимы специальные знания статистических расчетов. Операции по расчету коэффициентов корреляции осуществляют программы PC, но необходимо хотя бы иметь представление об элементарных процедурах анализа.

    Корреляционному анализу предшествует стадия расчета статистики х2- Но на основании полученного значения статистики х2 мы ничего не можем сказать о плотности связи анализируемых переменных.

    Для решения такой задачи необходимо обратиться к коэффициентам корреляционной связи.

    Различные коэффициенты корреляции могут принимать значения от - 1 до + 1 или от 0 до +1. Специально следует оговорить, что значения коэффициентов, которые принимаются как статистически значимые, значительно разнятся между собой для различных видов коэффициентов корреляции

    качестве предварительного замечания отметим, что принято признавать «сверхсильной» связью показатели корреляции свыше |±0,8|, «сильной» - от |±0,6| до |±0,8|, «умеренной» - от |±0,4| до |±0,6|, «слабой » - от |±0,2| до |±0,4|, связь отсутствует при показателях коэффициентов корреляции до |±0,2|. Применительно к значению коэффициента корреляции, приближающемуся к +1, обычно используют обозначение «строгая положительная корреляция» (perfect positive correlation), а к коэффициенту корреляции, равному -1, - «строгая отрицательная корреляция» {perfect negative correlation). А. Бююль и П. Цёфель, а также А. С. Ахременко предлагают несколько иной вариант интерпретации: до |±0,2| - очень слабая корреляция, от |+0,2| до |±0,5| - слабая корреляция, от |+0,5| до 1+0,7| - средняя корреляция, от |±0,7| до |±0,9| - высокая корреляция, свыше |±0,9| - очень высокая корреляция. Отметим, что высокие значения корреляции в реальных политических исследованиях встречаются крайне редко. И действительной исследовательской удачей является обнаружение просто статистически значимого коэффициента корреляции.

    Важным показателем оценки коэффициента корреляции является показатель уровня значимости. Для корреляционного анализа он, как и для статистики хи-квадрат, не должен превышать 0,05 (р < 0,05), т.е. вероятность ошибки - подмена устойчивой статистически обоснованной случайной связи - не превышает 5%. Показатель уровня значимости является расчетным, однако как для статистики х2, так и для корреляционного анализа этот показатель формально принимают за константу.

    Основные положения совпадают с требованиями к билету №43,увеличится лишь размерность таблицы и надо после раскрытия основных положений, сходных с билетом 43, -перечислить основные методики анализа связи между несколькими переменными- а именно- метод хи квадрат(билет 45), регрессионный анализ, корреляционный анализ, кластерный, анализ, сетевой анализ, факторный анализ.

    45.Статистика хи-квадрат (х 2)

    Статистический анализ полученных с помощью массового опроса данных, как и анализ наблюдений изучаемого явления или статисти­ческих данных, включает несколько уровней сложности и возможно­стей получения дополнительной (скрытой) информации. В социальных и политических исследованиях результат наблюде­ний, подтверждающий справедливость выдвинутой гипотезы, крайне редко выступает основанием для ее принятия как истинной, поскольку он может также сочетаться и с рядом других объяснительных гипотез.

    Тест хи-квадрат используется для двухвходовых таблиц сопряжен­ности. Схема проведения:

    1. Строится таблица сопряженности

    2. Затем формулируют нулевую и альтернативную гипо­тезы. Нулевая гипотеза (H f) - утверждение, отрицающее зависимость между радами переменных. Альтернативная гипотеза (HJ - гипотеза о наличии связи между при­знаками.

    3. Заполняется альтернатиная таблица по формуле: произведение соответ­ствующих маргинальных частот (значения строки и столбца) делят на общее число респондентов

    4. Вычесление величины x-квадрат по формуле

    Х 2 =Σ х (n-n 1) 2 /n 1

    Уровень х-квадрат определяет вероятность отклонения исследуемого показателя.

    46. Корреляционный анализ

    Основные понятия корреляционного анализа

    Выделяют несколько видов связи между переменными: Корреляционная зависимостьпредполагает взаимную согласован­ность изменений переменных величин, а также то, что эти изменения можно измерить однократно или многократно.

    Функциональное воздействие предполагает, что изменения не­зависимой переменной сопровождаются все более ускоряющимися изменениями зависимой переменной. Функциональная зависимость - связь переменных, означающая, что изменение одной переменной оказывает воздействие на изменение другой, которая в свою очередь воздействует на первую переменную.

    Корреляция - наличие статистической взаимосвязи признаков, когда каждому определенному значению одного признака X соответ­ствует определенное значение У.

    Корреляционный анализ выясняет функциональную за­висимость между переменными величинами, которая характеризуется тем, что каждому значению одной из них соответствует вполне опреде- тенпое значение другой.



    Различают парную и множественную корреляции. Парная корреля­ция характеризует тип, форму и плотность связи между двумя призна­ками, множественная - между несколькими.

    Корреляционная зависимость возникает чаще всего там, где одно явление находится под воздействием большого числа факторов, дей­ствующих с разной силой, поэтому существуют специальные меры корреляционной связи, называемые коэффициентами корреляции.

    Корреляционный анализ последовательно решает три практиче­ские задачи:

    1) определение корреляционного поля и составление корреляци­онной таблицы;

    2) вычисление выборочных корреляционных отношений или ко­эффициентов корреляции;

    3) проверка статистической гипотезы значимости связи.

    Коэффициент корреляции не содержит информации о том, явля­ется ли данная связь между ними причинно-следственной или сопут­ствующей.

    Для установления корреляционной связи между двумя призна­ками необходимо доказать, что все другие переменные не оказывают воздействия на отношения двух переменных, являющихся предметом изучения.

    Регрессионный анализ.

    Регрессионный анализ - один из методов многомерного статисти­ческого анализа данных, объединяющий совокупность статистических приемов, предназначенных для изучения или моделирования связей между одной зависимой и несколькими (или одной) независимыми переменными.

    Множественный регрессионный анализ – это метод установления зависимости одной переменной от двух или более независимых переменных. В то время как зависимая переменная (та переменная, которую Вы хотите предсказать) должна быть непрерывной (за исключением логистической регрессии), независимые переменные могут быть как прерывными, так и категориальными, такими как «пол» или «тип применяемого препарата». В случае категориальных независимых переменных необходимо будет создавать переменные «пустышки», а не использовать соответствующие значения.



    Процедура:

    возможно выполнение в 2 вариантах:

    · стандарт­ном (когда одновременно учитываются все независимые переменные)

    · пошаговом (прямом и обратном) вариантах.

    С помощью прямого пошагового действия в регрессионном анализе последовательно включаются переменные - начиная с той, ко­торая наиболее тесно коррелирует с зависимой переменной. Процедура продолжается, пока включение новых независимых переменных обеспе­чивает прирост коэффициента множественной корреляции, тем самым определяется оптимальный максимальный набор переменных. При ис­пользовании обратного пошагового метода машина последовательно от­брасывает независимые переменные, которые наиболее слабо коррели­руют с зависимой переменной (т.е. обладают наименьшей объясняющей способностью), оставляя оптимальный минимум.

    Современные статистические программы (например SPSS) позволяют рассчитывать не только различные варианты линейной регрессии, но и нелинейные регрессии. Однако при анализе данных, полученных с помощью опросов (и мас­совых, и экспертных), чаще всего используется модель линейной ре­грессии.