Аннотация
Опрос проводился с 01.07.08 по 02.09.09 на сайте Бизнес-тренер.
Анализ проведен с целью установить основные параметры и показатели выборки перед модификацией методики расчета.
В исследовании приняло участие 1877 респондентов.
При таком объеме выборки удивительным является не наличие значимых различий, а наоборот – отсутствие значимых различий!
Содержание
- Очистка данных
- Анализ факторов (группировка респондентов)
- Анализ показателей (по всей выборке)
- Анализ различий по факторам
- Заключение
1. Очистка данных
Статистическая обработка предполагает, что рассматриваемые случаи образуют однородную выборку для каждого из уровней фактора и их комбинаций. Поэтому данные следует тщательно просмотреть с целью исключения «выбросов» — ошибок, противоречий, нехарактерных случаев и т.п.
2 респондента не представили данных по факторам. При этом один не представил данных по трем факторам. Оба этих респондента исключены из дальнейшего анализа.
Наиболее «засоренным» оказалось распределение по возрасту. Программа SPSS рекомендовала рассматривать как выбросы все случаи с возрастом, большим 45. Однако, возраст в 46 лет я все же оставил.
Исключены случаи, в которых, например 17-летний школьник имеет высшее образование или ученую степень. Даже если это соответствует реальности и не является ошибкой ввода или «приколом», эти случаи все же весьма нехарактерны.
2. Анализ факторов (группировка респондентов)
Для группировки респондентов запрашивались следующие факторы:
- Пол (номинальная)
- Соц. положение (номинальная)
- Мат. положение (порядковая/номинальная)
- Образование (порядковая/номинальная)
- Возраст (интервальная)
Рассмотрим возможности видоизменить их для получения более однородных групп.
2.1. Кластеризация респондентов
Применим 2-шаговый кластерный анализ для выделения возможных групп. Выделено два кластера, при этом значимыми оказались только переменные Возраст, Образование и Соц. положение. Поскольку естественно ожидать сильной корреляции факторов Образование и Соц. положение с фактором Возраст, то основной переменной, разделяющей респондентов на группы, является именно Возраст. При этом контрольным значением является 26 лет – именно это значение разбивает респондентов на два кластера наилучшим образом. Формально – это медиана переменной Возраст.
2.2. Пол
Распределение по кластерам имеет вид:
Как видим, доли мужчин и женщин в кластерах очень близки, что подтверждает и критерий хи-квадрат. Его значение равно 0,521, что соответствует р=0,47.
Значимость различия в долях может быть оценена по угловому критерию Фишера (укФ). Его критические значения равны 2,81 (р=0,001), 2,31 (р=0,01) и 1,64 (р=0,05). Как видим, выборка сильно несбалансированна по полу.
2.3. Образование
Распределение по кластерам имеет вид:
Более наглядно это видно на диаграмме:
Отметим следующие особенности фактора Образование. Как видим, уровень неполн. высшее тяготеет скорее к двум нижним, нежели к верхним. Для уровня неполн. высшее полагается закончить не менее 3-х полных курсов вуза. Поэтому студент 1-3 курса должен отвечать — среднее. Но 261 респондент, указавшие себя как студенты с неполн. высшим, имели возраст от 17 до 27 лет. Из них 99 — от 17 до 20. Они формально не имели права относить себя к позиции незаконченное высшее. Можно понять гордость первокурсника, но любой преподаватель вуза знает, сколько школярства на младших (!) курсах. Так что в данной выборке «по иерархии» получается, что уровень ср. спец-ное будет повыше, чем неполн. высшее. Все это, конечно, не способствует однородности групп и вносит свою долю в смазывание результатов.
Похоже, что наблюдается 3-уровневая градация: (начальное + среднее), (ср. спец. + неполн. высшее) и (высшее + уч. степень). Введение этот фактора (назовем его Уровень образования) снимает проблему «кто круче» — ср. спец-ное или неполн. высшее:
Как показывает укФ, доли людей со средним образованием в одном кластере и спец-ным образованием в другом различаются значимо. В то же время доли среднего и спец-го в одном кластере не отличаются значимо от доли высшего в другом кластере.
Поэтому реально просматривается всего два уровня:
Как видим, здесь различие долей наконец-то незначимо.
Проверим таблицу сопряженности:
Значение критерия хи-квадрат равно 0,252, что значительно ниже критического. Следовательно, несбалансированность выборки по полу тут не сказывается.
Итак, получаем такие возможности исследования при учете фактора Образование:
- Образование (как есть)
- Уровень образования
- Наличие высшего образования
Заранее сказать, какое преобразование принесет наиболее интересные и значимые результаты, на данном этапе, конечно, нельзя. Поэтому анализ данных всегда и есть их исследование – с выдвижением гипотез и их проверкой.
2.4. Материальное положение
Распределение по кластерам имеет вид:
Позиция отказ сильно портит картину. Во-первых, она лишает этот фактор порядкового характера, что снижает возможности анализа. Однако заметим, что уровни очень плохое и отказ мало различаются по принадлежности к кластерам. Это дает основания полагать, что выбор респондентом позиции отказ на самом деле обусловлен его нежеланием обнародовать свое очень плохое мат. положение. Поэтому в дальнейшем разумно объединить эти позиции в одну – очень плохое. Тогда фактор Мат. положение станет действительно порядковым, что позволит использовать более мощные статистики. Такой фактор назван Мат. положение 2.
Более того, представляется разумным «огрубить» предложенные уровни и данного фактора, объединив в один очень плохое, плохое и отказ, хорошее и очень хорошее, оставив уровень среднее без изменений. Такой фактор назовем Уровень мат. положения:
Проверены коэффициенты полной и частной корреляции (по Пирсону) для трех переменных, характеризующих оценку мат. положения, и переменной Образование, которая имеет почти порядковый характер. В качестве контрольной переменной при вычислении частной корреляции взята переменная Возраст. Результаты таковы:
Прежде всего, отметим отрицательную связь между образованием и материальным положением как для полной, так и для частной корреляции (при контрольной переменной Возраст). При этом связь незначима, что удивительно (объем выборки!).
Но первый вариант (отказ = очень плохое) приводит к значимой положительной (хоть и не такой большой, как хотелось бы…) связи между образованием и материальным положением, чего мы интуитивно и ожидаем. Контрольная переменная Возраст несколько снижает (что естественно) и сам коэффициент корреляции, и его значимость, но сохраняет знак r.
2.5. Социальное положение
Данный фактор носит чисто качественный характер и вряд ли поддается переводу в порядковую шкалу. Укрупнение категорий на основе принадлежности к кластерам вряд ли оправдано – оно сильно привязано к возрасту. Но, ввиду малочисленности, позиции военнослужащий и пенсионер были добавлены в другое.
Частоты и доли:
Диаграмма:
2.6. Возраст
Ввиду громоздкости таблицы частот приведем только гистограмму:
Распределение явно не имеет нормального характера, что подтверждается и двумя критериями:
(a) Учтена поправка значимости Лильефорса.
Укрупним переменную Возраст. Т.к. имеется 30 значений (от 17 до 46 включительно), это можно сделать различными способами, объединяя соседние частоты: по две (15 значений), по три (10), по 5 (6) или по 6 (5). Какое именно укрупнение следует выбрать – задача не из простых.
Это преобразование основано исключительно на свойствах самой шкалы и не имеет отношения к распределению частот. Но возможен и другой подход – статистический, при котором границы новых интервалов выбираются, исходя из параметров имеющегося распределения – это нормализация различного вида.
Можно провести и другие преобразования шкалы, что позволит, м.б., уловить некоторые другие закономерности. Однако, при отсутствии обоснованных границ для выделения возрастных групп приходится заниматься их выявлением на основании только имеющихся данных, что неизбежно приводит к ограничению получаемых выводов только данной выборкой. Строго говоря, надо исследовать получаемые результаты при различных подходах и выбрать тот, при котором они будут наиболее выразительны для интерпретатора. Возникающие проблемы обсуждены тут. И они весьма серьезны…
Я остановился на слиянии в одну позицию трех соседних значений, получив тем самым новую переменную Возраст3:
Гистограмма полученной переменной уже является вполне гладкой, хотя само распределение, конечно же, далеко от нормального:
Однако оно позволяет сформулировать качественные отличия разных возрастов в показателях якорей карьеры.
Введем и разбиение по квартилям, создав новую порядковую переменную Возрастная группа:
3. Анализ показателей (по всей выборке)
3.1. Статистики
Последние две колонки таблицы показывают результаты теста Колмогорова-Смирнова на нормальность: Z – статистика, р — асимптотическая двухсторонняя значимость отличия.
Как видим, разброс (SE, стандартная ошибка среднего) из-за большого объема выборки очень мал, поэтому его будет плохо видно на диаграмме. Так что в качестве разброса выведено стандартное отклонение s.
Поскольку распределение большинства показателей сильно отличается от нормального, построим диаграмму с непараметрическими статистиками (столбик – медиана, линии с засечками – 1-й и 3-й квартили):
Особой разницы между диаграммами нет, но по межквартильным расстояниям можно судить о форме распределения.
3.2. Распределения
Для более четкого представления о распределении значений показателей мы произведем укрупнение диапазонов, заменяя одним значением все значения из интервалов:
Значения, превышающие 7 баллов, выделены голубым цветом и обозначают, по мнению авторов методики, что данная ориентация ярко выражена.
Естественно, что все расчеты производятся с точными значениями показателей.
Соответствующие гистограммы приведены ниже. Числа — доли по выборке.
3.3. Предпочтения
Рассматрим значения показателей как «ансамбль», характеризующий якоря карьеры в целом, как объекты сравнения. Для этого введем центрированные средние, нормированные специальным образом на диапазон [-1; 1] (т.н. предпочтения). Отрицательные значения говорят о том, что показатель данного ЯК ниже среднего уровня оценок. Т.е., этот ЯК менее важен по сравнению с другими ЯК.
Как видим, именно стабильность места жит-ва является наиболее несущественной для респондентов выборки. Об этом говорит и её мода, равная 1 – наименьшему возможному значению. В то же время ни один из 5-ти позитивно предпочитаемых ЯК не является абсолютным лидером. Но следует отметить все-таки преобладание показателя стабильность работы как наиболее существенного среди прочих.
Поскольку именно показатели, связанные со стабильностью, образуют «полюса» отношений, то следует признать правильным разделение якоря стабильность, введенного Э.Шейном, на два. Скорее всего, обусловлено это особенностями нашей социально-политической ситуации и отражает возросшее значение работы как источника к существованию, при этом люди для его сохранения готовы к мобильности.
Низкое значение показателя профкомпетентность отражает тот факт, что при общей нестабильности значение ранее «наработанных» навыков и умений снижается. И респонденты это чутко отражают в своих предпочтениях. Низкие значения показателей вызов и предпринимательство вкупе с высоким значением стабильность работы отражают, скорее всего, нежелание рисковать в ситуации общей нестабильности.
Тем не менее, тяга к независимости (автономия) и целостности (интеграция стиля жизни) остаются довольно существенными, уступая лишь желанию иметь нечто более высокое, чем просто существование (служение). Как отражение желания справиться с ситуацией можно интепретировать и позитивное отношение к управлению людьми (менеджмент), хотя оно и весьма невелико.
В целом можно сказать, что выборка дала результаты, которые вполне укладываются в предполагаемые оценки ситуации. Впрочем, возможности интерпретации ограничены лишь воображением исследователя, и всегда можно заявить, что именно этого-то мы и ожидали!
3.4. Связи между показателями
Помимо полученных предпочтений показателей, нас интересует, как они взаимосвязаны между собой в сознании (подсознании, психике, …) респондента. Т.е., какую структуру они образуют.
3.4.1. Корреляции
Корреляции между показателями (всего их 36) незначительны – среднее значение модулей равно 0,185. Это говорит о сравнительной независимости показателей при данной методике их получения.
Из-за объема выборки почти все корреляции весьма значимы. Но даже и в этом случае нашлись 3 незначимых – настолько малы их величины. Только 6 из 36 коэффициентов отрицательны. Максимальное значение связи равно 0,502, и наблюдается оно между показателями менеджмент и предпринимательство, что вполне ожидаемо.
Связи между показателями, обусловленные величиной корреляции между ними, можно изобразить в виде корреляционного графа:
На этом рисунке отражены лишь 13 из 36 линий связей. Толстой красной линией изображены связи, для которых коэффициент корреляции превосходит 0,4. Средней по толщине синей линией — от 0,3 до 0,4, а тонкой – от 0,2 до 0,3. Связи с величиной, меньшей 0,2, не отображались.
Как видим, вполне ожидаемая плеяда вызов — менеджмент — предпринимательство связана наиболее сильно и действительно выделяется как компактная часть структуры. М.б., они есть проявление и аспекты некоего единого фактора, который отражает активность личности. Близко примыкающие к ним автономия и служение тоже тесно связаны с ними и семантически. Вполне понятно и ожидаемо (да ну?) «центральное» положение показателя интегрированный стиль жизни, который обладает наибольшим числом сравнительно существенных связей (5 из 9 возможных).
Мерой связи каждого показателя со всеми остальными может служить сумма абсолютных значений коэффициентов корреляции. После её преобразования в предпочтения получим диаграмму:
Как видим, именно те три ЯК, которые образуют наиболее тесно связанную группу показателей, выделились и тут.
Построим «диаграмму рассеяния», чтобы отразить взаимосвязь между предпочтением показателя и степенью его связи с остальными:
Сразу выделяется три кластера. Менеджмент занимает промежуточное положение и на основании только этих данных пока не м.б. классифицирован. Однако удивительно то, что столь простые средства анализа уже выделяют основные элементы структуры показателей.
3.4.2. Кластеризация
Форма и цвет фигур, изображающих ЯК на корреляционном графе, выбраны в соответствии со структурой, которую образуют эти величины при иерархической кластеризации. Она производилась методом Уодда (Ward), в качестве меры расстояния было взято евклидово расстояние. Полученная дендрограмма имеет вид:
Кластеризация при прочих параметрах дает схожие результаты.
Другой способ получения структуры – факторный анализ – в данном случае неприменим, поскольку распределения далеки от нормальных. Но все же, для полноты картины и проверки, был применен метод главных компонент (вращение варимакс, сошлось за 5 итераций). «Сильные» связи на корреляционном графе были выявлены даже в этом случае! Это видно на матрице повернутых компонент (красным выделены значения, по модулю превосходящие 0,5):
А вот остальные показатели «не уложились» в ранее полученную структуру, при этом служение вообще оказалось «не у дел».
Это лишний раз свидетельствует о том, что порядок исследования может предопределить его выводы. Ведь начни мы именно с факторного анализа, установи критическое значение для компонент равным 0,45 – и мы «пристроим» служение, правда, получим при этом смешение компонент (от которого, кстати, не спасает даже косоугольное вращение). Да и интерпретация представляется более сложной и непрозрачной, нежели уже полученная нами.
3.4.3. Многомерное шкалирование
Применив метод PROXSCAL, получим координаты точек-образов, изображающих показатели, в некотором условном пространстве. Для двух измерений полученные координаты позволяют построить корреляционный граф, разместив центры объектов в соответствующих точках:
Как видим, многомерное шкалирование однозначно находит место для менеджмента, сливая его (как и в кластерном анализе!) вместе с вызовом и предпринимательством.
Пытаясь втиснуть в двумерное пространство структуру связей, неизбежно получаем сильные искажения этой структуры. Куда меньше она искажена в 3D-пространстве:
Оси были повернуты для наилучшей видимости образов. Тут куда лучше просматриваются три полученных кластера. При наличии тренированного пространственного воображения можно увидеть несомненное сходство изображенных структур. И даже найти такую точку зрения, с которой можно увидеть и двумерную проекцию, совпадающую с ранее показанной.
Но – сложно это все для «простого человека». Точнее – непривычно. При распространении такого рода представления данных они станут все более привычны и тем самым понятны. Ведь это – некий другой язык, освоение которого расширяет, и весьма значительно, возможности исследователя.
Конечно, возможны и другие способы и методы исследования выборки как целого, но мы ограничимся сделанным.
4. Анализ различий по факторам
4.1. Однородность групп
Отметим, что статистика предполагает однородность исследуемого ансамбля — все его случаи предполагаются полученными из одной генеральной совокупности. Пока мы постулировали такую однородность для нашей выборки, очистив её от «неверных» данных.
Но, конечно, наша выборка неоднородна по существу. Например, в ней есть мужчины и женщины. Заранее нельзя предполагать, что они «одинаковы» в том смысле, что все результаты будут тождественны для выборок, состоящих из одних только мужчин или женщин. Такие различия обязательно будут, скорее, отсутствие таких различий есть повод для серьезного исследования.
Поэтому, строго говоря, исследования, аналогичные только что сделанным, следует проводить для каждой группы респондентов. Такая группа выделяется по значениям факторов и/или их комбинациям. Отличие от сделанного только что – в необходимости сравнения таких групп в следующих отношениях:
- насколько разнятся показатели и существенно ли это различие;
- насколько значимо это различие и не объясняется ли оно простыми случайностями.
Строго говоря, и нашу выборку в целом тоже следовало бы сравнить с чем-то ещё (генеральной совокупностью, например). Но у меня таких данных нет.
4.2. Фактор: Пол
Напомню частоты, с которыми в выборке встречаются представители полов:
Таблица статистик громоздка и совершенно нечитабельна. Приведем лишь таблицу значимостей различий:
Поскольку никто, кроме исследователя, не может оценить, насколько велики, с его точки зрения, различия, то такое обсуждение обычно опускается. Ввиду его дискуссионности, естественно. Но значимость различий должна приводиться всегда.
Поскольку распределения, в основном, далеки от нормальных, то будем пользоваться в дальнейшем непараметрическими критериями значимости. В качестве основных выберем робастный критерий Брауна-Форсайта и критерий Краскелла-Уоллеса. При таких объемах выборки их различия между собой и другими тестами становятся малосущественными.
Удивительно, что все-таки есть два показателя, по которым гендерные различия незначимы — профкомпетентность и стабильность места жительства.
Поскольку распределения, как всегда, в большинстве своем далеки от нормального, приведем порядковые статистики для показателей (Q1 и Q3 – 1-й и 3-й квартили):
Графически это выглядит так:
Представим предпочтения групп:
Любопытным является различие в предпочтении предпринимательства – мужчины в общем оценили его чуть выше среднего, а вот женщины – куда ниже. Отметим, что женщины более полярны в своих оценках (синий прямоугольник чаще длиннее серого столбика).
Напомню, что в один кластер программа объединяет показатели, на которые респонденты данной группы дают наиболее схожие ответы. Имеется только одно гендерное различие в кластерных структурах показателей – показатель служение отнесен ими в разные кластеры:
Поскольку женщины составляют подавляющее большинство рассматриваемой выборки, то именно они и определили «базовую» структуру.
4.3. Предпочтения и показатели
Теперь можно конкретно показать принципиальное различие между балльными оценками нескольких объектов (в нашем случае – якорей карьеры, показателей) и предпочтениями.
Будучи центрированными и нормированными специальным образом, предпочтения выявляют внутреннюю структуру отношений к объектам, учитывая для каждого из них и оценки, полученные прочими объектами.
Отметим, что средние стабильности места жит-ва значимо отличаются для мужчин и женщин. А вот предпочтения для них одинаковы!!
Например, на диаграмме с данными различие в парах менеджмент и вызов выглядят как чисто количественные – в обоих случаях медиана у мужчин на 0,6 превышает её значение у женщин. В то же время предпочтения мало того, что противоположны по знаку (это ещё можно понять – средняя медиана все-таки разная), но ведь они ещё и противоположны по величине!
Это означает, что
- балльные оценки нескольких объектов и вычисленные на их основе предпочтения принципиально отличаются друг от друга
Ведь любой показатель, полученный по балльной шкале, никак не связан с другими показателями. Предпочтения же описывают структуру отношений респондента к группе объектов, которые рассматриваются как единое целое.
Более подробно см. https://psytest.wordpress.com/preferen/
4.4. Фактор: Возраст
Частоты для данного фактора после укрупнения и разбиения на возрастные группы были уже приведены раньше.
Проверим нормальность распределения по каждому показателю в каждом возрасте (одновыборочный критерий Колмогорова-Смирнова):
Что любопытно – в среднем с возрастом растет и нормальность распределения. Причем по всем показателям, хотя число случаев с тем же возрастом падает! Интерпретировать ли это как «стирание различий с возрастом»? как оригинальничание молодого поколения? как большее разнообразие характеров, возникающих в изменившейся обстановке? Вот тебе данные – твори, выдумывай, пробуй!
Проверим нормальность распределений в 4-х возрастных группах (одновыборочный критерий Колмогорова-Смирнова):
И хотя в некоторых группах распределение можно полагать мало отличающимся от нормального, всё-таки нет ни одного показателя, по которому все группы имели бы такое распределение.
Поскольку данные описывают «моментальный» срез, а не диахронику, то на самом деле происходит сравнение возрастных групп, сформировавшихся при различных социальных условиях. Грубо говоря, рубеж 90-х годов прошлого века отстоит от времени опроса на 18-19 лет, прибавим несколько лет на детство – получаем, что где-то от 25 до 35 лет проходит некий «рубеж».
Приведем несколько наиболее характерных графиков, отображающих такую «динамику». Заодно выведем и параболический тренд (синяя точечная линия) с указанием его уравнения и параметра качества подгонки R2. Заметим, что независимая переменная х в данном случае есть номер диапазона возрастов, зависимая у — это показатель.
Лучшая подгонка из всех! При этом минимум приходится на возраст 26-28 лет. Возможно, это говорит как о том, что старшее поколение ценит профессионализм, так и о том, что его начинает ценить и совсем молодое поколение.
Единственный показатель, для которого наблюдается чуть ли не скачкообразный рост при переходе через некий возрастной рубеж в районе 30-33 лет. Причем слева и справа от этого рубежа тренд явно линеен. Т.е., стабильность места жит-ва выделяет некий рубеж, близкий к ранее упомянутому, который и разбивает респондентов на две группы — «мобильный молодняк» и «оседлый взросляк». Возможно, при более подробном исследовании стоило бы проверить значения из этого диапазона как точки сечения фактора Возраст.
Можно вполне определенно сказать – служение как ценность-мотив теряет свои позиции у молодого поколения, причем довольно уверенно.
Явная волнообразность графика делает параболический тренд неприменимым. Чем обусловлена такая «динамика» — возрастными ли особенностями человека вообще или же спецификой нашей ситуации – сказать не берусь. Напомню только, что автор методики Э.Шейн называл этот показатель Entrepreneurial Creativity (=творчество, направленное на предпринимательство). Т.е., определяющее существительное в термине — это все-таки творчество!
Возможно, люди старшего поколения делали акцент именно на творческой компоненте этого мотива. Это можно было бы выяснить, анализируя ответы на конкретные вопросы, но таких данных по этой выборке у нас нет. М.б., требуется изменение термина, обозначающего данный якорь. А то и разбиение его на два — творчество как таковое и предпринимательскую активность. Кстати, именно проблемы подобного рода и привели нас к необходимости пронанализировать более внимательно данную методику. И, при необходимости, её модифицировать.
Более явственно изменения показателей с возрастом видны при рассмотрении предпочтений:
Отметим следующие особенности:
- Все предпочтения, кроме менеджмента, сохраняют свой знак во всех возрастах. Что, вообще говоря, вряд ли можно было ожидать с такой регулярностью.
- Предпочтения менеджмента у молодого поколения явно растут.
- Предпочтения служения у молодого поколения явно падают. Интересно, что именно этот показатель единственный достигает положительного максимума, причем у самых старших возрастов.
- Крайне низкие предпочтения для стабильности места жит-ва у респондентов с возрастом, не превосходящим 35 лет.
- Очень высокие предпочтения у стабильности работы, которые растут у более старших возрастов.
- Отношение к предпринимательству у молодого поколения хоть и остается негативным, но стабильно снижается. «Всплеск» негатива в группе 38-40 лет м.б. объяснен, например, тем обстоятельством, что в 90-е годы этим людям было по 18-25 лет, и у них могло сформироваться негативное отношение к бизнесу.
Представим предпочтения и в 4-х возрастных группах:
Как видим, качественная картина сохраняется, хоть и является, конечно, куда более грубой.
Сравним предпочтения самой молодой и самой пожилой групп:
За исключением менеджмента, знаки для всех предпочтений совпадают. Близки они только для профкомпетентности и стабильности места жит-ва. И только для автономии предпочтения у молодого поколения выражено сильнее, относительно остальных якорей карьеры предпочтения более ярко выражены у старшего.
Поскольку предпочтения описывают лишь качественную картину (для них неизвестны критерии значимости различий), значимость различий будем проверять для средних, используя только непараметрические критерии.
Проверим значимость имеющихся различий между различными уровнями для обоих вариантов укрупнения переменной Возраст, причем тремя непараметрическими тестами:
Как видим, показатель вызов не обнаруживает никакой возрастной динамики ни при каком укрупнении возраста. Остальные такую динамику проявляют при любом укрупнении шкалы.
Кластеризация показателей для каждого из 10-ти «3-летних возрастов» дает очень близкие структуры. Для краткости изобразим их таблично:
Как видим, 6 возрастов из 10 дали полностью совпадающие структуры (они выделены серым фоном в заголовке), причем она в точности совпадает с «базовой» (полученной по всей выборке). Впрочем, это и не удивительно – именно эти группы и составляли большинство, «задавившее» остальных. Но удивительно, что даже самая взрослая (и малочисленная) группа отличается от «базовой» структуры положением лишь двух элементов. Отметим, что в группах с большим возрастом стабильность места жит-ва вообще стоит особняком, составляя отдельный кластер. Хотя среднее значение этого показателя в них не сильно отличается от двух предыдущих.
Аналогичная кластеризация для 4-х возрастных групп дает структуры, полностью совпадающие как между собой, так и с «базовой». Т.е., при таком укрупнении шкалы все различия между её участками с т.зр. структуры исчезают.
4.5. Фактор: Образование
Ранее были приведены частоты для исходного фактора Образование и двух укрупненных факторов Уровень образования и Наличие высшего образования.
Приведем критерии для фактора Образование:
Как видим, при 6-ти уровнях фактора наибольшее число отклонений от нормального распределения наблюдается для уровней высшее и неполное высшее, они отсутствуют на уровнях начальное и ученая степень и малы на остальных. Непараметрические критерии значимости различий между показателями для различных уровней фактора показывают только два таких показателя – автономия и интегр. стиль жизни. Подозрительными (по критерию Джонкхиера-Терпстра) являются и обе стабильности.
Вот как выглядят графики для 6-уровневого фактора Образование:
Поскольку здесь выделены только участки шкалы баллов, то различия выглядят преувеличенными.
Незначительный объем «крайних» подгрупп обуславливает большой разброс для них и, как следствие, незначимость различий. Отметим, что остальные различия во многом значимы из-за аномально большой доли группы лиц с высшим образованием, которые составляют 57,6% выборки (1 055 чел.).
Интерпретация полученных результатов м.б. весьма разнообразной. Тут все зависит от воображения исследователя. Например, из близости показателя автономия для лиц с ученой степенью и начальным образованием кто-то может сделать вывод, что получение степени «очищает мозги от всех накопленных знаний»! К тому же и распределения у них по всем показателям близки к нормальному…
Определенно можно сказать только одно – рост образованности влечет за собой и повышение значения такого показателя, как интегрированный стиль жизни. Низкие значения стабильности работы для лиц с начальным образованием можно объяснить, например, тем, что неподготовленному человеку все равно, каким трудом заниматься. А аналогичное снижение для лиц с ученой степенью – как уверенность в том, что они со своей квалификацией всегда найдут работу (что похоже на иллюзию…).
Зависимость предпочтений от образования показаны ниже:
Предпочтения на удивление согласованы. Слегка удивляет абсолютно негативное предпочтение стабильности места жит-ва для всех уровней образования.
Переход к фактору Уровень образования делает многие тенденции более отчетливыми:
Таковы показатели профкомпетентность, автономия, интеграция стиля жизни – тут тенденции абсолютно однозначны.
Очень ярко различие оценок видно на следующих диаграммах (изображены медиана (красная черта) и расстояние от неё на один квартиль вверх до Q3 и вниз до Q1):
Как видим, два показателя — служение и вызов — позволяют провести дихотомическую группировку:
Служение | Вызов | |
высокое | низкое | |
высокое | ? | среднее |
низкое | высшее | спец-ное |
Здесь «высокое» и «низкое» — условное название значений показателей. Анализ этой таблички сразу же приводит к вопросу: а кто же (т.е., с каким образованием) находится в ячейке с высокими значениями как для служения, так и для вызова? Я подозреваю, что это совсем наивные люди типа младенцев — они готовы «преодолевать трудности ради служения великой цели». В нашей выборке можно надеяться найти таких среди респондентов с начальным образованием. Либо это «мудрецы» (впавшие в детство). Любопытно то, что уровни образования вполне укладываются в «кольцо», которое начинается и заканчивается в ячейке «?». Поскольку такой анализ требовал от меня значительных затрат времени, я не стал этим заниматься… Кому интересно — вперед!
Фактор Уровень образования вследствие укрупнения уровней ухудшил нормальность распределений и привел к появлению значимых различий ещё и по стабильностям, которые только чуть улавливались при 6 уровнях:
На диаграммах изображены показатели, для которых имеются значимые различия:
Прямо скажем – не очень-то выразительно… Хотя и абсолютно правильно.
Рассмотрим аналогичную таблицу для 2-уровневого фактора Наличие высшего образования:
Слияние первых двух уровней фактора Уровень образования привело к росту значимости различий, но не добавило новых! Приведем диаграммы, на которых изобразим средние и стандартную ошибку. Хоть это и не совсем правильно из-за отсутствия нормальности распределения, но зато наглядно:
Предпочтения, вычисленные после укрупнения до дихотомического Наличие высшего образования, качественно не отличаются от ранее полученных.
Сравним кластерные структуры показателей для каждого из 3-х вариантов фактора. Во всех случаях получаются очень близкие структуры. Данные — в таблицах:
Как видим, «базовая» структура в основном сохраняется. Это и не удивительно – больше половины выборки составляют люди с высшим образованием, которые её и определили.
4.6. Фактор: Материальное положение
Частоты приведены выше. Приведем критерии для фактора Уровень мат. положения:
Поскольку распределения, как всегда, в большинстве своем далеки от нормального, приведем порядковые статистики для показателей (Q1 и Q3 – 1-й и 3-й квартили):
Проведем попарное сравнение групп по критерию Манна-Уитни:
Приведем графики для соответствующих показателей:
Вполне ясные выводы – люди мало ценят то, что у них есть: хорошее материальное положение они не связывают со стабильностью работы (полагая, наверно, что эта ситуация для них вечна). И чем хуже мат. положение человека, тем скорее он готов к смене места жительства (от добра добра не ищут).
Рассмотрим диаграммы показателей для каждого из уровней:
Совершенно верно – я это где-то уже видел! Напоминаю – нечто до боли знакомое мы встречали при анализе фактора Уровень образования. Возникает мысль о тесной связи этих двух факторов. Поэтому рассмотрим таблицу сопряженности этих факторов:
Значимость полученной связи проверим критерием хи-квадрат:
Как видим, связь весьма значима. Её величину оценим через d Сомерса — меру связи для порядковых переменных:
Величина связи ну оч-ч-чень невелика, но она хоть положительна, что слегка утешает…
Рассмотрим предпочтения для каждого из уровней фактора:
Как видим, выраженных тенденций тут не наблюдается.
Кластерные структуры для различных уровней мат. положения полностью совпадают как между собой, так и с «базовой».
4.7. Фактор: Социальное положение
Частоты были приведены выше. Проверим сбалансированность уровней этого фактора по полу:
В последней колонке приведено значение углового критерия Фишера, проверяющего значимость отличия «женской доли» в данном уровне от таковой по выборке в целом. Перевес женщин среди домохозяек никого не удивляет, но вот преобладание школьниц (самое значительное!) говорит о том, что среди юного поколения мальчики совсем уж мало интересуются карьерой. Женщин значимо меньше среди руководителей, предпринимателей и рабочих, но значимо больше среди специалистов и служащих с высшим образованием.
Отличие распределений в группах от нормального проверяем по критерию Колмогорова-Смирнова:
Большие отклонения от нормальности для уровней студент и спец./служ с высшим обр. говорят о неоднородности этих групп. Поэтому данные уровни требуют более тщательного анализа.
Проверим значимость различий:
Поскольку большинство распределений близко к нормальному, воспользуемся множественными сравнениями:
Использовался тест Тамхейна, поскольку дисперсии, по тесту Левэне, значимо различаются для всех показателей, кроме вызова.
Как видим, наибольшее число значимых отличий от остальных категорий дали позиции руководитель и предприниматель. При этом они, по сравнению с другими группами (детали см. в таблице), продемонстрировали такие показатели:
- руководители:
- высокие – менеджмент (1,1), вызов (1,1)
- низкие — автономия (0,8)
- предприниматели:
- высокие – предпринимательство (2,3)
- низкие — стабильность работы (2,3)
Числа в скобках – средние значение разности (только для ориентировки, поскольку точное значение надо рассчитывать взвешенно, с учетом числа случаев в каждой группе).
Но посмотрим на предпочтения людей этих групп:
Противоположность в части предпринимательства – это понятно, как и различия по части менеджмента, вызова и служения. Очень показательно низкое предпочтение автономии руководителями — уж очень многое от них не зависит…
А вот что означает такая противоположность в части стабильности работы? То, что предприниматель значительно более самостоятелен в жизнеобеспечении? И что руководители больше всего держатся за работу?
Низкие значения по автономии показали и служ./спец. с высшим образованием. Сравним их с руководителями – ведь именно эти две группы социально наиболее близки и взаимно мобильны:
Конечно, преобладание менеджмента у руководителей не является неожиданностью. А вот низкие значения по автономии у служ/спец-тов с ВО оказываются куда как более значительными по сравнению с руководителями.
Характерны также для этой категории высокие по величине предпочтения (сравнительно с руководителями) стабильности работы и интеграции жизни. А вот вызова спецы не любят.
Любопытно, что довольно большое число отличий показали домохозяйки по интегрированному стилю жизни – они его ценят выше многих других групп. Приведем данные по предпочтениям домохозяек и руководителей:
Действительно, интеграция для домохозяек таки значительна по величине, но всего лишь на 3-м месте. Перед за ней идет вызов, который домохозяйки не очень ценят, вкупе с профкомпетентностью, занявшей первое (хоть и негативное) место по предпочтениям. В общем, все нарисовано, что я могу ещё сказать?
Поскольку имеется 11 уровней фактора Соц. положение 2, то таких сравнений можно провести 55. Какие именно стоит рассматривать, должен сказать заказчик исследования. Отмечу только, что из-за нечеткости уровней данного фактора его анализ представляет собой во многом гадание на кофейной гуще… А кому интересны неустойчивые закономерности?
Интересными представляются данные по кластеризации показателей внутри групп:
Серым выделены ячейки, в которых доля превышает долю по выборке. Красный шрифт указывает, что отличие значимо.
С «базовой» полностью совпадают структуры группы 1 (желтый фон в колонке Соц. положение). Во 2-й группе (синий фон), где женщин мало, хотя их доли не отличаются от таковых по выборке, профкомпетентность тут же переходит в другой кластер. В 3-й группе (белый фон), где мужчины преобладают, кластер из профкомпетентности и стабильности места жит-ва тоже стабилен, но зато началась чехарда в 1-м кластере.
Хорошо видны различия структур именно руководителей и предпринимателей, что подтверждает результаты анализа предпочтений этих групп. Эти структуры максимально отличаются друг от друга — городское расстояние между ними равно 4. В то же время от базовой структуры структура кластеров руководителей отличается на 1, а предпринимателей — на 3.
6. Заключение
Проведенный анализ не затронул взаимодействие факторов – т.е., как меняются зависимости показателей от уровней одного фактора при изменении уровня другого фактора.
Например, для показателя автономия гендерные различия средних значений значимы для возрастной группы 26-31:
Для прочих групп здесь отличия, конечно, есть, но незначимые. Результат получен при помощи двухфакторного дисперсионного анализа.
Поскольку имеется отклонение распределений от нормального, то требуются трудоемкие попарные сравнения показателей непараметрическими методами. Так как число комбинаций факторов весьма велико, проверка их взаимодействия имеет смысл лишь при наличии «заказа».