Аннотация

Опрос проводился с 01.07.08 по 02.09.09 на сайте Бизнес-тренер.
Анализ проведен с целью установить основные параметры и показатели выборки перед модификацией методики расчета.
В исследовании приняло участие 1877 респондентов.
При таком объеме выборки удивительным является не наличие значимых различий, а наоборот – отсутствие значимых различий!

Содержание

  1. Очистка данных
  2. Анализ факторов (группировка респондентов)
    1. Кластеризация респондентов
    2. Пол
    3. Образование
    4. Материальное положение
    5. Социальное положение
    6. Возраст
  3. Анализ показателей (по всей выборке)
    1. Статистики
    2. Распределения
    3. Предпочтения
    4. Связи между показателями
      1. Корреляции
      2. Кластеризация
      3. Многомерное шкалирование
  4. Анализ различий по факторам
    1. Однородность групп
    2. Фактор: Пол
    3. Предпочтения и показатели
    4. Фактор: Возраст
    5. Фактор: Образование
    6. Фактор: Материальное положение
    7. Фактор: Социальное положение
  5. Заключение

1. Очистка данных

Статистическая обработка предполагает, что рассматриваемые случаи образуют однородную выборку для каждого из уровней фактора и их комбинаций. Поэтому данные следует тщательно просмотреть с целью исключения «выбросов» — ошибок, противоречий, нехарактерных случаев и т.п.
2 респондента не представили данных по факторам. При этом один не представил данных по трем факторам. Оба этих респондента исключены из дальнейшего анализа.
Наиболее «засоренным» оказалось распределение по возрасту. Программа SPSS рекомендовала рассматривать как выбросы все случаи с возрастом, большим 45. Однако, возраст в 46 лет я все же оставил.
Исключены случаи, в которых, например 17-летний школьник имеет высшее образование или ученую степень. Даже если это соответствует реальности и не является ошибкой ввода или «приколом», эти случаи все же весьма нехарактерны.


2. Анализ факторов (группировка респондентов)

Для группировки респондентов запрашивались следующие факторы:

  • Пол (номинальная)
  • Соц. положение (номинальная)
  • Мат. положение (порядковая/номинальная)
  • Образование (порядковая/номинальная)
  • Возраст (интервальная)

Рассмотрим возможности видоизменить их для получения более однородных групп.

2.1. Кластеризация респондентов

Применим 2-шаговый кластерный анализ для выделения возможных групп. Выделено два кластера, при этом значимыми оказались только переменные Возраст, Образование и Соц. положение. Поскольку естественно ожидать сильной корреляции факторов Образование и Соц. положение с фактором Возраст, то основной переменной, разделяющей респондентов на группы, является именно Возраст. При этом контрольным значением является 26 лет – именно это значение разбивает респондентов на два кластера наилучшим образом. Формально – это медиана переменной Возраст.

2.2. Пол

Распределение по кластерам имеет вид:
CA_t_sex_1
Как видим, доли мужчин и женщин в кластерах очень близки, что подтверждает и критерий хи-квадрат. Его значение равно 0,521, что соответствует р=0,47.
Значимость различия в долях может быть оценена по угловому критерию Фишера (укФ). Его критические значения равны 2,81 (р=0,001), 2,31 (р=0,01) и 1,64 (р=0,05). Как видим, выборка сильно несбалансированна по полу.

2.3. Образование

Распределение по кластерам имеет вид:
CA_t_educ_1
Более наглядно это видно на диаграмме:
CA_d_educ_1
Отметим следующие особенности фактора Образование. Как видим, уровень неполн. высшее тяготеет скорее к двум нижним, нежели к верхним. Для уровня неполн. высшее полагается закончить не менее 3-х полных курсов вуза. Поэтому студент 1-3 курса должен отвечать — среднее. Но 261 респондент, указавшие себя как студенты с неполн. высшим, имели возраст от 17 до 27 лет. Из них 99 — от 17 до 20. Они формально не имели права относить себя к позиции незаконченное высшее. Можно понять гордость первокурсника, но любой преподаватель вуза знает, сколько школярства на младших (!) курсах. Так что в данной выборке «по иерархии» получается, что уровень ср. спец-ное будет повыше, чем неполн. высшее. Все это, конечно, не способствует однородности групп и вносит свою долю в смазывание результатов.
Похоже, что наблюдается 3-уровневая градация: (начальное + среднее), (ср. спец. + неполн. высшее) и (высшее + уч. степень). Введение этот фактора (назовем его Уровень образования) снимает проблему «кто круче» — ср. спец-ное или неполн. высшее:
CA_t_educ_2
Как показывает укФ, доли людей со средним образованием в одном кластере и спец-ным образованием в другом различаются значимо. В то же время доли среднего и спец-го в одном кластере не отличаются значимо от доли высшего в другом кластере.
Поэтому реально просматривается всего два уровня:
CA_t_educ_3
Как видим, здесь различие долей наконец-то незначимо.
Проверим таблицу сопряженности:
CA_t_educ_4
Значение критерия хи-квадрат равно 0,252, что значительно ниже критического. Следовательно, несбалансированность выборки по полу тут не сказывается.
Итак, получаем такие возможности исследования при учете фактора Образование:

  • Образование (как есть)
  • Уровень образования
  • Наличие высшего образования

Заранее сказать, какое преобразование принесет наиболее интересные и значимые результаты, на данном этапе, конечно, нельзя. Поэтому анализ данных всегда и есть их исследование – с выдвижением гипотез и их проверкой.

2.4. Материальное положение

Распределение по кластерам имеет вид:
CA_t_mat_1
Позиция отказ сильно портит картину. Во-первых, она лишает этот фактор порядкового характера, что снижает возможности анализа. Однако заметим, что уровни очень плохое и отказ мало различаются по принадлежности к кластерам. Это дает основания полагать, что выбор респондентом позиции отказ на самом деле обусловлен его нежеланием обнародовать свое очень плохое мат. положение. Поэтому в дальнейшем разумно объединить эти позиции в одну – очень плохое. Тогда фактор Мат. положение станет действительно порядковым, что позволит использовать более мощные статистики. Такой фактор назван Мат. положение 2.
Более того, представляется разумным «огрубить» предложенные уровни и данного фактора, объединив в один очень плохое, плохое и отказ, хорошее и очень хорошее, оставив уровень среднее без изменений. Такой фактор назовем Уровень мат. положения:
CA_t_mat_2
Проверены коэффициенты полной и частной корреляции (по Пирсону) для трех переменных, характеризующих оценку мат. положения, и переменной Образование, которая имеет почти порядковый характер. В качестве контрольной переменной при вычислении частной корреляции взята переменная Возраст. Результаты таковы:
CA_t_mat_3
Прежде всего, отметим отрицательную связь между образованием и материальным положением как для полной, так и для частной корреляции (при контрольной переменной Возраст). При этом связь незначима, что удивительно (объем выборки!).
Но первый вариант (отказ = очень плохое) приводит к значимой положительной (хоть и не такой большой, как хотелось бы…) связи между образованием и материальным положением, чего мы интуитивно и ожидаем. Контрольная переменная Возраст несколько снижает (что естественно) и сам коэффициент корреляции, и его значимость, но сохраняет знак r.

2.5. Социальное положение

Данный фактор носит чисто качественный характер и вряд ли поддается переводу в порядковую шкалу. Укрупнение категорий на основе принадлежности к кластерам вряд ли оправдано – оно сильно привязано к возрасту. Но, ввиду малочисленности, позиции военнослужащий и пенсионер были добавлены в другое.
CA_t_soc_1
Частоты и доли:
CA_t_soc_2
Диаграмма:
CA_d_soc_1

2.6. Возраст

Ввиду громоздкости таблицы частот приведем только гистограмму:

CA_d_age_1

Гистограмма частот для возраста

Распределение явно не имеет нормального характера, что подтверждается и двумя критериями:
CA_t_age_1
(a) Учтена поправка значимости Лильефорса.
Укрупним переменную Возраст. Т.к. имеется 30 значений (от 17 до 46 включительно), это можно сделать различными способами, объединяя соседние частоты: по две (15 значений), по три (10), по 5 (6) или по 6 (5). Какое именно укрупнение следует выбрать – задача не из простых.
Это преобразование основано исключительно на свойствах самой шкалы и не имеет отношения к распределению частот. Но возможен и другой подход – статистический, при котором границы новых интервалов выбираются, исходя из параметров имеющегося распределения – это нормализация различного вида.
Можно провести и другие преобразования шкалы, что позволит, м.б., уловить некоторые другие закономерности. Однако, при отсутствии обоснованных границ для выделения возрастных групп приходится заниматься их выявлением на основании только имеющихся данных, что неизбежно приводит к ограничению получаемых выводов только данной выборкой. Строго говоря, надо исследовать получаемые результаты при различных подходах и выбрать тот, при котором они будут наиболее выразительны для интерпретатора. Возникающие проблемы обсуждены тут. И они весьма серьезны…
Я остановился на слиянии в одну позицию трех соседних значений, получив тем самым новую переменную Возраст3:
CA_t_age_2
Гистограмма полученной переменной уже является вполне гладкой, хотя само распределение, конечно же, далеко от нормального:
CA_d_age_2
Однако оно позволяет сформулировать качественные отличия разных возрастов в показателях якорей карьеры.
Введем и разбиение по квартилям, создав новую порядковую переменную Возрастная группа:
CA_t_age_3


3. Анализ показателей (по всей выборке)

3.1. Статистики

CA_t_stat_1
Последние две колонки таблицы показывают результаты теста Колмогорова-Смирнова на нормальность: Z – статистика, р — асимптотическая двухсторонняя значимость отличия.
Как видим, разброс (SE, стандартная ошибка среднего) из-за большого объема выборки очень мал, поэтому его будет плохо видно на диаграмме. Так что в качестве разброса выведено стандартное отклонение s.

CA_d_stat_1

Средние и стандартные отклонения

Поскольку распределение большинства показателей сильно отличается от нормального, построим диаграмму с непараметрическими статистиками (столбик – медиана, линии с засечками – 1-й и 3-й квартили):

CA_d_stat_2

Медианы и квартили

Особой разницы между диаграммами нет, но по межквартильным расстояниям можно судить о форме распределения.

3.2. Распределения

Для более четкого представления о распределении значений показателей мы произведем укрупнение диапазонов, заменяя одним значением все значения из интервалов:
CA_t_dist_1
Значения, превышающие 7 баллов, выделены голубым цветом и обозначают, по мнению авторов методики, что данная ориентация ярко выражена.
Естественно, что все расчеты производятся с точными значениями показателей.
Соответствующие гистограммы приведены ниже. Числа — доли по выборке.

CA_d_dist_prof

Гистограмма: профкомпетентность

CA_d_dist_man

Гистограмма: менеджмент

CA_d_dist_auto

Гистограмма: автономия

CA_d_dist_st_j

Гистограмма: стабильность работы

CA_d_dist_st_l

Гистограмма: стабильность места жит-ва

CA_d_dist_sluj

Гистограмма: служение

CA_d_dist_chal

Гистограмма: вызов

CA_d_dist_int

Гистограмма: интеграция стиля жизни

CA_d_dist_bis

Гистограмма: предпринимательство

3.3. Предпочтения

Рассматрим значения показателей как «ансамбль», характеризующий якоря карьеры в целом, как объекты сравнения. Для этого введем центрированные средние, нормированные специальным образом на диапазон [-1; 1] (т.н. предпочтения). Отрицательные значения говорят о том, что показатель данного ЯК ниже среднего уровня оценок. Т.е., этот ЯК менее важен по сравнению с другими ЯК.

CA_d_pref_1

Предпочтения якорей карьеры по выборке в целом

Как видим, именно стабильность места жит-ва является наиболее несущественной для респондентов выборки. Об этом говорит и её мода, равная 1 – наименьшему возможному значению. В то же время ни один из 5-ти позитивно предпочитаемых ЯК не является абсолютным лидером. Но следует отметить все-таки преобладание показателя стабильность работы как наиболее существенного среди прочих.
Поскольку именно показатели, связанные со стабильностью, образуют «полюса» отношений, то следует признать правильным разделение якоря стабильность, введенного Э.Шейном, на два. Скорее всего, обусловлено это особенностями нашей социально-политической ситуации и отражает возросшее значение работы как источника к существованию, при этом люди для его сохранения готовы к мобильности.
Низкое значение показателя профкомпетентность отражает тот факт, что при общей нестабильности значение ранее «наработанных» навыков и умений снижается. И респонденты это чутко отражают в своих предпочтениях. Низкие значения показателей вызов и предпринимательство вкупе с высоким значением стабильность работы отражают, скорее всего, нежелание рисковать в ситуации общей нестабильности.
Тем не менее, тяга к независимости (автономия) и целостности (интеграция стиля жизни) остаются довольно существенными, уступая лишь желанию иметь нечто более высокое, чем просто существование (служение). Как отражение желания справиться с ситуацией можно интепретировать и позитивное отношение к управлению людьми (менеджмент), хотя оно и весьма невелико.
В целом можно сказать, что выборка дала результаты, которые вполне укладываются в предполагаемые оценки ситуации. Впрочем, возможности интерпретации ограничены лишь воображением исследователя, и всегда можно заявить, что именно этого-то мы и ожидали!

3.4. Связи между показателями

Помимо полученных предпочтений показателей, нас интересует, как они взаимосвязаны между собой в сознании (подсознании, психике, …) респондента. Т.е., какую структуру они образуют.

3.4.1. Корреляции

Корреляции между показателями (всего их 36) незначительны – среднее значение модулей равно 0,185. Это говорит о сравнительной независимости показателей при данной методике их получения.
CA_d_corr_1
Из-за объема выборки почти все корреляции весьма значимы. Но даже и в этом случае нашлись 3 незначимых – настолько малы их величины. Только 6 из 36 коэффициентов отрицательны. Максимальное значение связи равно 0,502, и наблюдается оно между показателями менеджмент и предпринимательство, что вполне ожидаемо.
Связи между показателями, обусловленные величиной корреляции между ними, можно изобразить в виде корреляционного графа:
CA_d_corr_2
На этом рисунке отражены лишь 13 из 36 линий связей. Толстой красной линией изображены связи, для которых коэффициент корреляции превосходит 0,4. Средней по толщине синей линией — от 0,3 до 0,4, а тонкой – от 0,2 до 0,3. Связи с величиной, меньшей 0,2, не отображались.
Как видим, вполне ожидаемая плеяда вызов — менеджмент — предпринимательство связана наиболее сильно и действительно выделяется как компактная часть структуры. М.б., они есть проявление и аспекты некоего единого фактора, который отражает активность личности. Близко примыкающие к ним автономия и служение тоже тесно связаны с ними и семантически. Вполне понятно и ожидаемо (да ну?) «центральное» положение показателя интегрированный стиль жизни, который обладает наибольшим числом сравнительно существенных связей (5 из 9 возможных).
Мерой связи каждого показателя со всеми остальными может служить сумма абсолютных значений коэффициентов корреляции. После её преобразования в предпочтения получим диаграмму:
CA_d_corr_3
Как видим, именно те три ЯК, которые образуют наиболее тесно связанную группу показателей, выделились и тут.
Построим «диаграмму рассеяния», чтобы отразить взаимосвязь между предпочтением показателя и степенью его связи с остальными:
CA_d_corr_4
Сразу выделяется три кластера. Менеджмент занимает промежуточное положение и на основании только этих данных пока не м.б. классифицирован. Однако удивительно то, что столь простые средства анализа уже выделяют основные элементы структуры показателей.

3.4.2. Кластеризация

Форма и цвет фигур, изображающих ЯК на корреляционном графе, выбраны в соответствии со структурой, которую образуют эти величины при иерархической кластеризации. Она производилась методом Уодда (Ward), в качестве меры расстояния было взято евклидово расстояние. Полученная дендрограмма имеет вид:

CA_d_clus_1

Дендрограмма показателей (по выборке)

Кластеризация при прочих параметрах дает схожие результаты.
Другой способ получения структуры – факторный анализ – в данном случае неприменим, поскольку распределения далеки от нормальных. Но все же, для полноты картины и проверки, был применен метод главных компонент (вращение варимакс, сошлось за 5 итераций). «Сильные» связи на корреляционном графе были выявлены даже в этом случае! Это видно на матрице повернутых компонент (красным выделены значения, по модулю превосходящие 0,5):
CA_t_clus_1
А вот остальные показатели «не уложились» в ранее полученную структуру, при этом служение вообще оказалось «не у дел».

Это лишний раз свидетельствует о том, что порядок исследования может предопределить его выводы. Ведь начни мы именно с факторного анализа, установи критическое значение для компонент равным 0,45 – и мы «пристроим» служение, правда, получим при этом смешение компонент (от которого, кстати, не спасает даже косоугольное вращение). Да и интерпретация представляется более сложной и непрозрачной, нежели уже полученная нами.

3.4.3. Многомерное шкалирование

Применив метод PROXSCAL, получим координаты точек-образов, изображающих показатели, в некотором условном пространстве. Для двух измерений полученные координаты позволяют построить корреляционный граф, разместив центры объектов в соответствующих точках:
CA_d_scal_1
Как видим, многомерное шкалирование однозначно находит место для менеджмента, сливая его (как и в кластерном анализе!) вместе с вызовом и предпринимательством.
Пытаясь втиснуть в двумерное пространство структуру связей, неизбежно получаем сильные искажения этой структуры. Куда меньше она искажена в 3D-пространстве:
CA_d_scal_2
Оси были повернуты для наилучшей видимости образов. Тут куда лучше просматриваются три полученных кластера. При наличии тренированного пространственного воображения можно увидеть несомненное сходство изображенных структур. И даже найти такую точку зрения, с которой можно увидеть и двумерную проекцию, совпадающую с ранее показанной.
Но – сложно это все для «простого человека». Точнее – непривычно. При распространении такого рода представления данных они станут все более привычны и тем самым понятны. Ведь это – некий другой язык, освоение которого расширяет, и весьма значительно, возможности исследователя.
Конечно, возможны и другие способы и методы исследования выборки как целого, но мы ограничимся сделанным.


4. Анализ различий по факторам

4.1. Однородность групп

Отметим, что статистика предполагает однородность исследуемого ансамбля — все его случаи предполагаются полученными из одной генеральной совокупности. Пока мы постулировали такую однородность для нашей выборки, очистив её от «неверных» данных.
Но, конечно, наша выборка неоднородна по существу. Например, в ней есть мужчины и женщины. Заранее нельзя предполагать, что они «одинаковы» в том смысле, что все результаты будут тождественны для выборок, состоящих из одних только мужчин или женщин. Такие различия обязательно будут, скорее, отсутствие таких различий есть повод для серьезного исследования.
Поэтому, строго говоря, исследования, аналогичные только что сделанным, следует проводить для каждой группы респондентов. Такая группа выделяется по значениям факторов и/или их комбинациям. Отличие от сделанного только что – в необходимости сравнения таких групп в следующих отношениях:

  • насколько разнятся показатели и существенно ли это различие;
  • насколько значимо это различие и не объясняется ли оно простыми случайностями.

Строго говоря, и нашу выборку в целом тоже следовало бы сравнить с чем-то ещё (генеральной совокупностью, например). Но у меня таких данных нет.

4.2. Фактор: Пол

Напомню частоты, с которыми в выборке встречаются представители полов:
CA_t_st_sex_1
Таблица статистик громоздка и совершенно нечитабельна. Приведем лишь таблицу значимостей различий:

Значимость гендерных различий

Значимость гендерных различий

Поскольку никто, кроме исследователя, не может оценить, насколько велики, с его точки зрения, различия, то такое обсуждение обычно опускается. Ввиду его дискуссионности, естественно. Но значимость различий должна приводиться всегда.
Поскольку распределения, в основном, далеки от нормальных, то будем пользоваться в дальнейшем непараметрическими критериями значимости. В качестве основных выберем робастный критерий Брауна-Форсайта и критерий Краскелла-Уоллеса. При таких объемах выборки их различия между собой и другими тестами становятся малосущественными.
Удивительно, что все-таки есть два показателя, по которым гендерные различия незначимы — профкомпетентность и стабильность места жительства.
Поскольку распределения, как всегда, в большинстве своем далеки от нормального, приведем порядковые статистики для показателей (Q1 и Q3 – 1-й и 3-й квартили):
CA_t_st_sex_3
Графически это выглядит так:

CA_d_st_sex_1

Медианы и квартили показателей: м vs ж

Представим предпочтения групп:

CA_d_st_sex_2

Гендерные различия предпочтений

Любопытным является различие в предпочтении предпринимательства – мужчины в общем оценили его чуть выше среднего, а вот женщины – куда ниже. Отметим, что женщины более полярны в своих оценках (синий прямоугольник чаще длиннее серого столбика).
Напомню, что в один кластер программа объединяет показатели, на которые респонденты данной группы дают наиболее схожие ответы. Имеется только одно гендерное различие в кластерных структурах показателей – показатель служение отнесен ими в разные кластеры:
CA_d_st_sex_3
Поскольку женщины составляют подавляющее большинство рассматриваемой выборки, то именно они и определили «базовую» структуру.

4.3. Предпочтения и показатели

Теперь можно конкретно показать принципиальное различие между балльными оценками нескольких объектов (в нашем случае – якорей карьеры, показателей) и предпочтениями.
Будучи центрированными и нормированными специальным образом, предпочтения выявляют внутреннюю структуру отношений к объектам, учитывая для каждого из них и оценки, полученные прочими объектами.
Отметим, что средние стабильности места жит-ва значимо отличаются для мужчин и женщин. А вот предпочтения для них одинаковы!!
Например, на диаграмме с данными различие в парах менеджмент и вызов выглядят как чисто количественные – в обоих случаях медиана у мужчин на 0,6 превышает её значение у женщин. В то же время предпочтения мало того, что противоположны по знаку (это ещё можно понять – средняя медиана все-таки разная), но ведь они ещё и противоположны по величине!
Это означает, что

    балльные оценки нескольких объектов и вычисленные на их основе предпочтения принципиально отличаются друг от друга

Ведь любой показатель, полученный по балльной шкале, никак не связан с другими показателями. Предпочтения же описывают структуру отношений респондента к группе объектов, которые рассматриваются как единое целое.
Более подробно см. https://psytest.wordpress.com/preferen/

4.4. Фактор: Возраст

Частоты для данного фактора после укрупнения и разбиения на возрастные группы были уже приведены раньше.
Проверим нормальность распределения по каждому показателю в каждом возрасте (одновыборочный критерий Колмогорова-Смирнова):

CA_t_st_age_1

Нормальность распределения показателей по возрасту

Что любопытно – в среднем с возрастом растет и нормальность распределения. Причем по всем показателям, хотя число случаев с тем же возрастом падает! Интерпретировать ли это как «стирание различий с возрастом»? как оригинальничание молодого поколения? как большее разнообразие характеров, возникающих в изменившейся обстановке? Вот тебе данные – твори, выдумывай, пробуй!
Проверим нормальность распределений в 4-х возрастных группах (одновыборочный критерий Колмогорова-Смирнова):

CA_t_st_age_2

Нормальность распределения покзателей по 4-м возрастным группам

И хотя в некоторых группах распределение можно полагать мало отличающимся от нормального, всё-таки нет ни одного показателя, по которому все группы имели бы такое распределение.
Поскольку данные описывают «моментальный» срез, а не диахронику, то на самом деле происходит сравнение возрастных групп, сформировавшихся при различных социальных условиях. Грубо говоря, рубеж 90-х годов прошлого века отстоит от времени опроса на 18-19 лет, прибавим несколько лет на детство – получаем, что где-то от 25 до 35 лет проходит некий «рубеж».
Приведем несколько наиболее характерных графиков, отображающих такую «динамику». Заодно выведем и параболический тренд (синяя точечная линия) с указанием его уравнения и параметра качества подгонки R2. Заметим, что независимая переменная х в данном случае есть номер диапазона возрастов, зависимая у — это показатель.

CA_d_st_age_prof

Возрастная динамика профкомпетентности

Лучшая подгонка из всех! При этом минимум приходится на возраст 26-28 лет. Возможно, это говорит как о том, что старшее поколение ценит профессионализм, так и о том, что его начинает ценить и совсем молодое поколение.

CA_d_st_age_st_l

Возрастная динамика стабильности места жит-ва

Единственный показатель, для которого наблюдается чуть ли не скачкообразный рост при переходе через некий возрастной рубеж в районе 30-33 лет. Причем слева и справа от этого рубежа тренд явно линеен. Т.е., стабильность места жит-ва выделяет некий рубеж, близкий к ранее упомянутому, который и разбивает респондентов на две группы — «мобильный молодняк» и «оседлый взросляк». Возможно, при более подробном исследовании стоило бы проверить значения из этого диапазона как точки сечения фактора Возраст.

CA_d_st_age_sluj

Возрастная динамика служения

Можно вполне определенно сказать – служение как ценность-мотив теряет свои позиции у молодого поколения, причем довольно уверенно.

CA_d_st_age_bis

Возрастная динамика предпринимательства

Явная волнообразность графика делает параболический тренд неприменимым. Чем обусловлена такая «динамика» — возрастными ли особенностями человека вообще или же спецификой нашей ситуации – сказать не берусь. Напомню только, что автор методики Э.Шейн называл этот показатель Entrepreneurial Creativity (=творчество, направленное на предпринимательство). Т.е., определяющее существительное в термине — это все-таки творчество!
Возможно, люди старшего поколения делали акцент именно на творческой компоненте этого мотива. Это можно было бы выяснить, анализируя ответы на конкретные вопросы, но таких данных по этой выборке у нас нет. М.б., требуется изменение термина, обозначающего данный якорь. А то и разбиение его на два — творчество как таковое и предпринимательскую активность. Кстати, именно проблемы подобного рода и привели нас к необходимости пронанализировать более внимательно данную методику. И, при необходимости, её модифицировать.
Более явственно изменения показателей с возрастом видны при рассмотрении предпочтений:

CA_d_st_age_pref

Предпочтения по возрастам

Отметим следующие особенности:

  • Все предпочтения, кроме менеджмента, сохраняют свой знак во всех возрастах. Что, вообще говоря, вряд ли можно было ожидать с такой регулярностью.
  • Предпочтения менеджмента у молодого поколения явно растут.
  • Предпочтения служения у молодого поколения явно падают. Интересно, что именно этот показатель единственный достигает положительного максимума, причем у самых старших возрастов.
  • Крайне низкие предпочтения для стабильности места жит-ва у респондентов с возрастом, не превосходящим 35 лет.
  • Очень высокие предпочтения у стабильности работы, которые растут у более старших возрастов.
  • Отношение к предпринимательству у молодого поколения хоть и остается негативным, но стабильно снижается. «Всплеск» негатива в группе 38-40 лет м.б. объяснен, например, тем обстоятельством, что в 90-е годы этим людям было по 18-25 лет, и у них могло сформироваться негативное отношение к бизнесу.

Представим предпочтения и в 4-х возрастных группах:

CA_d_st_age4_pref

Предпочтения по возрастным группам

Как видим, качественная картина сохраняется, хоть и является, конечно, куда более грубой.
Сравним предпочтения самой молодой и самой пожилой групп:

CA_d_st_age4_pref_2

Предпочтения: молодые vs пожилые

За исключением менеджмента, знаки для всех предпочтений совпадают. Близки они только для профкомпетентности и стабильности места жит-ва. И только для автономии предпочтения у молодого поколения выражено сильнее, относительно остальных якорей карьеры предпочтения более ярко выражены у старшего.
Поскольку предпочтения описывают лишь качественную картину (для них неизвестны критерии значимости различий), значимость различий будем проверять для средних, используя только непараметрические критерии.
Проверим значимость имеющихся различий между различными уровнями для обоих вариантов укрупнения переменной Возраст, причем тремя непараметрическими тестами:
CA_t_st_age_3
Как видим, показатель вызов не обнаруживает никакой возрастной динамики ни при каком укрупнении возраста. Остальные такую динамику проявляют при любом укрупнении шкалы.
Кластеризация показателей для каждого из 10-ти «3-летних возрастов» дает очень близкие структуры. Для краткости изобразим их таблично:

CA_t_st_age_4

Кластерные структуры для различных возрастов

Как видим, 6 возрастов из 10 дали полностью совпадающие структуры (они выделены серым фоном в заголовке), причем она в точности совпадает с «базовой» (полученной по всей выборке). Впрочем, это и не удивительно – именно эти группы и составляли большинство, «задавившее» остальных. Но удивительно, что даже самая взрослая (и малочисленная) группа отличается от «базовой» структуры положением лишь двух элементов. Отметим, что в группах с большим возрастом стабильность места жит-ва вообще стоит особняком, составляя отдельный кластер. Хотя среднее значение этого показателя в них не сильно отличается от двух предыдущих.
Аналогичная кластеризация для 4-х возрастных групп дает структуры, полностью совпадающие как между собой, так и с «базовой». Т.е., при таком укрупнении шкалы все различия между её участками с т.зр. структуры исчезают.

4.5. Фактор: Образование

Ранее были приведены частоты для исходного фактора Образование и двух укрупненных факторов Уровень образования и Наличие высшего образования.
Приведем критерии для фактора Образование:

CA_t_st_educ_1

Значимость различий для различных уровней образования

Как видим, при 6-ти уровнях фактора наибольшее число отклонений от нормального распределения наблюдается для уровней высшее и неполное высшее, они отсутствуют на уровнях начальное и ученая степень и малы на остальных. Непараметрические критерии значимости различий между показателями для различных уровней фактора показывают только два таких показателя – автономия и интегр. стиль жизни. Подозрительными (по критерию Джонкхиера-Терпстра) являются и обе стабильности.
Вот как выглядят графики для 6-уровневого фактора Образование:
CA_d_st_educ_auto
CA_d_st_educ_int
CA_d_st_educ_st_j
CA_d_st_educ_st_l
Поскольку здесь выделены только участки шкалы баллов, то различия выглядят преувеличенными.
Незначительный объем «крайних» подгрупп обуславливает большой разброс для них и, как следствие, незначимость различий. Отметим, что остальные различия во многом значимы из-за аномально большой доли группы лиц с высшим образованием, которые составляют 57,6% выборки (1 055 чел.).
Интерпретация полученных результатов м.б. весьма разнообразной. Тут все зависит от воображения исследователя. Например, из близости показателя автономия для лиц с ученой степенью и начальным образованием кто-то может сделать вывод, что получение степени «очищает мозги от всех накопленных знаний»! К тому же и распределения у них по всем показателям близки к нормальному…
Определенно можно сказать только одно – рост образованности влечет за собой и повышение значения такого показателя, как интегрированный стиль жизни. Низкие значения стабильности работы для лиц с начальным образованием можно объяснить, например, тем, что неподготовленному человеку все равно, каким трудом заниматься. А аналогичное снижение для лиц с ученой степенью – как уверенность в том, что они со своей квалификацией всегда найдут работу (что похоже на иллюзию…).
Зависимость предпочтений от образования показаны ниже:

CA_d_st_educ_pref1

Предпочтения для фактора "Образование"

Предпочтения на удивление согласованы. Слегка удивляет абсолютно негативное предпочтение стабильности места жит-ва для всех уровней образования.
Переход к фактору Уровень образования делает многие тенденции более отчетливыми:

CA_d_st_educ_pref2

Предпочтения для фактора "Уровень образования"

Таковы показатели профкомпетентность, автономия, интеграция стиля жизни – тут тенденции абсолютно однозначны.
Очень ярко различие оценок видно на следующих диаграммах (изображены медиана (красная черта) и расстояние от неё на один квартиль вверх до Q3 и вниз до Q1):
CA_d_st_educ_lev1
CA_d_st_educ_lev2
CA_d_st_educ_lev3
Как видим, два показателя — служение и вызов — позволяют провести дихотомическую группировку:

Служение Вызов
высокое низкое
высокое ? среднее
низкое высшее спец-ное

Здесь «высокое» и «низкое» — условное название значений показателей. Анализ этой таблички сразу же приводит к вопросу: а кто же (т.е., с каким образованием) находится в ячейке с высокими значениями как для служения, так и для вызова? Я подозреваю, что это совсем наивные люди типа младенцев — они готовы «преодолевать трудности ради служения великой цели». В нашей выборке можно надеяться найти таких среди респондентов с начальным образованием. Либо это «мудрецы» (впавшие в детство). Любопытно то, что уровни образования вполне укладываются в «кольцо», которое начинается и заканчивается в ячейке «?». Поскольку такой анализ требовал от меня значительных затрат времени, я не стал этим заниматься… Кому интересно — вперед!
Фактор Уровень образования вследствие укрупнения уровней ухудшил нормальность распределений и привел к появлению значимых различий ещё и по стабильностям, которые только чуть улавливались при 6 уровнях:
CA_t_st_educ_2
На диаграммах изображены показатели, для которых имеются значимые различия:
CA_d_st_educ_lev5
Прямо скажем – не очень-то выразительно… Хотя и абсолютно правильно.
Рассмотрим аналогичную таблицу для 2-уровневого фактора Наличие высшего образования:
CA_t_st_educ_3
Слияние первых двух уровней фактора Уровень образования привело к росту значимости различий, но не добавило новых! Приведем диаграммы, на которых изобразим средние и стандартную ошибку. Хоть это и не совсем правильно из-за отсутствия нормальности распределения, но зато наглядно:
CA_d_st_educ_2lev1
Предпочтения, вычисленные после укрупнения до дихотомического Наличие высшего образования, качественно не отличаются от ранее полученных.
Сравним кластерные структуры показателей для каждого из 3-х вариантов фактора. Во всех случаях получаются очень близкие структуры. Данные — в таблицах:

CA_t_st_educ_4

Кластерные структуры для различных факторов образования

Как видим, «базовая» структура в основном сохраняется. Это и не удивительно – больше половины выборки составляют люди с высшим образованием, которые её и определили.

4.6. Фактор: Материальное положение

Частоты приведены выше. Приведем критерии для фактора Уровень мат. положения:
CA_t_st_mat_1
Поскольку распределения, как всегда, в большинстве своем далеки от нормального, приведем порядковые статистики для показателей (Q1 и Q3 – 1-й и 3-й квартили):
CA_t_st_mat_2
Проведем попарное сравнение групп по критерию Манна-Уитни:
CA_t_st_mat_3
Приведем графики для соответствующих показателей:
CA_d_st_mat_1
Вполне ясные выводы – люди мало ценят то, что у них есть: хорошее материальное положение они не связывают со стабильностью работы (полагая, наверно, что эта ситуация для них вечна). И чем хуже мат. положение человека, тем скорее он готов к смене места жительства (от добра добра не ищут).
Рассмотрим диаграммы показателей для каждого из уровней:
CA_d_st_m_1
CA_d_st_m_2
CA_d_st_m_3
Совершенно верно – я это где-то уже видел! Напоминаю – нечто до боли знакомое мы встречали при анализе фактора Уровень образования. Возникает мысль о тесной связи этих двух факторов. Поэтому рассмотрим таблицу сопряженности этих факторов:
CA_t_st_mat_4
Значимость полученной связи проверим критерием хи-квадрат:
CA_t_st_mat_5
Как видим, связь весьма значима. Её величину оценим через d Сомерса — меру связи для порядковых переменных:
CA_t_st_mat_6
Величина связи ну оч-ч-чень невелика, но она хоть положительна, что слегка утешает…
Рассмотрим предпочтения для каждого из уровней фактора:

CA_d_st_mat_5

Предпочтения для уровней мат. положения

Как видим, выраженных тенденций тут не наблюдается.
Кластерные структуры для различных уровней мат. положения полностью совпадают как между собой, так и с «базовой».

4.7. Фактор: Социальное положение

Частоты были приведены выше. Проверим сбалансированность уровней этого фактора по полу:
CA_t_st_soc_1
В последней колонке приведено значение углового критерия Фишера, проверяющего значимость отличия «женской доли» в данном уровне от таковой по выборке в целом. Перевес женщин среди домохозяек никого не удивляет, но вот преобладание школьниц (самое значительное!) говорит о том, что среди юного поколения мальчики совсем уж мало интересуются карьерой. Женщин значимо меньше среди руководителей, предпринимателей и рабочих, но значимо больше среди специалистов и служащих с высшим образованием.
Отличие распределений в группах от нормального проверяем по критерию Колмогорова-Смирнова:

CA_t_st_soc_2

Критерии нормальности распределения

Большие отклонения от нормальности для уровней студент и спец./служ с высшим обр. говорят о неоднородности этих групп. Поэтому данные уровни требуют более тщательного анализа.
Проверим значимость различий:
CA_t_st_soc_3
Поскольку большинство распределений близко к нормальному, воспользуемся множественными сравнениями:

CA_t_st_soc_4

Значимые различия между различными уровнями соц-го положения

Использовался тест Тамхейна, поскольку дисперсии, по тесту Левэне, значимо различаются для всех показателей, кроме вызова.
Как видим, наибольшее число значимых отличий от остальных категорий дали позиции руководитель и предприниматель. При этом они, по сравнению с другими группами (детали см. в таблице), продемонстрировали такие показатели:

  • руководители:
    • высокие – менеджмент (1,1), вызов (1,1)
    • низкие — автономия (0,8)
  • предприниматели:
    • высокие – предпринимательство (2,3)
    • низкие — стабильность работы (2,3)

Числа в скобках – средние значение разности (только для ориентировки, поскольку точное значение надо рассчитывать взвешенно, с учетом числа случаев в каждой группе).
Но посмотрим на предпочтения людей этих групп:

CA_d_st_soc_1

Предпочтения руководителей и предпринимателей

Противоположность в части предпринимательства – это понятно, как и различия по части менеджмента, вызова и служения. Очень показательно низкое предпочтение автономии руководителями — уж очень многое от них не зависит…
А вот что означает такая противоположность в части стабильности работы? То, что предприниматель значительно более самостоятелен в жизнеобеспечении? И что руководители больше всего держатся за работу?
Низкие значения по автономии показали и служ./спец. с высшим образованием. Сравним их с руководителями – ведь именно эти две группы социально наиболее близки и взаимно мобильны:

CA_d_st_soc_2

Предпочтения руководителей и спец./служ. с высшим образованием

Конечно, преобладание менеджмента у руководителей не является неожиданностью. А вот низкие значения по автономии у служ/спец-тов с ВО оказываются куда как более значительными по сравнению с руководителями.
Характерны также для этой категории высокие по величине предпочтения (сравнительно с руководителями) стабильности работы и интеграции жизни. А вот вызова спецы не любят.
Любопытно, что довольно большое число отличий показали домохозяйки по интегрированному стилю жизни – они его ценят выше многих других групп. Приведем данные по предпочтениям домохозяек и руководителей:

CA_d_st_soc_3

Предпочтения руководителей и домохозяек

Действительно, интеграция для домохозяек таки значительна по величине, но всего лишь на 3-м месте. Перед за ней идет вызов, который домохозяйки не очень ценят, вкупе с профкомпетентностью, занявшей первое (хоть и негативное) место по предпочтениям. В общем, все нарисовано, что я могу ещё сказать?
Поскольку имеется 11 уровней фактора Соц. положение 2, то таких сравнений можно провести 55. Какие именно стоит рассматривать, должен сказать заказчик исследования. Отмечу только, что из-за нечеткости уровней данного фактора его анализ представляет собой во многом гадание на кофейной гуще… А кому интересны неустойчивые закономерности?
Интересными представляются данные по кластеризации показателей внутри групп:
CA_d_st_soc_4
Серым выделены ячейки, в которых доля превышает долю по выборке. Красный шрифт указывает, что отличие значимо.
С «базовой» полностью совпадают структуры группы 1 (желтый фон в колонке Соц. положение). Во 2-й группе (синий фон), где женщин мало, хотя их доли не отличаются от таковых по выборке, профкомпетентность тут же переходит в другой кластер. В 3-й группе (белый фон), где мужчины преобладают, кластер из профкомпетентности и стабильности места жит-ва тоже стабилен, но зато началась чехарда в 1-м кластере.
Хорошо видны различия структур именно руководителей и предпринимателей, что подтверждает результаты анализа предпочтений этих групп. Эти структуры максимально отличаются друг от друга — городское расстояние между ними равно 4. В то же время от базовой структуры структура кластеров руководителей отличается на 1, а предпринимателей — на 3.


6. Заключение

Проведенный анализ не затронул взаимодействие факторов – т.е., как меняются зависимости показателей от уровней одного фактора при изменении уровня другого фактора.
Например, для показателя автономия гендерные различия средних значений значимы для возрастной группы 26-31:
CA_d_fin_1
Для прочих групп здесь отличия, конечно, есть, но незначимые. Результат получен при помощи двухфакторного дисперсионного анализа.
Поскольку имеется отклонение распределений от нормального, то требуются трудоемкие попарные сравнения показателей непараметрическими методами. Так как число комбинаций факторов весьма велико, проверка их взаимодействия имеет смысл лишь при наличии «заказа».

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

%d такие блоггеры, как: