Влияние способа кластеризации на результаты использования теста "Типы политической культуры"

political divide
Тема сегодняшней статьи - влияние выбора метода статистической обработки на результаты кластеризации / типологии. В качестве примера используется применение социологического теста «Типы политической культуры» (Е.И. Головаха). Концепция данного теста заключается в использовании двух измерительных шкал - «демократии / антидемократии» и « гражданской активности / пассивности». Соответственно, в оригинальном варианте в результате ее использования респондента можно отнести к одной из четырех групп: активным демократам, пассивным демократам, пассивным антидемократам, активным антидемократам. При этом предлагается использовать кластерный анализ методом К-средних. Далее представлены результаты использования как кластерного анализа, так и ряда его альтернатив - идеальной точки деления, концептуальной типологии и латентного классового анализа.

Способы кластеризации

Идеальная точка деления задает координату, разбивающую всю совокупность респондентов на четыре группы. Поскольку в данном случае мы имеем две аддитивные шкалы с диапазоном возможных значений от 6 до 30, значение, которое делит этот диапазон на две равные половины составляет 17,5. Интуитивным улучшением этого способа является введение некоторой зоны вокруг точки деления (далее это будет 2,5 балла по обеим осям), попадание в которую трактуется как неопределенная позиция в отношении демократии и гражданской активности.

Концептуальная типология
заключается в использовании содержательных принципов анализа ответов респондентов, позволяющих сгруппировать наблюдения в рамках теоретически обоснованных групп. Для этого теста я использовал два взаимосвязанных содержательных принципа анализа: 1) «веер» ответов «полностью согласен / скорее согласен / трудно сказать, согласен или нет / скорее не согласен / абсолютно не согласен» задает три основных модальности – согласия, неопределенности и несогласия; 2) шесть индикаторов позволяют выразить респонденту одну из четырех базовых установок – поддержки (в ответах преобладает согласие), амбивалентности (в ответах в равной мере присутствует и согласие, и несогласие), сопротивления (в ответах преобладает несогласие), неопределенности (в ответах преобладает неопределенность).
Исходя из этих принципов, техническое решение для концептуальной типологии будет заключаться в перечислении всех возможных комбинаций для шести индикаторов. При этом я не проводил различия между «полностью согласен» и «скорее согласен», а также между «полностью не согласен» и «скорее не согласен»:

Концептуальная типология для социологического теста «Типы политической культуры»: техническое решение

Поддержка 1) согласия по четырем и более индикаторам; 2) согласие по трем индикаторам и неопределенность хотя бы по одному из оставшихся.
Амбивалентность 1) согласие по трем индикаторам и несогласие по трем индикаторам; 2) одинаковая представленность согласия, несогласия и неопределенности.
Сопротивление 1) несогласие по четырем и более индикаторам; 2) несогласие по трем индикаторам и неопределенность хотя бы по одному из оставшихся.
Неопределенность 1) неопределенность по четырем и более индикаторам; 2) неопределенность по трем индикаторам и наличие как согласия, так и несогласия среди оставшихся.
Кластерный анализ методом K-средних представляет собой подход для разбиения некоторого набора данных на К отдельных непересекающихся кластеров. Идея, лежащая в основе этого метода, базируется на минимизации внутрикластерной изменчивости n-размерного набора данных. Для разбиения наблюдений на k кластеров используется следующий алгоритм: 1) первые k наблюдений принимаются в качестве k кластеров с одной точкой в каждом кластере; 2) оставшиеся m – k наблюдений поочередно приписываются к одному из k кластеров на основании кратчайшей дистанции между наблюдением и центроидом кластера; после каждого приписывания центроид пересчитывается для соответствующего кластера; 3) после приписывания каждого наблюдения к одному из k кластеров кластерные центроиды принимаются в качестве начальных точек и каждое наблюдение вновь приписывается одному из k кластеров на основании ближайшей к центроиду дистанции; этот этап повторяется необходимое количество раз.

Латентный классовый анализ является методом или техникой идентификации необозначенных групп индивидов или наблюдений в данных на основании многомерных категориальных переменных. Латентный классовый анализ использует вероятностную модель, описывающую распределение ответов по нескольким вопросам в различных группах. Оценка параметров модели ведет к прояснению групп, лежащих в основе такого распределения, в терминах вероятностных паттернов ответов на вопросы.

Результаты

Несмотря на то, что в оригинале тест предусматривает выделение четырех типов политической культуры, в рамках данной статьи кластеризация предусматривает пять (для идеальной точки деления, кластерного анализа и латентного классового анализа), а также девять (для концептуальной типологии) групп [из анализа исключены слабо наполненные группы; размер шести из них составляет менее 1,0%, одной – 1,2%]. Это сделано с целью учета содержательных характеристик теста. Решение о принадлежности группы принималось на основании средних значений (центроидов) групп.
При рассмотрении этих результатов следует помнить, что лишь в случае концептуальной типологии можно говорить о демократизме / антидемократизме и гражданской активности / пассивности в абсолютном смысле. В остальных случаях такие размышления относительны: для идеальной точки деления – в меньшей степени (благодаря четкости критерия), для кластерного анализа и латентного классового анализа – в большей.

Наполненность групп в соответствии с различными решения кластеризации, %

Группа ИТД КТ КА ЛКА
Активные демократы 22,4 14,7 17,2 14,3
Пассивные демократы 56,1 43,7 21,1 14,5
Неопределившиеся в обоих смыслах 10,0 5,2 30,3 -
Пассивные антидемократы 7,4 4,5 14,3 22,9
Активные антидемократы 4,1 2,4 17,1 23,5
Демократы, амбивалентные относительно гражданской активности - 5,4 - -
Демократы, неопределившиеся относительно гражданской активности - 6,2 - -
Политически неопределившиеся и граждански активные - 2,1 - -
Политически неопределившиеся и граждански пассивные - 11,5 - 24,8
ИТД - идеальная точка деления; КТ - концептуальная типология; КА - кластерный анализ; ЛКА - латентный классовый анализ.
Как видно, наиболее похожую наполненность групп демонстрируют способы деления по идеальной точке и с помощью концептуальной типологии. Интересно и то, что в рамках латентного классового анализа пятая группа представлена не теми, кто находится «по середине» относительно всех остальных, а политически неопределившимися и граждански пассивными респондентами.

Краткие выводы

Поскольку я далек от мысли, что в нашем обществе может быть 17,1% и уж тем более 23,5% активных антидемократов, то склоняюсь к выбору результатов концептуальной типологии (максимально учитывает содержательную специфику теста) или идеальной точки деления (хорошо соответствует результатам КТ + проста в реализации и интерпретации).
Data science (3)
Europe (2)
Geopolitics (2)
Infographics (1)
R (26)
Russia (2)
SPSS (2)
Ukraine (2)
Акционализм (1)
Анализ данных (27)
Аномия (1)
Выборка (1)
Выступления (3)
Геополитика (12)
Гражданское общество (2)
Демократизация (1)
Европа (4)
Интернет ресурсы (1)
Инфографика (8)
Исследовательские дизайны (1)
Историческая социология (10)
История социологии (5)
Киберспорт (1)
Книги (7)
Массивы (3)
Методология социальных исследований (1)
Методология социологических исследований (2)
Научная жизнь (3)
Новости (6)
Обратная связь (1)
Персоналии (3)
Православные конфессии в Украине (1)
Президентская власть (1)
Психологический дистресс (18)
Психология (5)
Публицистика (2)
Революция (1)
Результаты исследований (28)
Религия (3)
Россия (2)
Согласование концептов (4)
Социальная гетерогенность (1)
Социальная работа (1)
Социологическая теория (6)
Социологические тесты (1)
Социологическое образование (5)
Теория конфликта (2)
Теория социального измерения (8)
Украина (9)
Учебные планы (2)
Философия (1)
Шкалирование (36)
Экономика (1)
Эмпирическая социология (46)

free counters
Яндекс.Метрика