Влияние способа кластеризации на результаты использования теста "Типы политической культуры"

political divide
Тема сегодняшней статьи - влияние выбора метода статистической обработки на результаты кластеризации / типологии. В качестве примера используется применение социологического теста «Типы политической культуры» (Е.И. Головаха). Концепция данного теста заключается в использовании двух измерительных шкал - «демократии / антидемократии» и « гражданской активности / пассивности». Соответственно, в оригинальном варианте в результате ее использования респондента можно отнести к одной из четырех групп: активным демократам, пассивным демократам, пассивным антидемократам, активным антидемократам. При этом предлагается использовать кластерный анализ методом К-средних. Далее представлены результаты использования как кластерного анализа, так и ряда его альтернатив - идеальной точки деления, концептуальной типологии и латентного классового анализа.

Способы кластеризации

Идеальная точка деления задает координату, разбивающую всю совокупность респондентов на четыре группы. Поскольку в данном случае мы имеем две аддитивные шкалы с диапазоном возможных значений от 6 до 30, значение, которое делит этот диапазон на две равные половины составляет 17,5. Интуитивным улучшением этого способа является введение некоторой зоны вокруг точки деления (далее это будет 2,5 балла по обеим осям), попадание в которую трактуется как неопределенная позиция в отношении демократии и гражданской активности.

Концептуальная типология
заключается в использовании содержательных принципов анализа ответов респондентов, позволяющих сгруппировать наблюдения в рамках теоретически обоснованных групп. Для этого теста я использовал два взаимосвязанных содержательных принципа анализа: 1) «веер» ответов «полностью согласен / скорее согласен / трудно сказать, согласен или нет / скорее не согласен / абсолютно не согласен» задает три основных модальности – согласия, неопределенности и несогласия; 2) шесть индикаторов позволяют выразить респонденту одну из четырех базовых установок – поддержки (в ответах преобладает согласие), амбивалентности (в ответах в равной мере присутствует и согласие, и несогласие), сопротивления (в ответах преобладает несогласие), неопределенности (в ответах преобладает неопределенность).
Исходя из этих принципов, техническое решение для концептуальной типологии будет заключаться в перечислении всех возможных комбинаций для шести индикаторов. При этом я не проводил различия между «полностью согласен» и «скорее согласен», а также между «полностью не согласен» и «скорее не согласен»:

Концептуальная типология для социологического теста «Типы политической культуры»: техническое решение

Поддержка 1) согласия по четырем и более индикаторам; 2) согласие по трем индикаторам и неопределенность хотя бы по одному из оставшихся.
Амбивалентность 1) согласие по трем индикаторам и несогласие по трем индикаторам; 2) одинаковая представленность согласия, несогласия и неопределенности.
Сопротивление 1) несогласие по четырем и более индикаторам; 2) несогласие по трем индикаторам и неопределенность хотя бы по одному из оставшихся.
Неопределенность 1) неопределенность по четырем и более индикаторам; 2) неопределенность по трем индикаторам и наличие как согласия, так и несогласия среди оставшихся.
Кластерный анализ методом K-средних представляет собой подход для разбиения некоторого набора данных на К отдельных непересекающихся кластеров. Идея, лежащая в основе этого метода, базируется на минимизации внутрикластерной изменчивости n-размерного набора данных. Для разбиения наблюдений на k кластеров используется следующий алгоритм: 1) первые k наблюдений принимаются в качестве k кластеров с одной точкой в каждом кластере; 2) оставшиеся m – k наблюдений поочередно приписываются к одному из k кластеров на основании кратчайшей дистанции между наблюдением и центроидом кластера; после каждого приписывания центроид пересчитывается для соответствующего кластера; 3) после приписывания каждого наблюдения к одному из k кластеров кластерные центроиды принимаются в качестве начальных точек и каждое наблюдение вновь приписывается одному из k кластеров на основании ближайшей к центроиду дистанции; этот этап повторяется необходимое количество раз.

Латентный классовый анализ является методом или техникой идентификации необозначенных групп индивидов или наблюдений в данных на основании многомерных категориальных переменных. Латентный классовый анализ использует вероятностную модель, описывающую распределение ответов по нескольким вопросам в различных группах. Оценка параметров модели ведет к прояснению групп, лежащих в основе такого распределения, в терминах вероятностных паттернов ответов на вопросы.

Результаты

Несмотря на то, что в оригинале тест предусматривает выделение четырех типов политической культуры, в рамках данной статьи кластеризация предусматривает пять (для идеальной точки деления, кластерного анализа и латентного классового анализа), а также девять (для концептуальной типологии) групп [из анализа исключены слабо наполненные группы; размер шести из них составляет менее 1,0%, одной – 1,2%]. Это сделано с целью учета содержательных характеристик теста. Решение о принадлежности группы принималось на основании средних значений (центроидов) групп.
При рассмотрении этих результатов следует помнить, что лишь в случае концептуальной типологии можно говорить о демократизме / антидемократизме и гражданской активности / пассивности в абсолютном смысле. В остальных случаях такие размышления относительны: для идеальной точки деления – в меньшей степени (благодаря четкости критерия), для кластерного анализа и латентного классового анализа – в большей.

Наполненность групп в соответствии с различными решения кластеризации, %

Группа ИТД КТ КА ЛКА
Активные демократы 22,4 14,7 17,2 14,3
Пассивные демократы 56,1 43,7 21,1 14,5
Неопределившиеся в обоих смыслах 10,0 5,2 30,3 -
Пассивные антидемократы 7,4 4,5 14,3 22,9
Активные антидемократы 4,1 2,4 17,1 23,5
Демократы, амбивалентные относительно гражданской активности - 5,4 - -
Демократы, неопределившиеся относительно гражданской активности - 6,2 - -
Политически неопределившиеся и граждански активные - 2,1 - -
Политически неопределившиеся и граждански пассивные - 11,5 - 24,8
ИТД - идеальная точка деления; КТ - концептуальная типология; КА - кластерный анализ; ЛКА - латентный классовый анализ.
Как видно, наиболее похожую наполненность групп демонстрируют способы деления по идеальной точке и с помощью концептуальной типологии. Интересно и то, что в рамках латентного классового анализа пятая группа представлена не теми, кто находится «по середине» относительно всех остальных, а политически неопределившимися и граждански пассивными респондентами.

Краткие выводы

Поскольку я далек от мысли, что в нашем обществе может быть 17,1% и уж тем более 23,5% активных антидемократов, то склоняюсь к выбору результатов концептуальной типологии (максимально учитывает содержательную специфику теста) или идеальной точки деления (хорошо соответствует результатам КТ + проста в реализации и интерпретации).
blog comments powered by Disqus