Теория социального измерения

Измерительные шкалы VS интегральные индексы

Вчера на ученом совете Института социологии НАН Украины наш отдел закрыл плановую тему, посвященную интегральным социологическим показателям. А сегодня я завершу серию своих заметок, посвященных теории социального измерения.
Stacks Image 14064
Социологический тест реализуется в одной из двух форм – измерительной шкалы или интегрального индекса. Ранее я касался этого вопроса, но очень кратко. Здесь же я хочу остановиться на их сравнении более детально.
Обе указанные реализации интегральных социологических показателей объединяет две вещи: их направленность на измерение комплексных феноменов, а также предположение о причинной взаимосвязи между изучаемым явлением и теми аспектами, которые заложены в основание измерительного инструмента.
Измерительные шкалы прочно «обосновались» в психологии и успешно «колонизировали» социологию. Что касается интегральных индексов, то ареал их «обитания», прежде всего, связан с политологическими исследованиями и, в частности, с сопоставительно-институциональным анализом [Индексы развития государств мира, 2014: с. 7-15]. Почему же не произошла политологическая «экспансия» по образцу психологической? Думаю это связано с объектом измерения. В случае психологии и социологии – это индивид, в случае политологии – государство. Конечно же, политологические исследования могут быть нацелены и на изучение индивидуального уровня, но речь в таком случае опять пойдет об измерительных шкалах.
Здесь невольно задаешься вопросом об иерархической соподчиненности дисциплин с точки зрения используемых измерительных инструментов. На основании представленной ситуации выше всех стоит психология, делегирующая измерительные шкалы остальным социальным наукам. Далее идет политология, имеющая свой собственный инструментарий, представленный индексами. И уже в самом низу находится социология.
Читать дальше...
Comments

Теория социального измерения: допущения, латентные переменные и социальные феномены

Stacks Image 14061
В основании теории измерения, повсеместно используемой сегодня в социальных науках (не важно делается ли это осознанно или на уровне стереотипных методических практик), лежит система понятий, описывающих измерительный процесс, а также система соответствующих научных допущений. Дисциплинарным полем, породившим их, является психология. Поэтому важно оценить то, насколько они релевантны с социологической точки зрения. Поскольку в центре соответствующей парадигмы находится понятие «латентная переменная», то начнем рассмотрение с нее.
Латентная переменная - изучаемый феномен или конструкт, который отображает измерительная шкала. При этом важно понимать некоторые особенности латентных переменных. Во-первых, они не наблюдается непосредственно. Во-вторых, они являются не постоянными, а переменными величинами. В-третьих, это характеристики индивидов, а не объектов, которые они оценивают.
Поскольку латентную переменную невозможно измерить непосредственно, для определения ее истинной величины на основании значений, полученных с помощью индикаторов измерительной методики, применяется ряд методологических и математических допущений. Прежде всего речь идет о допущениях классической теории измерения, к которым относятся следующие:
1. Величина ошибок (под ошибками имеется в виду влияние второстепенных факторов, которые вносят свой вклад в значение по тому или иному индикатору наравне с латентной переменной), связанная с отдельными пунктами методики варьируется случайным образом, что при использования больших выборок ведет к получению несмещенных средних этих пунктов.
2. Ошибки различных пунктов не коррелируют друг с другом. Единственным источником, связывающим значения индикаторов методики, является латентная переменная.
3. Величина ошибок не коррелирует с истинным значением латентной переменной.
Кроме приведенных выше классическая теория измерения также базируется на допущениях параллельных тестов:
1. Сила влияния латентной переменной на каждый из пунктов методики является одной и той же.
2. Каждый пункт методики имеет одинаковую величину ошибок, в том смысле, что влияние факторов отличных от латентной переменной является константой.
На основании этих допущений сформулирован ряд дополняющих их положений, необходимых для обоснования перехода от значений, полученных с помощью индикаторов измерительной шкалы, к истинному значению латентной переменной.
Используя этот подход становится понятно, почему в психологическом тестировании такое большое внимание уделяется надежности измерения — как ретестовой, так и внутренней. При наличии одной главной причины изменчивости индикаторов, которая к тому же действует на них с одинаковой силой, показатели различных видов надежности должны быть высокими.
Читать дальше...
Comments

Социологическое тестирование: нормы VS критериальные уровни

slide1_thumb
Применение норм в психологическом тестировании

Понятие «норма», применительно к психологическому тестированию, относится к результатам, которые показывают представители определенной группы по заданному тесту [Kaplan, 53]. Такие нормы вычисляются с помощью исследований стандартизации и в дальнейшем используются для оценки индивидуальных результатов психологического теста.
Исследования стандартизации заключаются в изучении репрезентативных групп с целью использования полученных результатов в качестве ориентиров сравнения индивидуальных показателей по тесту. Это позволяет выяснить относительное положение участника исследования относительно выборки стандартизации, а также обеспечивает сопоставимость результатов различных тестов [Анастази, 64-65].
Несмотря на то, что этот подход является общепринятым, некоторые его аспекты требуют более детального рассмотрения. Прежде всего это касается понятия «репрезентативность». Так, Клайн говорит о необходимости использования стратифицированной выборки, позволяющей учесть в исследование стандартизации наиболее важные параметры, влияющие на результаты использования теста. В качестве примера он приводит свое исследование, в котором учащиеся шестых классов были стратифицированы по полу, специфике финансирования школы, ее географическому размещению и статусу. Для каждой категории было отобрано по две школы. При этом все школы находились на север Англии. В финальную выборку вошло по 1000 мальчиков и девочек [Клайн, 219]. Следовательно, речь идет не о статистическом обобщении (необходима случайная выборка необходимого объема), а об аналитическом (необходимо изучение релевантных социальных контекстов).
Конечно же, для тестов, имеющих универсальную природу, исследование стандартизации может быть осуществлено и на основании случайной репрезентативной выборки, хотя это и не является принципиальным условием. Последнее связано с тем, что главная цель такого исследования — получение описания изучаемого свойства в различных контекстах, а не описание генеральной совокупности как целого. Здесь уместно вспомнить ироническое замечание Д. Кэмпбелла о том, что для понимания свойств воды, нам не надо черпать из каждой лужи.
Следующий вопрос касается преобразования или статистической нормализации сырых баллов теста, которая позволяет более эффективно решать уже упомянутые задачи — сравнение с результатами выборки стандартизации, а также результатами других тестов. При этом более актуальной задачей в данном случае является именно сравнение результатов различных тестов. Что касается сравнения с результатами выборки стандартизации, то статистические преобразования «завязаны» на феномене нормального распределения. А это значит, что чем ближе эмпирическое распределение результатов использования теста к нормальному, тем меньше смысла в его статистической нормализации. Как указывает Анастази, при приближении распределения первичных показателей к нормальному стандартные показатели, полученные с помощью линейного преобразования, практически не отличаются. Соответственно, статистическая нормализация в таком случае мало или ничего не изменит. Важно учитывать и то, что необходимо добиваться нормального распределения первичных результатов использования теста, а не нормализовать статистическими средствами явно ненормальное распределение [Анастази, 80].
Последнее, что необходимо принять во внимание, — это определение уровней выраженности свойства на основании результатов использования того или иного теста. Очевидно, что исследование стандартизации само по себе ничего не говорит о таких уровнях. По сути, оно проводится с другими целями. Единственное решение этой проблемы, которое встречается в методической литературе (впрочем, оно напрашивается естественным образом), заключается в использовании критериальных норм вместо статистических. В данном случае шкала сырых тестовых баллов калибруется уровнями, определяющими вероятность достижения некоторого критерия или уровней, позволяющих предположить качественно иные состояния участников исследования по изучаемой характеристике [Шмелев, 153-154]. Вместе с тем, о том, как определять критериальные нормы ничего не говорится. Читать дальше...
Comments

Понятие социологического теста

Stacks Image 13947
Часть моей статьи «Социологические тесты: сущность и валидизация», которая должна выйти в третем номере нашего институтского журнала.

Понятие «социологический тест» было введено в научный обиход советским, а ныне российским, социологом и педагогом В. Аванесовым в 1982 году. Он дал этому понятию два определения. Согласно первому, социологический тест - это «система отобранных социологическими методами высказываний, предъявляемых респондентам с целью получения надежной и валидной информации об интересующих признаках», согласно второму - «система высказываний, позволяющих получить обоснованное отображение интересующей эмпирической системы с отношениями в числовую систему с отношениями». В рамках этой статьи я буду придерживаться первого определения.
Двумя аргументами В. Аванесова в пользу выделения социологического теста в качестве самостоятельного метода исследования являются следующие:
1) необходимость изучения в социологических исследования не только психологических (для этого используются психологические тесты), но и социологических феноменов (далее я буду говорить о социальных, а не социологических феноменах), таких как, например, ценностные ориентации, мировозренческие установки, социальные потребности и т.д.;
2) актуальность этого направления исследований на современном этапе развития методологии социальных наук.
На мой взгляд, спустя более чем 30 лет оба этих аргумента не утратили своего веса. Социологические или социальные феномены по-прежнему находятся в фокусе интереса исследователей, а методология разработки и использования социологических тестов за эти годы попала в поле интересов лишь двух украинских социологов - Н. Паниной и Е. Головахи, разработавших ряд социологических тестов, которые сегодня используются в массовых опросах.
Читать дальше...
Comments

Прагматический подход к валидизации измерительных инструментов

Stacks Image 13947
Прагматический в том смысле, что я ориентировался на практику различных традиций, обращающихся к проблеме измерения, а также успешный опыт разработки измерительных инструментов, не объединенный единой системой допущений. При этом я считаю это преимуществом.
Этап 1. Теоретическая валидизация
Феномены, подлежащие измерению могут быть самыми разными: социальными (например, отношение к властным институтам), социально-философскими (например, справедливость), социально-психологическими (например, психологический климат в коллективе), психологическими (например, тревожность).
Соответственно, в качестве теоретической базы измерения также могут использоваться различные источники:
а) научные концепции;
б) профессиональный практический опыт;
в) предварительные специальные исследования;
г) [а в определенных случаях и] универсальный опыт, то есть знания присущие всем представителям определенной социальной общности; примером измерительной методики, построенной на основе универсального опыта, я считаю «Интегральный индекс социального самочувствия».
Тут хотелось бы подчеркнуть свое неприятие подхода, представители которого утверждают, что теоретическая база должна получить свою проверку в рамках измерения. Глубоко убежден, что если исследователь не знает валидна ли она до проведения исследования, не будет знать этого и после. Связано это с тем, что «ломанные» теоретические конструкты вполне могут приводить к приемлемым результатам статистического анализа. С простым примером, проясняющим эту мысль, можно ознакомиться в моей статье «Относительно проблематичности статистической проверки теоретических конструктов».
Говоря более предметно, теоретическая база должна обеспечивать теоретическую валидность измерительного инструмента в трех компонентах – очевидном, содержательном и композиционном (в этой части я опираюсь на собственную концепцию теоретической валидности). Очевидная валидность связана с аргументацией, в рамках которой изучаемый феномен вписывается в окружающую действительность и, соответственно не является «плодом чьих-то фантазий». Содержательная валидность обеспечивает значимость и представительность элементов теоретического конструкта, а композиционная – адекватность его внутренней структуры.
Читать дальше...
Comments