Теория социального измерения

Цілісне бачення процесу соціологічного вимірювання

Цілісність бачення процесу соціологічного вимірювання полягає у врахуванні дослідником чотирьох складових цього процесу, а також взаємозв’язків між ними. Такими складовими є соціологічний тест, респонденти, релевантний соціальний контекст, а також сам дослідник, який розробляє методику та/або інтерпретує її результати.
Базовий взаємозв’язок встановлюється між соціологічним тестом та респондентами під час ситуації опитування. Для його успішності респонденти повинні мати можливість та/або бажання повідомити інформацію, яка цікавить дослідника. В даному випадку мова іде про достовірність отриманої інформації (Шмелев, 1996: с. 154-155). По суті навіть використання надійної та валідної вимірювальної методики саме по собі не забезпечує отримання необхідних досліднику даних, якщо респонденти не хочу повідомляти інформацію або з якихось причин не можуть цього зробити. Відповідні зміщення відносяться до категорії помилок, що не пов’язані з вибіркою (McNabb, 2014, p. 42-46). Читать дальше...
Comments

Розробка соціологічних тестів: (само)дебрифінг методологічної ретельності

Термін «дебрифінг» вперше почав застосовуватися в армії сполучних штатів для позначення отримання інформації від пілота або солдата після виконання місії, а також його інструктування щодо того яку інформацію він може оприлюднити. Даний термін був запозичений дослідниками якісного профілю для позначення детального аналізу проведеного дослідження з метою уникнення двох видів зміщень, які можуть виникнути в процесі якісного дослідження. Перший пов’язаний з впливом дослідника на учасників дослідження або ключових інформантів, другий – з впливом учасників дослідження або ключових інформантів на дослідника. Перший різновид має місце в тих випадках, коли дослідник створює загрозу або неадекватно себе позиціонує в певних соціальних або інституційних взаємостосунках, що в подальшому веде до спротиву з боку учасників дослідження. Що стосується другого різновиду, то він має місце в ситуаціях, коли дослідник надмірно зближається з досліджуваною групою. Наприклад, стає повноцінним учасником досліджуваних процесів на противагу ролі периферійного інсайдера, який користується прийнятною аналітичною перспективою та не приймає активної участі в діяльності відповідної групи. Читать дальше...
Comments

Выбор разновидности комплексного измерительного инструмента

21580
Если говорить о различии между шкалами и индексами, то в первом случае речь идет об измерении некоторого непосредственно не наблюдаемого свойства (латентной переменной), обусловливающего те факторы своего проявления (косвенные индикаторы), которые заложены в методику. В свою очередь, предметом измерения интегральных индексов может быть как латентная переменная, так и социальный феномен. Еще одно отличие между ними шкалами и индексами состоит в том, что в случае использования индекса предмет его измерения обусловливается теми факторами, на основании которых сформулированы индикаторы.
Один из ключевых факторов, определяющих выбор между шкалой и индексом, обусловлен природой изучаемого явления. В случае социологического исследования она может быть как индивидуальной, так и общественной. Чтобы прояснить эту мысль, рассмотрим в качестве примера утверждения, которые могут быть положены в основу шкалы или индекса авторитаризма:
− единственная политическая воля обеспечивает стабильность в обществе лучше, чем набор разных точек зрения;
− для нормального развития стране нужна «сильная рука», а не разговоры о демократии;
− только политика «сильной руки» может сохранить порядок в обществе;
− сильное государство возможно лишь тогда, когда во главе страны стоит один лидер;
− наличие единственной партии и сильного политического лидера дает людям уверенность в завтрашнем дне.
С одной стороны, представленные утверждения могут быть оценены в качестве косвенных индикаторов латентной переменной, с другой — каждый из них говорит об одной из ценностей, характеризующих общество: стабильность, развитие, порядок, сила, социальный оптимизм. Если подходить к анализу утверждений с точки зрения общественных ценностей, то не будет концептуальной и методологической необходимости апеллировать к понятию латентной переменной. Например, согласие с тем, что в авторитарном обществе порядка больше, не должно вызывать ожиданий относительно согласия с тем, что авторитарный лидер обеспечит развитие или социальный оптимизм. Здесь респондент предстает уже не как пассивное «наблюдение», сообщающее нам информацию о его внутреннем состоянии, а в качестве эксперта, демонстрирующего ценностные характеристики некоторого общества. Соответственно, речь надо вести не о шкале, а об индексе, направленном на измерение социального феномена — ценностной структуры. Читать дальше...
Comments

Измерительные шкалы VS интегральные индексы

Вчера на ученом совете Института социологии НАН Украины наш отдел закрыл плановую тему, посвященную интегральным социологическим показателям. А сегодня я завершу серию своих заметок, посвященных теории социального измерения.
Stacks Image 14064
Социологический тест реализуется в одной из двух форм – измерительной шкалы или интегрального индекса. Ранее я касался этого вопроса, но очень кратко. Здесь же я хочу остановиться на их сравнении более детально.
Обе указанные реализации интегральных социологических показателей объединяет две вещи: их направленность на измерение комплексных феноменов, а также предположение о причинной взаимосвязи между изучаемым явлением и теми аспектами, которые заложены в основание измерительного инструмента.
Измерительные шкалы прочно «обосновались» в психологии и успешно «колонизировали» социологию. Что касается интегральных индексов, то ареал их «обитания», прежде всего, связан с политологическими исследованиями и, в частности, с сопоставительно-институциональным анализом [Индексы развития государств мира, 2014: с. 7-15]. Почему же не произошла политологическая «экспансия» по образцу психологической? Думаю это связано с объектом измерения. В случае психологии и социологии – это индивид, в случае политологии – государство. Конечно же, политологические исследования могут быть нацелены и на изучение индивидуального уровня, но речь в таком случае опять пойдет об измерительных шкалах.
Здесь невольно задаешься вопросом об иерархической соподчиненности дисциплин с точки зрения используемых измерительных инструментов. На основании представленной ситуации выше всех стоит психология, делегирующая измерительные шкалы остальным социальным наукам. Далее идет политология, имеющая свой собственный инструментарий, представленный индексами. И уже в самом низу находится социология.
Читать дальше...
Comments

Теория социального измерения: допущения, латентные переменные и социальные феномены

Stacks Image 14061
В основании теории измерения, повсеместно используемой сегодня в социальных науках (не важно делается ли это осознанно или на уровне стереотипных методических практик), лежит система понятий, описывающих измерительный процесс, а также система соответствующих научных допущений. Дисциплинарным полем, породившим их, является психология. Поэтому важно оценить то, насколько они релевантны с социологической точки зрения. Поскольку в центре соответствующей парадигмы находится понятие «латентная переменная», то начнем рассмотрение с нее.
Латентная переменная - изучаемый феномен или конструкт, который отображает измерительная шкала. При этом важно понимать некоторые особенности латентных переменных. Во-первых, они не наблюдается непосредственно. Во-вторых, они являются не постоянными, а переменными величинами. В-третьих, это характеристики индивидов, а не объектов, которые они оценивают.
Поскольку латентную переменную невозможно измерить непосредственно, для определения ее истинной величины на основании значений, полученных с помощью индикаторов измерительной методики, применяется ряд методологических и математических допущений. Прежде всего речь идет о допущениях классической теории измерения, к которым относятся следующие:
1. Величина ошибок (под ошибками имеется в виду влияние второстепенных факторов, которые вносят свой вклад в значение по тому или иному индикатору наравне с латентной переменной), связанная с отдельными пунктами методики варьируется случайным образом, что при использования больших выборок ведет к получению несмещенных средних этих пунктов.
2. Ошибки различных пунктов не коррелируют друг с другом. Единственным источником, связывающим значения индикаторов методики, является латентная переменная.
3. Величина ошибок не коррелирует с истинным значением латентной переменной.
Кроме приведенных выше классическая теория измерения также базируется на допущениях параллельных тестов:
1. Сила влияния латентной переменной на каждый из пунктов методики является одной и той же.
2. Каждый пункт методики имеет одинаковую величину ошибок, в том смысле, что влияние факторов отличных от латентной переменной является константой.
На основании этих допущений сформулирован ряд дополняющих их положений, необходимых для обоснования перехода от значений, полученных с помощью индикаторов измерительной шкалы, к истинному значению латентной переменной.
Используя этот подход становится понятно, почему в психологическом тестировании такое большое внимание уделяется надежности измерения — как ретестовой, так и внутренней. При наличии одной главной причины изменчивости индикаторов, которая к тому же действует на них с одинаковой силой, показатели различных видов надежности должны быть высокими.
Читать дальше...
Comments

Социологическое тестирование: нормы VS критериальные уровни

slide1_thumb
Применение норм в психологическом тестировании

Понятие «норма», применительно к психологическому тестированию, относится к результатам, которые показывают представители определенной группы по заданному тесту [Kaplan, 53]. Такие нормы вычисляются с помощью исследований стандартизации и в дальнейшем используются для оценки индивидуальных результатов психологического теста.
Исследования стандартизации заключаются в изучении репрезентативных групп с целью использования полученных результатов в качестве ориентиров сравнения индивидуальных показателей по тесту. Это позволяет выяснить относительное положение участника исследования относительно выборки стандартизации, а также обеспечивает сопоставимость результатов различных тестов [Анастази, 64-65].
Несмотря на то, что этот подход является общепринятым, некоторые его аспекты требуют более детального рассмотрения. Прежде всего это касается понятия «репрезентативность». Так, Клайн говорит о необходимости использования стратифицированной выборки, позволяющей учесть в исследование стандартизации наиболее важные параметры, влияющие на результаты использования теста. В качестве примера он приводит свое исследование, в котором учащиеся шестых классов были стратифицированы по полу, специфике финансирования школы, ее географическому размещению и статусу. Для каждой категории было отобрано по две школы. При этом все школы находились на север Англии. В финальную выборку вошло по 1000 мальчиков и девочек [Клайн, 219]. Следовательно, речь идет не о статистическом обобщении (необходима случайная выборка необходимого объема), а об аналитическом (необходимо изучение релевантных социальных контекстов).
Конечно же, для тестов, имеющих универсальную природу, исследование стандартизации может быть осуществлено и на основании случайной репрезентативной выборки, хотя это и не является принципиальным условием. Последнее связано с тем, что главная цель такого исследования — получение описания изучаемого свойства в различных контекстах, а не описание генеральной совокупности как целого. Здесь уместно вспомнить ироническое замечание Д. Кэмпбелла о том, что для понимания свойств воды, нам не надо черпать из каждой лужи.
Следующий вопрос касается преобразования или статистической нормализации сырых баллов теста, которая позволяет более эффективно решать уже упомянутые задачи — сравнение с результатами выборки стандартизации, а также результатами других тестов. При этом более актуальной задачей в данном случае является именно сравнение результатов различных тестов. Что касается сравнения с результатами выборки стандартизации, то статистические преобразования «завязаны» на феномене нормального распределения. А это значит, что чем ближе эмпирическое распределение результатов использования теста к нормальному, тем меньше смысла в его статистической нормализации. Как указывает Анастази, при приближении распределения первичных показателей к нормальному стандартные показатели, полученные с помощью линейного преобразования, практически не отличаются. Соответственно, статистическая нормализация в таком случае мало или ничего не изменит. Важно учитывать и то, что необходимо добиваться нормального распределения первичных результатов использования теста, а не нормализовать статистическими средствами явно ненормальное распределение [Анастази, 80].
Последнее, что необходимо принять во внимание, — это определение уровней выраженности свойства на основании результатов использования того или иного теста. Очевидно, что исследование стандартизации само по себе ничего не говорит о таких уровнях. По сути, оно проводится с другими целями. Единственное решение этой проблемы, которое встречается в методической литературе (впрочем, оно напрашивается естественным образом), заключается в использовании критериальных норм вместо статистических. В данном случае шкала сырых тестовых баллов калибруется уровнями, определяющими вероятность достижения некоторого критерия или уровней, позволяющих предположить качественно иные состояния участников исследования по изучаемой характеристике [Шмелев, 153-154]. Вместе с тем, о том, как определять критериальные нормы ничего не говорится. Читать дальше...
Comments

Понятие социологического теста

Stacks Image 13947
Часть моей статьи «Социологические тесты: сущность и валидизация», которая должна выйти в третем номере нашего институтского журнала.

Понятие «социологический тест» было введено в научный обиход советским, а ныне российским, социологом и педагогом В. Аванесовым в 1982 году. Он дал этому понятию два определения. Согласно первому, социологический тест - это «система отобранных социологическими методами высказываний, предъявляемых респондентам с целью получения надежной и валидной информации об интересующих признаках», согласно второму - «система высказываний, позволяющих получить обоснованное отображение интересующей эмпирической системы с отношениями в числовую систему с отношениями». В рамках этой статьи я буду придерживаться первого определения.
Двумя аргументами В. Аванесова в пользу выделения социологического теста в качестве самостоятельного метода исследования являются следующие:
1) необходимость изучения в социологических исследования не только психологических (для этого используются психологические тесты), но и социологических феноменов (далее я буду говорить о социальных, а не социологических феноменах), таких как, например, ценностные ориентации, мировозренческие установки, социальные потребности и т.д.;
2) актуальность этого направления исследований на современном этапе развития методологии социальных наук.
На мой взгляд, спустя более чем 30 лет оба этих аргумента не утратили своего веса. Социологические или социальные феномены по-прежнему находятся в фокусе интереса исследователей, а методология разработки и использования социологических тестов за эти годы попала в поле интересов лишь двух украинских социологов - Н. Паниной и Е. Головахи, разработавших ряд социологических тестов, которые сегодня используются в массовых опросах.
Читать дальше...
Comments

Прагматический подход к валидизации измерительных инструментов

Stacks Image 13947
Прагматический в том смысле, что я ориентировался на практику различных традиций, обращающихся к проблеме измерения, а также успешный опыт разработки измерительных инструментов, не объединенный единой системой допущений. При этом я считаю это преимуществом.
Этап 1. Теоретическая валидизация
Феномены, подлежащие измерению могут быть самыми разными: социальными (например, отношение к властным институтам), социально-философскими (например, справедливость), социально-психологическими (например, психологический климат в коллективе), психологическими (например, тревожность).
Соответственно, в качестве теоретической базы измерения также могут использоваться различные источники:
а) научные концепции;
б) профессиональный практический опыт;
в) предварительные специальные исследования;
г) [а в определенных случаях и] универсальный опыт, то есть знания присущие всем представителям определенной социальной общности; примером измерительной методики, построенной на основе универсального опыта, я считаю «Интегральный индекс социального самочувствия».
Тут хотелось бы подчеркнуть свое неприятие подхода, представители которого утверждают, что теоретическая база должна получить свою проверку в рамках измерения. Глубоко убежден, что если исследователь не знает валидна ли она до проведения исследования, не будет знать этого и после. Связано это с тем, что «ломанные» теоретические конструкты вполне могут приводить к приемлемым результатам статистического анализа. С простым примером, проясняющим эту мысль, можно ознакомиться в моей статье «Относительно проблематичности статистической проверки теоретических конструктов».
Говоря более предметно, теоретическая база должна обеспечивать теоретическую валидность измерительного инструмента в трех компонентах – очевидном, содержательном и композиционном (в этой части я опираюсь на собственную концепцию теоретической валидности). Очевидная валидность связана с аргументацией, в рамках которой изучаемый феномен вписывается в окружающую действительность и, соответственно не является «плодом чьих-то фантазий». Содержательная валидность обеспечивает значимость и представительность элементов теоретического конструкта, а композиционная – адекватность его внутренней структуры.
Читать дальше...
Comments