Относительно проблематичности статистической проверки теоретических конструктов
22/03/14 12:46 Относится к категории: Эмпирическая социология | Шкалирование

Я уже не говорю о комичных, но повсеместно распространенных в социологии ситуациях, когда статистически значимые результаты, полученные на больших выборках (скажем от 1500 и выше единиц), расцениваются в качестве ценных с научной точки зрения (или подтверждающих что-либо) лишь по факту своей статистической значимости. А на больших выборках, как известно, практически все статистически значимо.
Такие размышления выдвигают на передний план проблему теоретической валидности, достижение которой призвано обеспечить исследователя валидными, в отношении изучаемых социальных феноменов, теоретическими конструктами. Следовательно, теоретическая валидизация является во многом автономной и определяющей, в отношении дальнейшей операционализации и эмпирической интерпретации, сферой. Легко представить ситуацию, когда теоретический конструкт описан достаточно исчерпывающе, однако разработанная методика не обеспечивает удовлетворительного отображения данного конструкта. Согласно «лучшим» традициям количественного подхода, в такой ситуации можно смело отказаться от теоретического конструкта, не прошедшего проверку. И противоположный случай – хотя методика позволяет вполне адекватно отобразить конструкт, но этот конструкт содержательно не валиден (например, охватывает только часть концептуального поля, которое находится в фокусе исследования). В данном случае будут приняты опять таки ошибочные выводы – в этот раз уже о правильности невалидного конструкта.
Для более подробного описания последней ситуации обратимся к следующему примеру. В одной из своих недавних публикаций [Дембицкий, 2012] я описал специфику теоретической валидизации измерительных шкал. В качестве демонстрационного примера была взята шкала, предназначенная для определения типа студента, указывающего на его отношение к учебе (безразличный, декларативно заинтересованный или ответственный) на основании используемых студентом поведенческих стратегий. В ходе валидизации этой шкалы был проведен ряд опросов, в том числе и с помощью экспертов, в качестве которых выступили преподаватели и сами студенты (в этом случае они оценивали не только себя, но и своих одногруппников). Два таких опроса (N1 = 22, N2 = 23) я и использую для того, чтобы показать как «ломаный» конструкт может привести к хорошим статистическим результатам.
В первом из них каждый из четырех экспертов (три преподавателя и один студент) оценили каждого из студентов одной учебной группы по 10-бальшой шкале (смотри приложение 1). Не вдаваясь в подробности, отмечу лишь то, что значения от 1 до 5 соответствовали безразличному типу, от 6 до 7 – декларативно заинтересованному, от 8 до 10 – ответственному. Далее были рассчитаны: а) обобщенная оценка на основании среднего арифметического оценок всех экспертов; б) коэффициент корреляции между обобщенной оценкой каждого студента и его средним баллом успешности сдачи сессий за четыре года обучения. Так вот, этот коэффициент корреляции был равен 0,93 (p < 0,01%).
В лучших традициях количественного подхода я бы мог решить, что я получил подтверждение (по крайней мере, частичное) правильности применяемого теоретического конструкта. Но я и так знал, что он правильный, ведь я использовал валидный теоретический конструкт (валидность конструкта была достигнута на предыдущих этапах исследования посредством качественных методов).
Давайте теперь посмотрим, что произойдет, если из содержания используемого теоретического конструкта убрать значительную часть, а именно информацию – о безразличном типе (часть шкалы от 1 до 5). В этом случае каждому студенту, который получил обобщенную оценку от 1 до 5,499 (таких было восемь человек или 36,4% от общего числа), необходимо присвоить 6, а остальные оценки оставить без изменений. Насколько сильно изменился коэффициент корреляции? После преобразования шкалы он стал равен 0,70 (вероятность ошибки по-прежнему не превышала 0,01%).
Вместе с тем, это всего лишь мыслительный эксперимент. Поэтому я провел дополнительный методический эксперимент в учебной группе другого вуза. В качестве экспертов выступили два преподавателя, хорошо знакомые с группой, и двое старост. На первом этапе они оценили всех студентов с помощью шкалы, которая была специально искажена. В ней отсутствовала вторая часть (от 6 до 10), то есть оценка осуществлялась на основании только двух типов студентов – безразличного и декларативно заинтересованного, представленных пунктами шкалы от 1 до 5 (смотри приложение 2). Лишь один из экспертов (одна из старост) поставила валидность шкалы под сомнение, но после объяснения что это методический эксперимент и так надо, заполнила анкету. Усредненные результаты оценок экспертов показали высокую взаимосвязь со средним баллом успешности сдачи сессий за четыре года обучения (r = 0,80; p < 0,01%).
Через месяц я попросил этих экспертов повторить оценку, но уже с использованием полноценной 10-бальной шкалы. В результате коэффициент корреляции вырос незначительно, а именно до 0,81. Отталкиваясь исключительно от статистической информации можно сделать вывод, что валидность этих шкал (по крайней мере, при использовании в отношении этой конкретной группы студентов) является одинаковой. Вместе с тем, очень вероятно, что в случае использования неполноценной шкалы, эксперты ориентировались в первую очередь на числовые пункты, а не на содержание двух описанных в вопросе типов. По моему мнению, такая ситуация может иметь место в том случае, когда эксперты хорошо знакомы с изучаемой проблемой. Соответственно, неучтенная в тексте вопроса информация все равно учитывается ими в силу их знаний и опыта. Таким образом, статистическая валидность шкалы компенсируется посредством когнитивных возможностей экспертов. А вот содержательная (а более широко – теоретическая) валидность шкалы является сомнительной, поскольку она не позволяет перейти к трем типам студентов. В свою очередь полноценный вариант шкалы является валидным во всех отношениях – и в статистическом, и в теоретическом.
На этом примере я хочу показать лишь одно – искаженные конструкты вполне могут получить «подтверждение» на основании результатов измерения с дальнейшей статистической проверкой. И эта проблема не может быть решена в рамках количественного подхода.
Первоочередное значение в разработке валидных теоретических конструктов должно занимать изучение окружающей социальной действительности посредством тщательного наблюдения происходящих в ней процессов, а также личного взаимодействия с участниками таких процессов.
Для более подробного описания последней ситуации обратимся к следующему примеру. В одной из своих недавних публикаций [Дембицкий, 2012] я описал специфику теоретической валидизации измерительных шкал. В качестве демонстрационного примера была взята шкала, предназначенная для определения типа студента, указывающего на его отношение к учебе (безразличный, декларативно заинтересованный или ответственный) на основании используемых студентом поведенческих стратегий. В ходе валидизации этой шкалы был проведен ряд опросов, в том числе и с помощью экспертов, в качестве которых выступили преподаватели и сами студенты (в этом случае они оценивали не только себя, но и своих одногруппников). Два таких опроса (N1 = 22, N2 = 23) я и использую для того, чтобы показать как «ломаный» конструкт может привести к хорошим статистическим результатам.
В первом из них каждый из четырех экспертов (три преподавателя и один студент) оценили каждого из студентов одной учебной группы по 10-бальшой шкале (смотри приложение 1). Не вдаваясь в подробности, отмечу лишь то, что значения от 1 до 5 соответствовали безразличному типу, от 6 до 7 – декларативно заинтересованному, от 8 до 10 – ответственному. Далее были рассчитаны: а) обобщенная оценка на основании среднего арифметического оценок всех экспертов; б) коэффициент корреляции между обобщенной оценкой каждого студента и его средним баллом успешности сдачи сессий за четыре года обучения. Так вот, этот коэффициент корреляции был равен 0,93 (p < 0,01%).
В лучших традициях количественного подхода я бы мог решить, что я получил подтверждение (по крайней мере, частичное) правильности применяемого теоретического конструкта. Но я и так знал, что он правильный, ведь я использовал валидный теоретический конструкт (валидность конструкта была достигнута на предыдущих этапах исследования посредством качественных методов).
Давайте теперь посмотрим, что произойдет, если из содержания используемого теоретического конструкта убрать значительную часть, а именно информацию – о безразличном типе (часть шкалы от 1 до 5). В этом случае каждому студенту, который получил обобщенную оценку от 1 до 5,499 (таких было восемь человек или 36,4% от общего числа), необходимо присвоить 6, а остальные оценки оставить без изменений. Насколько сильно изменился коэффициент корреляции? После преобразования шкалы он стал равен 0,70 (вероятность ошибки по-прежнему не превышала 0,01%).
Вместе с тем, это всего лишь мыслительный эксперимент. Поэтому я провел дополнительный методический эксперимент в учебной группе другого вуза. В качестве экспертов выступили два преподавателя, хорошо знакомые с группой, и двое старост. На первом этапе они оценили всех студентов с помощью шкалы, которая была специально искажена. В ней отсутствовала вторая часть (от 6 до 10), то есть оценка осуществлялась на основании только двух типов студентов – безразличного и декларативно заинтересованного, представленных пунктами шкалы от 1 до 5 (смотри приложение 2). Лишь один из экспертов (одна из старост) поставила валидность шкалы под сомнение, но после объяснения что это методический эксперимент и так надо, заполнила анкету. Усредненные результаты оценок экспертов показали высокую взаимосвязь со средним баллом успешности сдачи сессий за четыре года обучения (r = 0,80; p < 0,01%).
Через месяц я попросил этих экспертов повторить оценку, но уже с использованием полноценной 10-бальной шкалы. В результате коэффициент корреляции вырос незначительно, а именно до 0,81. Отталкиваясь исключительно от статистической информации можно сделать вывод, что валидность этих шкал (по крайней мере, при использовании в отношении этой конкретной группы студентов) является одинаковой. Вместе с тем, очень вероятно, что в случае использования неполноценной шкалы, эксперты ориентировались в первую очередь на числовые пункты, а не на содержание двух описанных в вопросе типов. По моему мнению, такая ситуация может иметь место в том случае, когда эксперты хорошо знакомы с изучаемой проблемой. Соответственно, неучтенная в тексте вопроса информация все равно учитывается ими в силу их знаний и опыта. Таким образом, статистическая валидность шкалы компенсируется посредством когнитивных возможностей экспертов. А вот содержательная (а более широко – теоретическая) валидность шкалы является сомнительной, поскольку она не позволяет перейти к трем типам студентов. В свою очередь полноценный вариант шкалы является валидным во всех отношениях – и в статистическом, и в теоретическом.
На этом примере я хочу показать лишь одно – искаженные конструкты вполне могут получить «подтверждение» на основании результатов измерения с дальнейшей статистической проверкой. И эта проблема не может быть решена в рамках количественного подхода.
Первоочередное значение в разработке валидных теоретических конструктов должно занимать изучение окружающей социальной действительности посредством тщательного наблюдения происходящих в ней процессов, а также личного взаимодействия с участниками таких процессов.
Data science (3)
Europe (2)
Geopolitics (2)
Infographics (1)
R (26)
Russia (2)
SPSS (2)
Ukraine (2)
Акционализм (1)
Анализ данных (27)
Аномия (1)
Выборка (1)
Выступления (3)
Геополитика (12)
Гражданское общество (2)
Демократизация (1)
Европа (4)
Интернет ресурсы (1)
Инфографика (8)
Исследовательские дизайны (1)
Историческая социология (10)
История социологии (5)
Киберспорт (1)
Книги (7)
Массивы (3)
Методология социальных исследований (1)
Методология социологических исследований (2)
Научная жизнь (3)
Новости (6)
Обратная связь (1)
Персоналии (3)
Православные конфессии в Украине (1)
Президентская власть (1)
Психологический дистресс (18)
Психология (5)
Публицистика (2)
Революция (1)
Результаты исследований (28)
Религия (3)
Россия (2)
Согласование концептов (4)
Социальная гетерогенность (1)
Социальная работа (1)
Социологическая теория (6)
Социологические тесты (1)
Социологическое образование (5)
Теория конфликта (2)
Теория социального измерения (8)
Украина (9)
Учебные планы (2)
Философия (1)
Шкалирование (36)
Экономика (1)
Эмпирическая социология (46)
Europe (2)
Geopolitics (2)
Infographics (1)
R (26)
Russia (2)
SPSS (2)
Ukraine (2)
Акционализм (1)
Анализ данных (27)
Аномия (1)
Выборка (1)
Выступления (3)
Геополитика (12)
Гражданское общество (2)
Демократизация (1)
Европа (4)
Интернет ресурсы (1)
Инфографика (8)
Исследовательские дизайны (1)
Историческая социология (10)
История социологии (5)
Киберспорт (1)
Книги (7)
Массивы (3)
Методология социальных исследований (1)
Методология социологических исследований (2)
Научная жизнь (3)
Новости (6)
Обратная связь (1)
Персоналии (3)
Православные конфессии в Украине (1)
Президентская власть (1)
Психологический дистресс (18)
Психология (5)
Публицистика (2)
Революция (1)
Результаты исследований (28)
Религия (3)
Россия (2)
Согласование концептов (4)
Социальная гетерогенность (1)
Социальная работа (1)
Социологическая теория (6)
Социологические тесты (1)
Социологическое образование (5)
Теория конфликта (2)
Теория социального измерения (8)
Украина (9)
Учебные планы (2)
Философия (1)
Шкалирование (36)
Экономика (1)
Эмпирическая социология (46)
January 2021
September 2020
March 2019
September 2018
August 2018
April 2018
March 2018
December 2017
November 2017
October 2017
September 2017
August 2017
July 2017
June 2017
May 2017
April 2017
March 2017
February 2017
January 2017
December 2016
November 2016
October 2016
September 2016
August 2016
July 2016
June 2016
May 2016
April 2016
March 2016
February 2016
January 2016
December 2015
November 2015
October 2015
September 2015
August 2015
July 2015
June 2015
May 2015
April 2015
March 2015
February 2015
August 2014
July 2014
June 2014
May 2014
April 2014
March 2014
February 2014
January 2014
December 2013
November 2013
October 2013
September 2013
December 2020
November 2020
October 2020September 2020
August 2020
July 2020
June 2020
May 2020
April 2020
March 2020
February 2020
January 2020
December 2019
November 2019
October 2019September 2019
August 2019
July 2019
June 2019May 2019
April 2019March 2019
February 2019
January 2019
December 2018
November 2018
October 2018September 2018
August 2018
July 2018
June 2018
May 2018April 2018
March 2018
February 2018
January 2018December 2017
November 2017
October 2017
September 2017
August 2017
July 2017
June 2017
May 2017
April 2017
March 2017
February 2017
January 2017
December 2016
November 2016
October 2016
September 2016
August 2016
July 2016
June 2016
May 2016
April 2016
March 2016
February 2016
January 2016
December 2015
November 2015
October 2015
September 2015
August 2015
July 2015
June 2015
May 2015
April 2015
March 2015
February 2015
January 2015
December 2014November 2014
October 2014
September 2014August 2014
July 2014
June 2014
May 2014
April 2014
March 2014
February 2014
January 2014
December 2013
November 2013
October 2013
September 2013