Прямая и обратная задачи репрезентативности  

Прямая и обратная задачи репрезентативности

Применение несплошного обследования привело к воз­никновению проблемы репрезентативности (или предста­вительности). Это означает, что данные, полученные в процессе несплошного обследования (и не только выбо­рочного), обладают определенным уровнем репрезента­тивности, характеризующим степень их отклонения от

4 Некоторые буржуазные философы и социологи не только вы­ступают против фетишизации результатов, полученных с помощью математической теории выборки, но и в той или иной мере подвер­гают сомнению вообще правомерность распространения данных за' пределы той совокупности, в рамках которой они получены [255; 84—87], [358; 126—130], [354; 97—115], [333; 31], [300; 515—518].

Приводимые ими доводы — генеральная совокупность всегда мо­жет быть дополнена новыми элементами, она находится в процессе постоянного изменения, искажение результатов выборки из-за воз­действия исследователя на объекты изучения, слабый учет взаимо­действия между единицами и др., — несомненно, отражают реаль­ную диалектику познания. Однако они не могут служить основанием для отказа от широкого применения выборочного метода в социоло­гических исследованиях.

2 Из отечественных социологов наибольшее внимание философ­ским проблемам репрезентативности уделил в своей диссертации Ю. П. Воронов [40].

«истинных» характеристик, которые могут быть получены тогда, когда явление изучается в полном объеме1.

Низкая степень отклонения характеристик несплош­ного обследования от «истинных» обеспечивается с по­мощью специальных методов, вычленяющих из исходной совокупности такую ее часть, которая оказывается репре­зентативной.

Задачу вычленения репрезентативной части исходной совокупности можно условно именовать прямой. Наряду с прямой задачей по обеспечению репрезентативности по­лучаемых данных социологи нередко решают и обратную задачу2.

С известной условностью можно утверждать, что лю­бые сведения репрезентативны по отношению к какой-то совокупности явлений [211; 418—419], что изученный объ­ект является частью какого-то более объемного «сверх­объекта».

Относительно просто обратная задача решается тогда, когда исследователь имеет в своем распоряжении сведе­ния о различных генеральных совокупностях, принадлеж­ность к которым данной выборки он может установить, используя аппарат проверки статистических гипотез3. Так, с помощью этого же аппарата выясняется принад­лежность нескольких выборок к одной и той же исходной совокупности.

Близкий характер носит так называемая диагности­ческая задача по определению принадлежности отдель­ных единиц к тем или иным совокупностям. Эта задача решается с помощью методов распознавания образов и факторного анализа [131], [149; 77—148].



Гораздо чаще исследователь стоит перед проблемой определения принадлежности выборки к совокупности. заранее ему не известной.

4 Некоторые исследователи считают, что понятие репрезентатив­ности можно связывать только со случайной выборкой. Автор исхо­дит из более широкой трактовки этого понятия.

2 В этом аспекте предлагается трактовать все задачи матема­тической статистики как обратные по отношению к задачам теории вероятностей. В то время как в теории вероятностей ищут оптималь­ные в определенном смысле выборочные характеристики, в матема­тической статистике «восстанавливают» по имеющимся характери­стикам «истинные» параметры генеральной совокупности [17}, [23].

3 На связь методов оценки гипотез с проблемами выборки обра­щают внимание и другие авторы [289; 157], [261].

Указанная проблема возникает при проектировании исследования и при истолковании его результатов.

Рассмотрим вначале первый аспект. После того как определен непосредственный объект исследования (по­дробнее об этом ниже), возникает задача по выяснению того, к какому классу объектов относится объект данно­го исследования, в какую «матрешку», состоящую из объектов различной степени укрупненности, он входит, какое место занимает данный объект в структуре со­циальной системы1.

В известном смысле данная проблема рассматривает­ся в системном анализе в терминах «сверхсистема», «си­стема», «подсистема». Если же использовать термины прямой и обратной задачи репрезентативности, то опре­деление сверхобъекта можно рассматривать как задачу по восстановлению той совокупности, которую представ­ляет изучаемый объект.

Определение сверхобъекта чрезвычайно важно преж­де всего для того, чтобы осуществить реальный отбор единиц совокупности для сбора информации. В ряде ис­следований необходимость выделения объекта высшего уровня для организации отбора отсутствует. Так, напри­мер, дело обстоит во многих индустриальных и аграрных исследованиях, в которых единицы совокупности отбира­ются из числа работников соответствующих предприя­тий. В то же время во многих исследованиях выделение сверхобъекта требует к себе специального внимания.



Так, в исследованиях, в которых в качестве объекта выступают читатели газеты (или газет), процесс отбора связан с использованием, по сути дела, трех совокупно-стей более высокого уровня: 1) население страны, 2) по­тенциальные читатели (т. е. лица, отвечающие определен­ным требованиям, например касающимся грамотности и возраста), 3) фактические читатели. «Население страны» и «потенциальные читатели» и являются в данном случае сверхобъектами исследования.

Можно следовать нескольким стратегиям в выборе сверхобъектов. Первая из них предполагает выбор в ка­честве исходной совокупности семей, выписывающих или покупающих соответствующие издания, вторая — исполь-

1 На эту проблему, однако, обращало внимание мало исследова­телей. Исключение составляют [127; 34—35], [229; 103—104], [279-1437].

зование в качестве исходной совокупности населения всей страны. Преимущество первого пути связано с эко­номическими моментами. Очевидно, что совокупность подписчиков «Литературной газеты» намного меньше, чем общее число взрослых жителей. Однако нужно учесть, что, следуя первой стратегии, мы не можем до­статочно полно зафиксировать лиц, являющихся реаль­ными читателями газеты (в частности, лиц, читающих га­зеты в библиотеке, на витринах, пользующихся экземпля­рами газет соседей или учреждения) 1. Поэтому есть основания полагать, что второй вариант обеспечит более репрезентативные данные. Именно он был реализован во время изучения миграции читателей «Известий» (1968 г.) [197].

Конечно, при использовании в качестве сверхобъекта населения страны приходится осуществлять большое чис­ло ненужных посещений семей. Дело в том, что по пред­варительным расчетам (оправдавшимся в ходе обследо­вания) на каждые 100 семей должно приходиться при­мерно 60% лиц, не являющихся подписчиками газеты.

Описанные выше подходы используются социологами и при изучении кинозрителей или телезрителей. Только рассматривая все население, чаще всего старше 10 лет, как сверхобъект, они могут выделить в качестве непо­средственного объекта исследования совокупность кино­зрителей или телезрителей [85; 47].

Проблема сверхобъекта остро стоит в исследованиях, опирающихся на контент-анализ материалов средств мас­совой информации [282; 127—135], [343; 12—14]. В таких исследованиях в качестве генеральной совокупности выступает обычно определенное периодическое издание или материалы радио- или телепередач за определен­ный период времени, однако исследователь редко связы­вает свои выводы только с изученными изданиями и пы-

1 Во время изучения аудитории «Правды» (1968 г.) была пред­принята попытка повысить репрезентативность данных при исполь­зовании первого варианта стратегии. Поэтому в качестве непосред­ственных объектов исследования были взяты наряду с подписчиками покупатели, а также читатели газет, вывешенных на витрине. В про­екте нового обследования (второй этап) газеты «Правда» (1976 г.) в качестве объекта явилось все взрослое население страны.

На первом этапе для обеспечения сопоставимости показателей, как и в 1968 г., в качестве объекта выступали подписчики газеты.

тается определить и здесь сверхобъект в виде совокуп­ности периодических изданий.

Проблема сверхобъекта в указанном смысле приобре­тает особое значение при исследовании так называемых редких элементов. Сошлемся, например, на геронтологи-ческие исследования, для которых в качестве объекта вы­ступает совокупность лиц старше 100 лет, или на иссле­дования, изучающие семьи, имеющие 5 и более детей, лиц, имевших в прошлом опыт работы на Севере, и т. п.1.

Удачный выбор сверхобъекта, т. е. такой совокупно­сти, где эти «редкие элементы» встречаются наиболее ча­сто, может существенно сократить расходы на исследо­вание. Не случайно, что геронтологи в качестве такого сверхобъекта часто выбирают население Закавказья, где число долгожителей более высокое, чем в других районах страны.

Эта же проблема возникает и при отборе экспертов. Чрезвычайно важно установить, где концентрация спе­циалистов в необходимой области наиболее высокая, с тем чтобы рассматривать совокупность соответствую­щих учреждений как сверхобъект.

Рассмотрим теперь второй аспект проблемы, относя­щийся к трактовке полученных с помощью выборки ре­зультатов.

В тех случаях, когда исследователь распространяет выборочные показатели на ту совокупность, из которой отбор производился строго в соответствии с принципами случайной выборки, никаких трудностей в истолковании данных не возникает.

Иное положение имеет место тогда, когда социологи

1 Интересным примером поиска «редких единиц» может служить исследование взаимоотношений поколений, осуществленное группой американских социологов. В качестве объекта было решено взять мужчин, имеющих прямые контакты с живущими детьми и внуками мужского пола в возрасте не моложе 15 лет. Сначала были выделе­ны 840 тыс. человек, включенных в систему медицинского обслужи­вания Южной Калифорнии, из них было выделено 58328 де­душек, из которых было отобрано 7112. Этим лицам была направле­на анкета для того, чтобы выяснить, есть ли у них сейчас живые дети и внуки. Из числа ответивших (70%) только 585 имели живых детей и внуков. Из этих 585 человек всего 84 поддерживали с ними прямые связи и могли сообщить адреса других родственников, каж­дый из которых получил анкету. В результате объем предполагаемой выборки оказался равным 252. Однако в исследовании приняло уча­стие только 182 человека [298; 269—270]. См. также [323; 235—240].

не сумели по разным причинам обеспечить случайный отбор из исходного множества или когда они хотят рас­пространить полученные результаты за пределы исполь­зованной ими генеральной совокупности.

В качестве примера, относящегося к первой ситуации, сошлемся на трактовку информации, полученной после обработки писем читателей в редакции газет и журналов.

Вывод о том, что письма читателей, поступающие в редакции, не представляют всей совокупности читателей, был одним из первых результатов социологических иссле­дований периодической печати в 60-е годы. Различия между двумя совокупностями оказались наиболее силь­ными по таким параметрам, как возраст, род занятий, пол, местожительство и т. д. [30], [118], [143].

В связи с этим встал вопрос о том, кого же представ­ляют авторы писем, в частности писем — откликов на опубликованные в газете статьи?

Этот вопрос детально изучался нами на примере ма­териалов дискуссии «Инженер и время», которую прово­дила «Литературная газета» в 1969 г. [98], [99], [141;80—81].

В поисках решения вопроса о том, кого и в какой сте­пени представляют авторы — участники дискуссии «Ин­женер и время», было решено провести специальное сравнительное исследование об отношении к указанной проблеме читателей разных категорий.

В сравнительном исследовании было выделено четы­ре процедуры: 1) почтовый опрос инженеров и техни­ков—читателей «ЛГ», 2) интервьюирование этой же ка­тегории читателей, проживающих в Москве, 3) интервью­ирование инженеров и техников, проживающих в Москве, но не читающих регулярно газету, 4) повторный опрос авторов откликов.

Сопоставления состава авторов писем и аудитории «ЛГ» выявили, как и следовало ожидать, большие разли­чия, которые оказались особенно велики по роду дея­тельности, полу, возрасту и т. д. Так, например, 70% авторов писем оказались инженерно-техническими ра­ботниками, в то время как среди подписчиков «ЛГ» их было тогда около 1/5.

На основе проведенного исследования был сделан вы­вод о том, что авторы писем-откликов, действительно не репрезентируя совокупность всех читателей, тем не ме-

нее образуют совокупность лиц, представляющих наибо­лее активных в социальном отношении людей, к тому же профессионально заинтересованных в проблематике той или иной дискуссии.

Этот вывод может быть подтвержден, например, тем, что среди авторов писем-откликов более половины — лица с большим стажем работы по специальности (свы-' ше 20 лет), а среди приславших почтовую анкету—40% и проинтервьюированных — только 30%. В то же время на вопрос, приходилось ли Вам ранее обращаться в ре­дакции с письмами, положительно ответило 79% авторов откликов, 39% из числа лиц, приславших почтовую анке­ту, и только 3% из числа опрошенных на предприятии4.

Аналогичные проблемы возникают при истолковании результатов исследований театральных зрителей, посети­телей музеев, пассажиров .и т. д.

Действительно, социолог не может выделить заранее генеральную совокупность театральных зрителей, кото­рая ему необходима, например, для изучения вопроса о том, почему одни театры и спектакли предпочитаются другим. И здесь необходимая для истолкования получен­ных результатов гипотетическая совокупность, которая может быть определена после сбора первичного мате­риала.

Одним из подходов к решению данной задачи являет­ся сравнение состава зрителей на различных спектаклях одного и того же театра2. Если удается установить устой­чивость тех или иных характеристик зрителей, то тогда открывается путь к формированию гипотез от исходной совокупности зрителей данного театра. Так, например, проведенный нами совместно с Н. Раевич опрос зрителей Московского театра сатиры в 1974 г. показал, что доля женщин среди зрителей 4 спектаклей находилась в интер­вале 61—67%, лиц с высшим образованием (законченным и незаконченным) — 59—65%. Примерно 1/3 всех зрите­лей моложе 25 лет3. Достаточно стабильным оказался и

' Среди читателей «ЛГ» (1970 г.) доля лиц, обратившихся в ре­дакцию за последние 2—3 года, составила порядка 30%. По данным А. И. Верховской, 67% всех авторов писем в редакцию ранее обра­щались в газеты, телевидение, радио [30, 137].

2 Этот подход близок к методу независимых выборок (подроб­нее о нем ниже).

3 О других выборочных исследованиях театральной аудитории см.[З], [146].

ряд других индикаторов. Исследование Е. М. Торшило-вой посетителей Музея изобразительных искусств им. А. С. Пушкина в Москве также выявило значитель­ную стабильность показателей, инвариантных к момен­там опроса. В частности, для гипотетической совокуп­ности ее исследования характерно преобладание жен­щин в возрасте до 25 лет [187].

Г. И. Курьян избрала при исследовании проблем ту­ризма в качестве непосредственного объекта изучения совокупность пассажиров на авиалиниях, связывающих Центр и Восток страны (число опрошенных 3097 чело­век). По ее мнению, в качестве сверхобъекта для этой выборки выступает «наиболее мобильная и платежеспо­собная часть населения страны» [95; 10].

Аналогичная проблема, по существу, стояла перед Б. Д. Грушиным, когда он анализировал итоги опроса среди пассажиров поездов дальнего следования, отправ­лявшихся из Москвы [55; 369—370].

Перейдем теперь к.тем ситуациям, при которых проблема сверхобъекта возникает тогда, когда социолог выходит за пределы использованной им генеральной со­вокупности.

Особенно часто так поступают те, кто прибегает к мо­нографическим исследованиям. Именно эти исследования по самому их замыслу предполагают, что данные, полу­ченные в отдельном населенном пункте, предприятии, бы­ли экстраполированы на более обширные совокупности.

Исходя из общих соображений можно утверждать, что результаты профессионально проведенного социоло­гического исследования обладают репрезентативностью различной степени по отношению к нескольким исходным совокупностям1. Однако необходимы веские свидетель­ства в пользу того, что обследование, проведенное в од­ном городе или одной области, можно, даже с оговорка-

4 Строго говоря, репрезентативность результатов любой выбор­ки характеризуется вектором, каждый из компонентов которого от­ражает уровень репрезентативности различной степени по отношению к различным совокупностям. 100%-ная репрезентативность имеет ме­сто по отношению к самой выборке, т. е. в случае, если рассматривать выборку как представляющую «саму себя». В книге «Человек и его работа» мы найдем прямые размышления авторов о том, в какой мере полученные данные репрезентативны по отношению к различ­ным контицгентам молодежи [195; 64—65].

ми, распространить за пределы этих территориальных единиц. Между тем изучение социологических публика­ций свидетельствует о том, что многие авторы, не осозна­вая трудностей выделения сверхобъекта и решения об­ратной задачи репрезентативности, часто «расширяют» недозволенным образом объем совокупности, на которую можно непосредственно распространить полученные вы­воды.

Примечательно, что к расширительному толкованию результатов выборки тяготеют не только авторы иссле­дований, но и потребители социологической продукции.

Естественно, что от такого расширительного толкова­ния почти свободны результаты всесоюзных исследова­ний (мы сейчас оставляем в стороне вопрос о том, как ре­шена прямая задача, т. е. как исследователь организо­вывал выборку из известной ему генеральной совокуп­ности). Иначе дело обстоит с разнообразными «точечны­ми» исследованиями, в которых в качестве исходной со­вокупности выступает либо регион (город, область), либо отдельное предприятие или учреждение, в то время как полученные результаты распространяют на республику или даже всю страну.

Нередко авторы социологических публикаций не толь­ко не приводят каких-либо статистических свидетельств об обоснованности расширительного толкования выдви­гаемых выводов, но и не высказывают ни сожалений о том, что они этого не могут сделать, ни соображений, из которых было бы видно, что проблема ими, по край­ней мере в той или иной степени, осознается.

Важное значение имеет еще одно обстоятельство. На­ряду с теми социологами, которые тяготеют к расшири­тельной трактовке полученных ими результатов, имеется немало авторов локальных и монографических обследо­ваний, избегающих делать выводы обобщенного характе­ра. Однако отсутствие специальных оговорок придает этим публикациям известное общенаучное или общепрак­тическое значение, что толкает читателей, не всегда зна­комых с проблемой репрезентативности, к восприятию опубликованных результатов в более общем плане, чем, быть может, этого хотели авторы.

Высказываясь решительно против стремления подме­нить тщательно спроектированное и реализованное выбо­рочное обследование слабо или ничем не обоснованными

поисками гипотетической совокупности, следует вместе с тем признать, что социологическая практика не может обойтись без решения обратной задачи репрезентативно­сти, без выяснения природы того сверхобъекта, в кото­рый входит изученное множество. В значительной мере это объясняется тем, что на разного рода монографиче­ские («точечные») исследования приходится большая часть всех проведенных в стране социологических иссле­дований 1.

Столь большая распространенность «точечных» иссле­дований понятна. Во-первых, именно в таких исследова­ниях заинтересованы многочисленные предприятия и уч­реждения, которые вовсе не намерены расходовать сред­ства на сбор сведений, не имеющих прямого отношения к их производственной деятельности. Во-вторых, «точеч­ные» обследования гораздо более доступны для реализа­ции, чем обследования, охватывающие значительную тер­риторию. В-третьих, именно «точечные» обследования чаще всего гарантируют, как уже отмечалось, существен­но более высокое качество работы, чем исследования второго типа.

Использование «точечных» социологических исследо­ваний для получения выводов более широкого характера требует обеспечения сопоставимости показателей различ­ных исследований и активного применения методов вто­ричного анализа. Отечественная социология обладает из­вестным опытом сравнения результатов исследований в различных областях и получения на основе этих сравне­ний выводов, которые могут быть отнесены (с известной условностью) ко всей стране.

Еще до революции ряд локальных исследований зем­ских статистиков (А. И. Шингарев [201], А. М. Стопани [183] и др.) после подтверждения другими авторами ста­ли базой для выводов самого широкого характера.

Примечателен и опыт советской социологии. Так, в СССР не проводились всесоюзные исследования профес­сиональной ориентации молодежи. Однако результаты

1 Вот что показал проведенный Ф. Шереги анализ социологиче­ских публикаций за 1970—1973 гг. В 72% всех публикаций, указы­вается, что территорией исследования был город, рабочий поселок, село, в 8% —область и район, в 7%—республика. В 12% публика­ций соответствующая информация отсутствует. Число исследований, охвативших всю территорию страны, не превышает 1%.

многолетних исследований В. Н. Шубкина в Новосибир­ской области, а также проведенных по его же методике исследований в Ленинграде, в Бурятии, Эстонии и дру­гих районах страны позволяют фиксировать общие зако­номерности в данной области.

Заслуживает внимания и сравнительный анализ ре­зультатов исследований по социологии печати [208]. Дан­ные, полученные эстонскими и свердловскими социоло­гами в начале 60-х годов на основе локальных обследо­ваний, по ряду позиций подтвердились спустя несколь­ко лет на всесоюзном материале [189], [139], [196], [197]. Затем результаты всесоюзных исследований получили подтверждение в материалах, полученных в 70-е годы в Бурятии и Молдавии [135], [184]. Вместе с тем следует подчеркнуть, что методика обобщения результатов ло­кальных исследований, как и другие проблемы вторично­го анализа, разработаны еще недостаточно. Это обстоя­тельство существенно затрудняет решение указанной ра­нее задачи. Одна из первых попыток в этой области на примере исследований об адаптации молодежи к трудо­вой деятельности предпринята Т. Ф. Кончаниным [91].

В настоящее время проблемы сопоставимости ре­зультатов различных исследований привлекают растущее внимание многих социологов.


0777960047364868.html
0778006550343751.html
    PR.RU™