Как выявить что выборка репрезентативна. Репрезентативность выборки

Познакомимся с тремя понятиями, которые необходимо знать любому, кто так или иначе соприкасается с социологическими исследованиями: генеральная совокупность, выборочная совокупность (выборка), репрезентативность.

Генеральная совокупность – это все единицы определенного программой объекта исследования. Если мы говорим о всероссийском опросе общественного мнения, это будет все взрослое население России. Или все московские студенты, если мы возьмемся провести среди них опрос. Или все беспризорные дети Калуги, если мы собираемся предпринять социсследование на эту тему.

Выборочная совокупность (выборка) – это часть генеральной совокупности, которую мы будет непосредственно исследовать, то есть это те люди, к которым мы обратимся с вопросами интервью или с анкетами; те материалы, которые мы будет изучать методом контент-анализа и т. п.

Иногда выборка равна генеральной совокупности (например, в случае, когда мы опрашиваем всех студентов первого курса факультета журналистики МГУ). Но обычно она меньше, иногда в несколько десятков и сотен раз. При этом практика социологических исследований доказала, что в общенациональных исследованиях достаточно выбрать для опросов 1,5–2 тысячи человек. Если выборка хорошо, правильно, репрезентативно сформирована, то она может дать объективную информацию о мнении всех россиян.

Итак, главное – это правильно сформировать выборку. Объем выборки зависит от целей исследования, специфики и степени однородности объекта исследования, дробности групп, которые предстоит изучить, и планируемой степени ее репрезентативности. Что же означает это магическое и самое важное в эмпирической социологии понятие – «репрезентативность»?

Репрезентативность – это соответствие, адекватность выборочной совокупности (выборки) по основным характеристикам генеральной совокупности. Если в структуре населения 55 % женщин и 45 %; мужчин, то и в выборке должно быть такое же соотношение. То же самое можно сказать о возрасте, профессии, типе поселения и т. п. Короче, конфигурация выборки должна совпадать с конфигурацией генеральной совокупности. Это можно изобразить на таком рисунке (рис. 8).

Самое главное в социологическом исследовании – репрезентативность выборки, потому что именно с этим связана точность и объективность полученных результатов.

Выборка может формироваться разными путями. Но основных типов два репрезентативные и нерепрезентативные выборки.

Репрезентативные выборки

Вероятностная, или случайная, выборка строится на том, что любой из объектов генеральной совокупности имеет равную вероятность попасть в выборочную совокупность. Есть несколько подвидов вероятностной выборки.

1. Систематический отбор. Он весьма популярен и часто применяется в социсследованиях. Это значит, что в зависимости от величины выборки отбирается из генеральной совокупности каждый n -ый (6, 20, 45 и т. п.) объект. Например, мы опрашиваем взрослое население одного из избирательных участков. Берем избирательные списки. Предположим, в них будет 10 000 человек. А нам нужна выборка в 500 человек. Делим число 10 000 генеральной совокупности на число 500 выборки, получаем 20. Значит, из списков будем выбирать каждого двадцатого избирателя.

Предположим, что нам нужно опросить по телефону москвичей и выяснить у них, какую в данный момент они смотрят передачу по телевизору. Берем справочную телефонную книгу, считаем, сколько в ней номеров, делим это количество на то число, которое нам надо опросить, и получаем шаг, при котором мы будет вести систематический отбор номеров.

То же самое можно делать с домами на улицах, если мы будем опрашивать наших реципиентов дома. Например, на четной стороне улицы заходим в каждый пятый дом. И так далее.

2. Отбор по принципу лотереи или жребия . Этот способ вам хорошо знаком, когда вы бросаете в шапку, вазу, ящик, например, все улицы Москвы и выбираете 20, на которых будете проводить исследование. Так же могут быть выбраны регионы, населенные пункты, почтовые отделения и т. п.

3. Отбор методом случайных чисел . Для этого составляются специальные математические таблицы случайных чисел по количеству выборочной совокупности и выбирается объект, который промаркирован предварительно этой цифрой.

Квотная выборка формируется в соответствии с квотами (то есть объектами, имеющими определенный признак по полу, возрасту, месту жительства и т. п.), которые в процентном отношении соответствуют генеральной совокупности. Предположим, что мы исследуем население небольшого города и знаем, какое в нем процентное соотношение молодых, людей средних лет и пожилых, мужчин и женщин, работающих и пенсионеров. Мы должны отобрать для опроса людей с этими характеристиками в таком же процентном соотношении. Эта выборка по степени репрезентативности близка к вероятностной.

Стратифицированная выборка отличается от квотной тем, что искусственно, в связи с целями исследования, формируются слои, страты, которые подлежат изучению и, как правило, в количественном отношении они равны. Страты должны быть более однородными, чем вся совокупность. Например, мы изучаем читателей разных изданий: «АиФ», «Известий», «Труда», «Комсомольской правды», «МК» и формируем равные страты читателей разных изданий, предположим, по 200 человек.

Районированная выборка обычно используется при исследовании районов, часто с применением географической карты, схемы населенных пунктов и т. п., из которых выбираются определенные единицы для исследования. Например, выбираются области из разных географических зон России, или округа Москвы. Иногда применяется так называемая методика географического креста, когда выбираются точки на горизонтали и вертикали этого географического креста. Так формировалась выборка в исследованиях общественного мнения в 60-е годы в Институте общественного мнения при «Комсомольской правде».

Серийная, гнездовая, кластерная выборка работает не с единицами, а с гнездами, однородными группами (семья, производственная бригада, студенческая группа, болельщики футбольного матча, телезрители, которые смотрят ТВ в одной комнате, городские районы и т. п.). Обычно в таком случае проводится сплошной опрос.

Выборка— это множество данных, взятых с помощью определённых процедур из генеральной совокупности для исследовательского анализа. Репрезентативность - это свойство воспроизведения представления о целом по его части. По иному, это возможность распространения представления о части на целое, которое эту часть включает в себя.

Репрезентативность выборки — это показатель, заключающийся в том, что выборка должна полно и достоверно отображать признаки той совокупности, частью которой она является. Её также можно определять как свойство выборки наиболее полно представлять характеристики генеральной совокупности, существенные с точки зрения цели исследования.

Допустим, что генеральная совокупность — все ученики школы (900 человек из 30 классов, по 30 человек в каждом классе). Объект исследования — отношение школьников к курению. Выборочная совокупность, состоящая из 90 учащихся только намного хуже представит всю совокупность, чем выборка из тех же 90 учеников, куда вошли бы из каждого класса по 3 ученика. Главная причина — неравное распределение по возрастам. Таким образом, в первом случае репрезентативность выборки будет низкой. Во втором случае - высокой.

В социологии говорят, что существует репрезентативность выборки и её нерепрезентативность.

В качестве примера нерепрезентативной выборки можно привести классический случай, произошедший в 1936 году в США во время президентских выборов.

Журнал «Литэрари дайджест», который до этого весьма успешно прогнозировал результаты предыдущих выборов, на этот раз ошибся в своих прогнозах, хотя разослал несколько миллионов письменных вопросов подписчикам, а также респондентам, которых они выбрали из телефонных книг и из списков регистрации автомобилей. В 1/4 бюллетеней, которые вернулись заполненные обратно, голоса распределились следующим образом: 57 % отдали первенство кандидату от республиканцев по имени Альф Лэндон, а 41 % отдали предпочтение действующему президенту - демократу Франклину Рузвельту.

В действительности, на выборах победил Ф. Рузвельт, который набрал почти 60 % голосов. Ошибка «Литэрари дайджест» была в следующем. Они захотели увеличить репрезентативность выборки. А так как они знали, что большинство их подписчиков относят себя к республиканцам, то они решили расширить выборку за счёт респондентов, выбранных ими из телефонных книг и автомобильных регистрационных списков. Но они не учли существующих реалий и фактически отобрали ещё больше сторонников республиканцев, потому что во времена иметь автомобили и телефоны мог позволить себе средний и высший класс. А это и были по большей части республиканцы, а не демократы.

Существуют различные виды выборки: простая случайная, серийная, типическая, механическая и комбинированная.

Простая случайная выборка состоит в отборе из всей совокупности изучаемых единиц наугад без какой-либо системы.

Механическую выборку применяют тогда, когда в генеральной совокупности есть упорядоченность, например, имеется некая последовательность единиц работников, избирательные списки, номера телефонов респондентов, номера квартир и домов и другое).

Типический отбор используется тогда, когда всю совокупность можно разделить на группы по типам. При работе с населением такими могут быть, например, образовательные, возрастные, социальные группы, при исследовании предприятий - отрасль или отдельная организация и др.

Серийный отбор удобен тогда, когда единицы объединены в небольшие серии или группы. Такой серией могут быть партии готовой продукции, школьные классы, и другие группы.

Комбинированная выборка предполагает использование всех предыдущих видов выборки в той или иной комбинации.

Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование называется выборочным.

При построении социологической выборки используется множество специальных терминов, в том числе два важнейших – генеральная ивыборочная совокупность .

Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки ,или выборочной совокупности . Объем генеральной совокупности обозначается символом N , а объем выборочной совокупности – n .

Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно – на основе информации о выборочной совокупности).

Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях:

– выборка (как результат действия) – представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности;

– выборка (как способ или процесс действия) – способ отбора объектов генеральной совокупности в выборочную.

Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).

Выборочная совокупность – уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т. е. темой, выступает экономическая активность пенсионеров. Все пенсионеры – пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет – будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тысячи пенсионеров. Это и станет его выборочной совокупностью.

Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку .Но как этого добиться? Прежде всего, надо узнать как можно больше свойств, или параметров, генеральной совокупности, например, разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией ,конкретные величины возраста – значениями , а совокупность всех значений образует переменную .

Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0–5, 6–10, 11–15 лет и т. д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.

Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например, рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность – это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса .Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию, или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов – об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки – наличие информации о генеральной совокупности, т. е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

Под репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем генеральной совокупности. Иными словами, репрезентативная выборка представляет собой точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно применить ко всей совокупности.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5 %. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100–250 человек) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25 % от общего числа студентов.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки .После чего решается вопрос о типе выборки.

Типами выборки называются основные разновидности статисти-ческой выборки: случайная (вероятностная) и неслучайная (невероятностная). Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.

Перейдем к характеристике наиболее распространенных выборок.

Похожая информация.

С точки зрения статистического подхода репрезентативность выборки обеспечивается выполнением следующих условий: а) каждый из объектов генеральной совокупности должен иметь одинаковую вероятность быть представленным в выборке; б) отбор производится из однородных совокупностей; в) число объектов в выборке должно быть достаточно большим; г) выборка и генеральная совокупность должны быть по возможности статистически однородны.

Создание простой вероятностной выборки может осуществляться методом рандомизации – процедурой случайного отбора.При этом методе характеристики испытуемых игнорируются, их включение в выборку имеет одинаковую вероятность и является непредвзятым. Это значит, что любой испытуемый имеет равные шансы попасть в выборку. Процедура построения простой случайной выборки включает в себя следующие шаги: а) необходимо получить полный список членов генеральной совокупности и пронумеровать этот список; б) определить предполагаемый объем выборки, то есть ожидаемое число испытуемых; в) извлечь из таблицы случайных чисел столько чисел, сколько требуется выборочных единиц (например, если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел, которые могут генерироваться компьютерной программой). Упрощенным вариантом рандомизации является механический отбор испытуемых на основе списка генеральной совокупности через определённый интервал (К), который определяется случайно.

Несмотря на свою простоту, этот метод имеет существенные ограничения:

Значительно увеличивает трудозатраты и стоимость сбора данных, если генеральная совокупность является численно большой или распределенной по большой географической территории (это характерно при создании ПДМ, рассчитанных на широкие слои населения);

Результаты применения простой случайной выборки часто характеризуются низкой точностью и большой стандартной ошибкой.

В случае неоднородной генеральной совокупности, прежде чем формировать выборку, рекомендуется разделить эту совокупность на однородные части. Они могут формироваться на основе того или иного признака: административно-территориальные единицы (например, районы города), социально-демографические характеристики (пол, возраст, социальный статус) или организационная принадлежность испытуемых (образовательные учреждения) и т.д. Такая выборка называется районированной (стратифицированной). Далее из каждой однородной части отбор в выборку осуществляется случайным образом. Например, для оценки методики изучения межличностной идентичности в группе и подгруппах и методики изучения микрогрупповой и групповой идентичности (применительно к учебным группам подростково-юношеского возраста) были выбраны шесть средних общеобразовательных школ в трех районах и два вуза г. Ростова-на-Дону. Далее методом случайного отбора в выборку были включены по шесть групп 10-х и 11-х классов школ и шесть студенческих групп 2 курса вузов (всего 18 групп).Общая численность испытуемых составила 413 человек.

Ещё одним вариантом рандомизации является создание серийной (гнездовой или кластерной) выборки. Здесьединицами случайного отбора выступают не сами объекты, а группы (кластеры или гнёзда). Объекты внутри групп обследуются сплошным образом.

Создание невероятностной выборки, что широко практикуется при оценке психодиагностических методик и составлении нормативов, осуществляется не по принципу случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д. Выделяют несколько способов формирования такой выборки:

1) Метод квотирования. Изначально выделяется некоторое количество групп объектов (например, мужчины и женщины в возрасте 18-25 лет, 26-35 лет и 36-55 лет. Для каждой группы задается количество испытуемых, которые должны быть обследованы с помощью данной методики. Количество испытуемых, которые должны попасть в каждую из групп, задается либо пропорционально заранее известной доле группы в генеральной совокупности (например, если генеральная совокупность представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке будет 200 женщин и 300 мужчин), либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно.

2) Метод «снежного кома». Выборка строится следующим образом: у каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования.

3) Метод стихийного отбора.Опрашиваются наиболее доступные респонденты. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – желанием и активностью респондентов.

4) Метод отбора типичных объектов. После районирования (стратификации) из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям.

Репрезентативность выборки измеряется разностью между характеристиками выборочной и генеральной совокупностей. (Чем более выборка и генеральная совокупность являются статистически однородны, тем более выборка репрезентативна.) Однако фактическая величина указанной разности остаётся неизвестной, вследствие чего мерой репрезентативности служит определяемая по правилам математической статистики её вероятная величина или же средняя квадратическая её возможных значений.

При разработке, оценке и стандартизации методики суждение о степени репрезентативностивыносится на основе оценки минимального объема выборк и и соответствия эмпирического распределения нормальному .

Требуемый объем выборки для обеспечения её количественной репрезентативности часто определяется как минимальный объем выборки, необходимый для того, чтобы выборочное среднее значение () отличалось от истинного среднего значения генеральной совокупности не более, чем на заданную величину. В этом случае минимальный объем выборки может оцениваться посредством определения доверительного интервала для среднего значения по показателям методики:

где n – минимальный объем выборки, ua – значения для стандартных доверительных вероятностей, - выборочное стандартное отклонение, d – заданная величина отклонения выборочного среднего значения от генерального среднего.

Например, по методике изучения общительности-замкнутости мы провели пилотажное обследование 50 испытуемых. С помощью «ключа» производим обработку результатов и получаем тестовые показатели по каждому испытуемому. Далее на этой выборке (N=50) проводим расчет:

а) среднего значения: , (3)

где - тестовый показатель каждого испытуемого, N – количество испытуемых;

б) стандартного (среднеквадратического) отклонения: (4).

По результатам выборочного исследования среднее значение составляет 11,25 и стандартное отклонение – 3,47. Задаемся, например, доверительной вероятностью 95% (ua= 1,96 в табл. 1) и отклонением выборочного среднего значения от истинного значения среднего результата не более чем на d = 0,5 и по формуле (1) находим

Таким образом, при объеме выборки n = 154 существует 95%-ная вероятность того, что выборочное среднее арифметическое будет отличаться от генерального среднего не более чем на 0,5 баллов.

Таблица 1

Значения ua для стандартных доверительных вероятностей

a	1 - a	u a
0,05	0,95	1,96
0,01	0,99	2,58
0,001	0,999	3,28

В этом случае нам надо провести дополнительное обследование 104 испытуемых и, тем самым, довести объем выборки до 154. Величина минимального объема выборки зависит от заданного уровня доверительной вероятности, величины d и выборочного стандартного отклонения. Чем больше будет доверительная вероятность, меньше величина d или больше стандартное отклонение, тем потребуется большая по численности минимальная выборка.

Нормальное распределение наиболее часто применяют для статистического описания совокупности эмпирических данных, оценки репрезентативности выборки и шкалы (методики), для стандартизации тестовых баллов (на основе перевода в интервальную шкалу). На свойствах нормального распределения основаны статистические критерии проверки гипотез (z-критерий, критерий , F-критерий Фишера, t-критерий Стъюдента и др.).

Нормальность распределения оценивается с помощью критерия Колмогорова – Смирнова, который считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному. Если p >0,1, то делается вывод о приблизительном соответствии данного эмпирического распределения нормальному. В качестве примера можно привести показатели оценки нормальности распределения по шкалам многомерного профессионально-психологического личностного теста.

Сравнение эмпирического распределения с теоретическим нормальным распределением можно также осуществлять посредством оценки таких свойств как асимметрия () и эксцесс (). Асимметрия и эксцесс нормального распределения равны нулю. Если хотя бы один из этих двух показателей проверяемого эмпирического распределения существенно отклоняется от данного значения, это означает аномальность оцениваемого распределения.

Асимметрия эмпирического распределения определяется по формуле:

, (5)

где - среднее арифметическое значение, - стандартное отклонение,

Среднее кубическое (), (6)

С – среднее квадратическое () (7).

Если эмпирическое распределение не соответствует нормальному, то выборка не репрезентативна по качеству и/или количеству. Однако это может свидетельствовать и о том, что данная методика не дает нормального распределения результатов, так как плохо составлен стимульный материал (например, многие тестовые задания не обладают средней диагностической силой).

Понятие стандартности

Стандартность – унификация, приведение к единым нормативам разных частей ПДМ и процедуры ее применения.

Психодиагностические методики с самого начала их разработки задумываются как универсальные, неспецифические, т.е. такие, которые могут использоваться разными специалистами в различных ситуациях. Поэтому ПДМ должна иметь единообразную процедуру проведения, стандартный стимульный материал (утверждения, рисунки и т.д.), стандартный метод обработки и способ интерпретации результатов. Именно это позволяет сравнить выводы, т.е. оценить проявление одного и того же психического параметра в разных ситуациях и у разных людей и, в зависимости от силы проявления диагностируемого параметра, выработать адекватные рекомендации. Стандартность ПДМ и условий ее применения дает возможность сравнивать результаты, полученные разными специалистами при диагностике различных людей. При любом отклонении ПДМ от стандарта, ее результаты невозможно сравнивать с результатами, полученными с помощью оригинала данной методики, использованной на других людях или в другой ситуации.

Однако отсутствие или нарушение стандартности ПДМ не означает, что данной методикой вообще невозможно пользоваться. Нестандартизированную методику можно использовать в научно-исследовательских целях – изучать новые психические явления, выявлять новые факты и накапливать научные результаты, устанавливать причинно-следственные связи и закономерности. Однако такой методикой нельзя пользоваться в психодиагностических целях.

Репрезентативность выборки

Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий - репрезентативность (представительность) выборки . Как обсуждалось ранее, выделяют качественную и количественную репрезентативность.

Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):

1. Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку.

2. Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака. Если отбор проводится целенаправленно, то и при этом необходимо соблюдать условия независимости распределения изучаемого признака.

3. Отбор должен проводиться из однородных групп.

Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора. В зависимости от способа формирования различают следующие выборки:

1. Выборки, не требующие разделения генеральной совокупности на части (собственно, случайная повторная или бесповторная выборка).

2. Выборки, требующие разбиения генеральной совокупности на части (механическая, типическая или типологическая выборки, когортная, парно-сопряженная выборки).

Собственно, случайная выборка формируется случайным отбором - наудачу. В основе случайного отбора лежит перемешивание. Например: выбор шара в спортлото после перемешивания всех шаров, выбор выигрышных номеров лотереи, случайный выбор карточек больных для исследования и т.п. Иногда используют случайные числа, получаемые из таблиц случайных чисел или с помощью генераторов случайных чисел. Согласно этим числам из заранее пронумерованного массива генеральной совокупности выбираются единицы наблюдения с номерами, соответствующими выпавшим случайным числам.

При составлении случайной выборки после того, как объект выбран, и все необходимые данные о нем зарегистрированы, можно поступать двояко: объект можно вернуть, или не вернуть в генеральную совокупность. В соответствии с этим выборку называют повторной (объект возвращается в генеральную совокупность) или бесповторной (объект не возвращается в генеральную совокупность). Поскольку в большинстве статистических исследований разница между повторной и бесповторной выборками практически отсутствует, то априорно принимается условие, что выборка повторная.