Виды стратификации


Пропорциональная. Размер выборки пропорционален доле страты в совокупности.

Непропорциональная. Если в страте разброс велик, берется большое количество элементов, если мал – мало.

Не следует путать страту с квотой. В страте выборка случайна и можно оценить доверительный интервал результата. Квота – заданное количество объектов с определенными характеристиками, а выбор остается за полевым работником.


Гнездовые выборки


Гнездовыми называются выборки, осуществляемые следующим образом:

1. Исследуемая совокупность элементов делится на взаимоисключающие подмножества, охватывающие всю совокупность.

2. Производится случайный выбор этих подмножеств.

3. Если используются все элементы выбранного подмножества, то это одношаговая гнездовая выборка. Если далее производится случайный выбор внутри подмножества, то выборка называется двухшаговой.

Каждое подмножество должно представлять собой маленькую модель исходной совокупности, поэтому они должны быть гетерогенны (включать разнородные объекты), в отличие от гомогенных страт.

Механическая выборка

При этой выборке элементы генеральной совокупности, обычно предварительно расположенные в некотором порядке, нумеруются и разбиваются на n групп по номерам. Например, для n =10: 1-я группа включает 1-й, 11-й, 21-й,… элемент, 2-я – 2-й, 12-й, 22-й,… и т. д.

n называется интервалом выборки.

В выборку включается только одна группа. Если начало отбора соответствует 5-му элементу (k=5), то будут взяты 5-й, 15-й, 25-й … элементы. В общем случае выбираются k-й, k+n-й, 2k+n-й, 3k+n‑й, … элементы.

Итак, в выборку попадает 1/n часть элементов генеральной совокупности.

Случайный выбор k не дает большого эффекта. Он может даже ухудшить репрезентативность выборки.

Например, если для оценки среднего товарооборота магазинов города взять список магазинов, расположить их по убыванию размера торговых залов, то скорее всего окажется, что в городе есть один-два очень больших магазина, которые имеют большой объем продаж. Если они попадут в выборку, то это вызовет ошибку репрезентативности. При простой случайной выборке включение в выборку таких магазинов приводит к большому отклонению выборочного среднего от среднего для генеральной совокупности. Именно из-за таких неудачных выборок уверенность в попадании истинного среднего в доверительный интервал не может быть 100%.

Аналогичная картина может наблюдаться и на другом конце списка.

Чтобы избежать этой ошибки при механической выборке k обычно берут близким к n/2.

Точностные параметры правильно спланированной механической выборки близки к параметрам простой случайной выборки.

Пример неудачной механической выборки – определение объема продаж по дням с разбивкой k=7. При этом в выборку попадают только одинаковые дни недели.