Ошибки при сборе данных
При сборе данных главная проблема – проблема ошибок.
Ошибки выборки (ошибки репрезентативности) обусловлены зависимостью результата от тех исследуемых единиц, которые попали в выборку. Из-за наличия этих ошибок при повторных
Ошибки, не связанные с выборкой (они могут быть в десятки раз больше первых!) подразделяются на случайные и неслучайные.
Случайные ошибки имеют различный знак, так что их общий итог равен нулю при достаточном объеме выборки. Неслучайные ошибки дают смещение суммарной оценки.
Спектр неслучайных ошибок очень широк. Они могут быть обусловлены ошибочными концепциями, неправильной логикой рассуждений, неправильной интерпретацией ответов, некорректным определением статистики, ошибками в арифметике, при табуляции, при кодировании, ошибками в отчете. Эти ошибки могут увеличиваться с увеличением выборки.
Неслучайные ошибки, в свою очередь, подразделяются на ошибки ненаблюдения (когда нельзя получить данные из-за неохвата исследуемых элементов или неответа респондентов) и ошибки наблюдения (когда были получены неточные данные или произошли ошибки в их обработке).
Для снижения ошибок применяют следующие общие меры.
Валидность исследования проверяется с помощью достоверной информации, не содержащей отклонений. Например, собранную демографическую информацию можно сравнить с официальными данными переписи населения. Это, к сожалению, не всегда возможно.
Для проверки состоятельности респондентов им задаются различные версии одного вопроса и производится сравнение ответов.
Состоятельность ответа проверяется повторным опросом того же человека через определенное время.
Ниже будут рассмотрены основные причины возникновения неслучайных ошибок и способы их уменьшения.