Анализ данных
Разговор до этого шел о сборе данных. Когда же они собраны, то требуется найти в них некоторый смысл, получить из них полезную информацию.
Предварительные шаги
Редактирование
Под редактированием понимается обеспечение
минимальных стандартов качества данных.
Редактирование в поле является предварительным, устраняются большие пропуски и явные неточности в ответах. Контролируются также и полевые работники: выявляются ошибки в их работе, проверяется понимание ими процедуры проведения опросов или наблюдений. Главное – провести редактирование как можно быстрее, пока еще можно что-то исправить с малыми затратами.
Редактирование в офисе производится грамотным специалистом, который знает цели и процедуры исследования. Если редактор не один, то работа должна разделяться по инструментам сбора данных, а не по респондентам. Здесь решаются вопросы о том, что делать с анкетами, в которых много неответов; в которых нет ответов на отдельные пункты; содержащими противоречивые ответы; заполненными незаинтересованными людьми, ответившими, например, на все вопросы одинаково. Обычно такие анкеты обрабатываются отдельно от прочих. Затем проверяется, влияет ли их включение на результаты исследования.
Кодирование
Кодирование – категоризация данных и представление их в условном виде (обычно – числовом).
Это принципиально неавтоматизируемая процедура.
Иногда ответ бывает единственным (возраст), иногда ответов может быть несколько (причины покупки). Кодирование может производиться как самим респондентом (например, путем выбора одного из предложенных ответов), так и интервьюером.
Удобно пронумеровать анкеты. Здесь это делается не для нарушения инкогнито, а для удобства. Обычно каждой анкете будет впоследствии отведена одна запись базы данных.
Наиболее сложно кодировать ответы на открытые вопросы. Чаще всего, ответы некоторым образом группируются по смыслу. Главное здесь – добиться единообразия в кодировании. Лучше, если все ответы на открытый вопрос кодирует один человек. Если невозможно произвести кодирование в одиночку, то каждому кодировщику дается выборка ответов, обработанных коллегой, чтобы проверить единообразие их работы.
Кодирование можно производить буквами или цифрами. Возраст лучше оставлять в годах. Обязательно составление ключа – списка использованных кодов.
В процессе кодирования технико-экономической информации решаются две задачи:
qкодируемому объекту присваивается уникальное обозначение;
qдается информация о свойствах объекта.
Существует множество методов кодирования. Описание основных методов приведено в [16].