Анализ данных


Разговор до этого шел о сборе данных. Когда же они собраны, то требуется найти в них некоторый смысл, получить из них полезную информацию.

Предварительные шаги


Редактирование


Под редактированием понимается обеспечение
минимальных стандартов качества данных.

Редактирование в поле является предварительным, устраняются большие пропуски и явные неточности в ответах. Контролируются также и полевые работники: выявляются ошибки в их работе, проверяется понимание ими процедуры проведения опросов или наблюдений. Главное – провести редактирование как можно быстрее, пока еще можно что-то исправить с малыми затратами.

Редактирование в офисе производится грамотным специалистом, который знает цели и процедуры исследования. Если редактор не один, то работа должна разделяться по инструментам сбора данных, а не по респондентам. Здесь решаются вопросы о том, что делать с анкетами, в которых много неответов; в которых нет ответов на отдельные пункты; содержащими противоречивые ответы; заполненными незаинтересованными людьми, ответившими, например, на все вопросы одинаково. Обычно такие анкеты обрабатываются отдельно от прочих. Затем проверяется, влияет ли их включение на результаты исследования.


Кодирование


Кодирование – категоризация данных и представление их в условном виде (обычно – числовом).
Это принципиально неавтоматизируемая процедура.

Иногда ответ бывает единственным (возраст), иногда ответов может быть несколько (причины покупки). Кодирование может производиться как самим респондентом (например, путем выбора одного из предложенных ответов), так и интервьюером.

Удобно пронумеровать анкеты. Здесь это делается не для нарушения инкогнито, а для удобства. Обычно каждой анкете будет впоследствии отведена одна запись базы данных.

Наиболее сложно кодировать ответы на открытые вопросы. Чаще всего, ответы некоторым образом группируются по смыслу. Главное здесь – добиться единообразия в кодировании. Лучше, если все ответы на открытый вопрос кодирует один человек. Если невозможно произвести кодирование в одиночку, то каждому кодировщику дается выборка ответов, обработанных коллегой, чтобы проверить единообразие их работы.

Кодирование можно производить буквами или цифрами. Возраст лучше оставлять в годах. Обязательно составление ключа – списка использованных кодов.

В процессе кодирования технико-экономической информации решаются две задачи:

qкодируемому объекту присваивается уникальное обозначение;

qдается информация о свойствах объекта.

Существует множество методов кодирования. Описание основных методов приведено в [16].