Существуют две основные группы шкал измерения показателей (переменных): количественные и категориальные [Analysis of multivariate social science data, 2008, p. 8–10]. Переменные количественного уровня могут принимать как целые, так и дробные значения. Для них разница между двумя значениями по шкале является осмысленной величиной. К таким переменным относятся, например, росто-весовые показатели, число наступлений события, денежные единицы, проценты и доли и др., а также латентные показатели – интеллектуальные способности, демократия34, политическая культура и т.п., измеряемые только через моделирование. Признаки, измеренные в номинальных или порядковых (ординальных) шкалах называются категориальными. Обе шкалы позволяют распределить все наблюдения на категории (группы). Разница состоит в том, что в порядковой шкале упорядочение категорий разумно, скажем, уровня образования, а в номинальной шкале, например по признаку «страна рождения» или «пол», – нет.
Математические методы обработки количественных и категориальных данных существенным образом различаются, поэтому определение типа шкалы, в которой измерены признаки, – обязательный этап анализа данных.
Заметим, что вне зависимости от типа шкалы во многих случаях характер генезиса признаков можно считать схожим: интересующие исследователя социальные явления мыслятся как стохастические, т.е. не являющиеся жестко детерминированными и испытывающие влияние множества случайных факторов. Например, результаты социологического опроса для выявления установок по отношению к мигрантам. На ответы могут влиять не только действительные установки опрашиваемого, но и самочувствие, погода, личные переживания, личность интервьюера, проводящего опрос. К анализу многих признаков, природа которых обусловлена как закономерностями, так и случайностью, может применяться инструментарий теории вероятностей и математической статистики.
Стохастический взгляд на исследуемые признаки предполагает, что конкретные наблюдения суть результаты реализации некоторого порождающего данные процесса, который в новой ситуации может привести к возникновению другого набора значений. Следовательно,