Оси координат, обозначенные названиями признаков, для каждого индивида одни и те же. Пусть число осей равно п. Таким образом, если измерены значения признаков каждого индивида, то все индивиды в пространстве признаков образуют некоторое облако точек (нечто вроде созвездия), так как не существует индивидов с совершенно одинаковыми значениями признаков по всем осям координат.
Может быть рассчитана матрица расстояний или матрица мер близости между «изображающими точками» – образами индивидов в n-мерном пространстве. Очевидно, «изображающие точки» распределены с какими-то сгущениями или разряжениями. Существуют алгоритмы, позволяющие выделить, обнаружить эти сгущения и разряжения. При этом ЭВМ как бы самостоятельно разбивает исходное множество индивидов на группы, классы, таксоны. Алгоритмы такого рода называются алгоритмами «самообучения ЭВМ» или алгоритмами автоматической классификации84.
Для наших целей недостаточно разбить исходное множество «образов» на компактные группы (классы, таксоны). Нам необходимо также получить структуру взаимосвязей между этими «образами», выявить иерархию полученных разбиений.
В свое время В. А. Леванским совместно с А. М. Левиным и Н. В. Храмцовой разработан алгоритм структурной таксономии85. Этот алгоритм по некоторому критерию выделяет группы «наибольшей близости» между «изображающими точками», строит кратчайший незамкнутый путь между ними, разбивает этот путь на участки (классы, таксоны) по принципу нарушения монотонности изменения расстояний, соединяющих респондентов в я-мерном пространстве.
В отличие от большинства алгоритмов таксономии этот алгоритм позволяет не только получить заранее не заданные сгущения точек в я-мерном пространстве признаков, но и структуру взаимосвязей между «изображающими точками». На выходе получается «древо взаимосвязей» между респондентами – граф, вершины которого соответствуют респондентам, а ребра – расстояниям между ними в пространстве признаков.
Рассматривая структуры взаимосвязей между респондентами, исследователь может выделить центральные и крайние «изображающие точки», найти «лидеров» и «аутсайдеров», отобрать типических респондентов и т. д. Подчеркнем «персонифицированность» полученной информации. Вершинам графа («древа взаимосвязей») соответствуют конкретные респонденты.
Алгоритмы структурной таксономии позволяют получить прямую и обратную структуру взаимосвязей между «образами» (по принципу максимальной близости и максимальной отдаленности) для расстояний типа евклидовых. Для корреляционных матриц они могут построить четыре картины взаимосвязей (с учетом знаков коэффициентов корреляции). Подробней эти алгоритмы описаны в литературе86.
Заметим, что векторные представления позволяют рассматривать одновременно как единое целое с помощью ЭВМ десятки и сотни параметров, в то время как даже весьма