При неконтролируемом обучении системе предлагается очень большой набор данных, которые в начале процесса для нее ничего не «значат». Однако по ходу анализа искусственный интеллект может определить в этих данных схожие характеристики (так называемые кластеры сходства). Следует отчетливо понимать, что искусственный интеллект не вкладывает в эти сходства и различия никакого «смысла» в человеческом понимании; он просто ищет повторение шаблонов среди океана информации. Но самое замечательное в таком подходе то, что и сам пользователь может ничего не понимать в этих данных. Да ему зачастую и не нужно знать, что он ищет: всю эту работу выполняет искусственный интеллект. Что бы мы ни исследовали, после того как ИИ определит кластеры сходства, он сможет создавать прогнозы для новых входящих данных.
Например, мы хотим определить стоимость дома в определенном районе. Цена дома зависит от многих переменных, таких как местоположение, количество жилых и ванных комнат, года постройки, площади участка земли и т. д. Такое обилие входящей информации затрудняет прогнозирование стоимости. Однако между всеми этими переменными, безусловно, должна быть какая-то скрытая связь, вопрос лишь в том, как ее найти. Именно это и делает за нас искусственный интеллект. Если в его распоряжении есть достаточное количество базовых данных, содержащих все эти переменные вместе с фактической ценой недвижимости, он использует статистический анализ, чтобы найти все доступные связи. Причем некоторые переменные могут очень сильно влиять на цену, а другие, как выясняется, вообще не оказывают на нее воздействия. Подготовив таким образом статистическую модель, мы вводим те же характеристики для дома, цена которого еще неизвестна, и модель