Обучение с учителем очень похоже на традиционный аналитический метод регрессионного анализа, который используется в модели оценки. Цель регрессионного анализа заключается в том, чтобы создать модель, предсказывающую известный результат, используя набор входных переменных с известными значениями, которые могут быть связаны с этим результатом. Когда модель разработана, ее можно использовать для предсказания неизвестного результата на основе известных значений тех же входных переменных. Например, можно разработать регрессионную модель, предсказывающую вероятность заболевания диабетом в зависимости от возраста пациента, уровня его физической активности, количества потребляемых калорий и индекса массы тела. При разработке этой модели мы будем ориентироваться на пациентов, которые уже заболели или не заболели диабетом, используя все доступные данные для построения регрессионной модели. Обнаружив хорошую предсказательную регрессионную модель, мы сможем использовать ее на новом наборе данных, чтобы предсказать неизвестный результат – вероятность заболевания диабетом в зависимости от определенных значений входных переменных. Это называется скорингом (как в регрессионном анализе, так и в машинном обучении).
Регрессионный процесс напоминает машинное обучение с учителем, но имеет ряд особенностей:
● В машинном обучении данные, используемые для разработки (тренировки) модели, называются тренировочными данными и могут представлять собой подмножество данных, необходимых исключительно для тренировки системы.
● В машинном обучении тренировочная модель часто утверждается при помощи другого подмножества данных, для которого известен подлежащий предсказанию результат.
● В регрессионном анализе может и не возникнуть желание использовать модель для предсказания неизвестных результатов, тогда как в машинном обучении наличие этого желания подразумевается.
● В машинном обучении может использоваться множество различных алгоритмов, которые не ограничиваются простым регрессионным анализом.
Модели обучения без учителя, как правило, более сложны в разработке. Они распознают закономерности в данных, которые не маркированы заранее и для которых неизвестен результат. Третий способ обучения, обучение с подкреплением, предполагает, что система машинного обучения имеет определенную цель и каждое продвижение к этой цели