Машинное обучение. Погружение в технологию. Артем Демиденко. Читать онлайн. Newlib. NEWLIB.NET

Информация о произведении:

Автор:	Артем Демиденко
Издательство:	Автор
Серия:
Жанр произведения:
Год издания:	2023
isbn:

Скачать книгу

обучения без учителя является нахождение скрытых закономерностей, структур или групп в данных.

Некоторые из примеров задач обучения без учителя:

1. Кластеризация: В задачах кластеризации модель группирует объекты по их сходству без заранее заданных классов или категорий. Это позволяет выявить внутренние структуры в данных и идентифицировать группы схожих объектов. Примером алгоритма для кластеризации является k-средних (k-means).

2. Понижение размерности: Задача понижения размерности состоит в сокращении размерности данных, сохраняя при этом важные информационные характеристики. Это полезно для визуализации данных, удаления шума или избыточных признаков. Примерами алгоритмов понижения размерности являются метод главных компонент (PCA) и алгоритм t-SNE.

3. Ассоциативное правило: В этой задаче модель ищет статистические связи и ассоциации между различными элементами в наборе данных. Примером является алгоритм Apriori, который используется для нахождения часто встречающихся комбинаций элементов (таких как товары в корзине покупок).

Обучение без учителя полезно для обнаружения структур в данных и получения инсайтов о них, когда отсутствуют явные метки или целевые переменные. Этот подход позволяет модели самой извлекать информацию из данных и обнаруживать их скрытые характеристики.

1.5 Метрики и оценка производительности моделей

Оценка производительности моделей является важной частью процесса Машинного обучения. Для этого используются различные метрики, которые позволяют оценить, насколько хорошо модель справляется с поставленной задачей. Применение соответствующих метрик играет важную роль в измерении и сравнении производительности моделей. Вот более подробное описание некоторых метрик и методов оценки производительности:

1. В задачах классификации:

• Точность (accuracy): Измеряет долю правильно классифицированных объектов относительно общего числа объектов в выборке.

• Полнота (recall): Измеряет способность модели обнаруживать положительные случаи из общего числа положительных объектов.

• Точность (precision): Измеряет способность модели давать правильные положительные предсказания относительно всех положительных предсказаний.

• F-мера (F1 score): Комбинирует точность и полноту в одну метрику, представляющую сбалансированное среднее между ними.

2. В задачах регрессии:

• Средняя абсолютная ошибка (MAE): Измеряет среднее абсолютное отклонение между предсказанными и фактическими значениями.

• Средняя квадратичная ошибка (MSE): Измеряет среднее квадратичное отклонение между предсказанными и фактическими значениями.

• Коэффициент детерминации (R^2): Показывает, насколько хорошо модель объясняет изменчивость целевой переменной относительно базовой модели.

3. В задачах кластеризации:

• Коэффициент

Скачать книгу