MSE = (1/n) * Σ(y – ŷ)²,
где n – количество наблюдений, y – истинное значение зависимой переменной, ŷ – предсказанное значение зависимой переменной.
2. Коэффициент детерминации (R-squared): Эта метрика оценивает, насколько хорошо модель соответствует данным. Коэффициент детерминации показывает долю дисперсии зависимой переменной, которая объясняется моделью. Значение коэффициента детерминации находится в диапазоне от 0 до 1, где 0 означает, что модель не объясняет вариацию данных, а 1 означает, что модель идеально соответствует данным. Формула для расчета коэффициента детерминации:
R² = 1 – (SSR / SST),
где SSR – сумма квадратов остатков, SST – общая сумма квадратов отклонений от среднего.
3. Средняя абсолютная ошибка (Mean Absolute Error, MAE): Эта метрика измеряет среднее абсолютное отклонение между предсказанными значениями модели и истинными значениями зависимой переменной. Она является более устойчивой к выбросам, чем среднеквадратичная ошибка. Формула для расчета MAE:
MAE = (1/n) * Σ|y – ŷ|.
4. Корень из среднеквадратичной ошибки (Root Mean Squared Error, RMSE): Эта мет
рика представляет собой квадратный корень из среднеквадратичной ошибки и используется для измерения среднего отклонения предсказанных значений от реальных значений. RMSE также измеряется в тех же единицах, что и зависимая переменная, что облегчает интерпретацию. Формула для расчета RMSE:
RMSE = √MSE.
Кроме этих основных метрик, существуют и другие метрики оценки качества модели регрессии, такие как коэффициенты корреляции, коэффициенты эффективности и другие, которые могут быть применены в зависимости от конкретной задачи и требований бизнеса.
Важно выбирать подходящую метрику в соответствии с целями анализа и спецификой данных, чтобы получить объективную оценку качества модели регрессии и прогнозирования.
При выборе подходящей метрики для оценки качества модели регрессии и прогнозирования следует учитывать следующие факторы:
1. Цель анализа: Определите, какую информацию вы хотите получить из модели и какие вопросы вы хотите на них ответить. Например, если вам важно измерить точность предсказания, то среднеквадратичная ошибка (MSE) или корень из среднеквадратичной ошибки (RMSE) могут быть подходящими метриками. Если ваша цель заключается в понимании объясняющей способности модели, то коэффициент детерминации (R-squared) может быть полезной метрикой.
2. Специфика данных: Рассмотрите особенности ваших данных, такие как наличие выбросов, несбалансированность классов или другие аномалии. Некоторые метрики, такие как среднеквадратичная ошибка (MSE), могут быть чувствительны к выбросам, в то время как средняя абсолютная ошибка (MAE)