RMSE
좋아요!
RMSE에 대해 추가로 자세히 설명해드릴게요:
RMSE란?
- RMSE는 Root Mean Squared Error의 약자입니다.
- “평균 제곱 오차의 제곱근” 을 뜻합니다.
- 쉽게 말하면, 모델이 예측한 값과 실제 값 사이의 오차(틀린 정도) 를 숫자 하나로 요약한 지표입니다.
왜 쓰나요?
- RMSE는 오차가 클수록 벌점이 커지게 설계되어 있어서,
예측이 많이 틀린 경우를 민감하게 감지할 수 있습니다. - 그래서 정확한 모델을 만들고 싶을 때 RMSE를 줄이는 걸 목표로 합니다.
수식 (조금 수학적으로 보면)
[ \text{RMSE} = \sqrt{ \frac{1}{n} \sum_{i=1}^{n} (예측값_i - 실제값_i)^2 } ]
- ( n ) = 데이터 포인트 수
- ( 예측값 ) = 모델이 예측한 값
- ( 실제값 ) = 실제 관측된 값
직관적으로
RMSE 값 | 해석 |
---|---|
작다 (0에 가깝다) | 모델 예측이 거의 정확하다 |
크다 | 모델 예측이 많이 틀린다 |
예를 들어, RMSE가 5라면, 평균적으로 예측이 실제 값과 약 5만큼 차이난다는 뜻입니다.
BQML과 RMSE
- BQML (BigQuery ML) 모델에서 RMSE를 평가할 수 있어요.
- 예측 문제 (특히 회귀문제)에서는 RMSE가 낮을수록 모델이 더 “좋다"고 판단합니다.
예를 들면:
SELECT
*
FROM
ML.EVALUATE(MODEL `your_project.your_dataset.your_model`);
을 실행하면 RMSE 등 평가 지표가 나옵니다.
한 줄 요약
RMSE는 모델이 실제값과 얼마나 가까운지 나타내는 오차 지표이고, 낮을수록 좋은 모델이다.
추가로, RMSE 말고 BQML이 보여주는 다른 지표들 (예: MAE, R² 등)도 함께 설명해드릴까요? ✨
(간단 비교표로 정리해드릴 수도 있어요!)