assert, round,np.repeat,MAE
by daramiassert
assert donors.shape == (748,5)
출처: https://blockdmask.tistory.com/553 [개발자 지망생]
round
# Baseline baseline = homes['SalePrice'].mean() print("baseline of SalePrice:", round(baseline,2))
round??
round(반올림하고자 하는 값, 자릿수)
round(baseline,2) = baseline의 값을 소수점 2번째 자리 까지 반올림 하여 나타내라.
+추가 학습 저번에 배운거
"이것을 문자열 { : .2f}".format(실수 입력)
이런 식으로 사용하면 { : .2f } "소수점 2자리 까지만 출력하겠다." 라는 뜻이며,
이것은 소수점 3번째 자리에서 반올림을 해서 2자리 까지 출력을 하게 됩니다.
: 콜론의 앞에는 format 인자의 번지를 입력하는 부분이고,
: 콜론 뒤에는 .숫자f 로 입력하면 숫자만큼의 자릿수까지 출력하겠다는 뜻입니다.
출처: https://blockdmask.tistory.com/534 [개발자 지망생]
np.repeat
mae = mean_absolute_error(homes['SalePrice'], np.repeat(baseline, len(homes))) print("MAE:", round(mae,2))
그니까 baseline을 homes데이터의 길이만큼 repeat 하라..?
???
지금 알다시피 MAE 가 뭔지 R2가 뭔지 개념이 흔들흔들한다. 유튜브 /구글보고 가실게요.
유튜브 보다는 구글링이 더 빠르다!!! 더 이해가 잘된다!!!
MAE
- 실제 값과 예측 값의 차이(Error)를 절대값으로 변환해 평균화
- MAE는 에러에 절대값을 취하기 때문에 에러의 크기 그대로 반영된다. 그러므로 예측 결과물의 에러가 10이 나온 것이 5로 나온 것보다 2배가 나쁜 도메인에서 쓰기 적합한 산식이다.
- 에러에 따른 손실이 선형적으로 올라갈 때 적합하다.
- 이상치가 많을 때
https://mizykk.tistory.com/102

MAE(y_true, y_pred)

값들의 길이가 같아야 작동! 그래서 평균에 len(homes)를 곱해줌
R2
식으로 표현하면 회귀 제곱합(SSR) / 총제곱합(SST)
요약하자면 R2 Score는 회귀 모델이 얼마나 '설명력' 이 있느냐를 의미합니다. 그리고 그 설명력은 SSR/SST 식이지만 '실제 값의 분산 대비 예측값의 분산 비율' 로 요약 될 수 있으며, 예측 모델과 실제 모델이 얼마나 강한 상관관계(Correlated)를 가지는가로 설명력을 요약할 수도 있습니다.
[Python] 성능 측정 지표 :: MAE, MSE, RMSE, MAPE, MPE, MSLE
1. MAE (Mean Absolute Error) - 실제 값과 예측 값의 차이(Error)를 절대값으로 변환해 평균화 - MAE는 에러에 절대값을 취하기 때문에 에러의 크기 그대로 반영된다. 그러므로 예측 결과물의 에러가 10이
mizykk.tistory.com
np.repeat(baseline,len(homes)) 가 y_pred가 되나?? 응
왜 굳이 copy..?
블로그의 정보
다람
darami