본문 바로가기

Machine Learning/머신러닝 완벽가이드 for Python

ch03 요약

  • 이진 분류에서 정밀도,재현율, F1 스코어, AUC 스코어가 주로 성능 평가지표로 활용됩니다.
  • 오차행렬은 실제 클래스 값과 예측 클래스 값의 True, False 에 따라 TN,FP,FN,TP로 매핑되는 4분면 행렬을 제공합니다.
  • 정밀도와 재현율은 Positive 데이터 세트의 예측 성능에 좀 더 초점을 맞준 지표이며, 분류 결정 임계값을 조정해 정밀도 또는 재현율은 수친를 높이거나 낮출 수 있습니다.
  • F1 스코어는 정밀도와 재현율이 어느한쪽으로 치우지지 않을때 좋은 값을 가집니다.
  • AUC 스코어는 ROC 곡선 밑의 면적을 구한것으로 1 에 가까울수록 좋은 수치입니다.