본문 바로가기

AI

정밀도(Precision)와 재현율(Recall)의 차이

*빠른 결론: 그림 있는 부분으로 스크롤

 

모델 평가 지표 중에 정밀도와 재현율의 차이가 뭘까요?

chatGPT 왈...

정밀도 (Precision)
정밀도는 모델이 양성으로 예측한 경우 중 실제로 양성인 비율을 측정합니다. 이는 모델의 예측 중 실제 양성인 경우가 얼마나 되는지를 보여주는 것으로, 모델의 정확도를 나타내는 지표입니다. 정밀도를 계산하는 식은 다음과 같습니다:
- 정밀도 = (진짜 양성 / (진짜 양성 + 거짓 양성))

여기서 '진짜 양성'은 모델이 양성이라고 예측하고 실제로 양성인 경우를, '거짓 양성'은 모델이 양성이라고 예측했지만 실제로는 음성인 경우를 의미합니다.

재현율 (Recall)
재현율은 실제 양성인 경우 중 모델이 양성으로 정확하게 예측한 비율을 측정합니다. 이는 모델이 실제 양성을 얼마나 잘 찾아내는지를 나타내며, 미감지된 양성 케이스를 최소화하는 데 중요한 지표입니다. 재현율을 계산하는 식은 다음과 같습니다:
- 재현율 = (진짜 양성 / (진짜 양성 + 거짓 음성))

여기서 '거짓 음성'은 모델이 음성이라고 예측했지만 실제로는 양성인 경우를 의미합니다.

이 두 지표는 서로 상충될 수 있어서, 하나를 향상시키려고 하면 다른 하나가 떨어질 수 있습니다. 예를 들어, 모든 것을 양성으로 분류하면 재현율은 100%가 되지만 정밀도는 매우 낮아집니다. 그래서 이 두 지표의 균형을 잘 맞추는 것이 중요합니다.

 

뭔소리일까요??

 

초등학생도 이해할 수 있게 쉽게 설명해달라고 한 끝에 드디어 이해할 수 있었습니다.

제가 그린 그림입니다.

까만색 네모 테두리가 쿠키 통이라고 치고, 하늘색 쿠키와 주황색 쿠키가 있을 때 주황색 쿠키만 골라내고 싶다고 합시다.

초록색 테두리 안에 있는 쿠키들이 제가 주황색 쿠키일 줄 알고 고른 쿠키들입니다.

 

정밀도(Precision)란?

제가 고른 쿠키 중 주황색 쿠키가 몇 개나 있는지입니다.

5개를 골랐는데 주황색 쿠키가 4개입니다. 저의 정밀도는 80%입니다.

주황색 쿠키를 얼마나 정확하게 골라냈는지를 나타냅니다.

 

재현율(Recall)이란?

모든 주황색 쿠키 중 제가 몇 개를 골라냈는지입니다.

주황색 쿠키가 총 5개 있는데 제가 4개를 골랐습니다. 저의 재현율은 80%입니다.

주황색 쿠키를 놓치지 않고 얼마나 많이 골라냈는지를 나타냅니다.

 

왜 두가지가 상충될까요?

i) 정밀도가 100%일 때

주황색 쿠키 1개를 골랐다고 가정해봅시다.

총 1개를 골랐는데 그 중 주황색 쿠키가 1개입니다. 저의 정밀도(Precision)는 100%입니다.

그런데 주황색 쿠키 5개 중 1개밖에 못 찾아냈습니다. 재현율(Recall)은 25%입니다.

ii) 재현율이 100%일 때

반대로, 모든 쿠키를 골랐다고 가정해봅시다.

저는 주황색 쿠키 5개 중 5개를 다 골라냈기 때문에, 재현율(Recall)은 100%입니다.

그런데 8개를 골랐는데 주황색 쿠키가 5개밖에 안 됩니다. 정밀도(Precision)는 62.5%입니다.

 


 

모델 성능을 평가해보다가 정밀도와 재현율의 차이가 궁금해져서 정리해봤습니다. 저처럼 개념이 잘 안 잡힌 분이 유용하게 사용하시길...