YZ ZONE

[딥러닝] 1. 단층 퍼셉트론(SLP) _ 2. 이진판단_ 2.11 확장하기: 균형 잡힌 데이터셋과 착시 없는 평가방법 본문

IT/딥러닝

[딥러닝] 1. 단층 퍼셉트론(SLP) _ 2. 이진판단_ 2.11 확장하기: 균형 잡힌 데이터셋과 착시 없는 평가방법

러블리YZ 2023. 8. 1. 23:16

2.11 확장하기: 균형 잡힌 데이터셋과 착시 없는 평가방법

균형 잡힌 데이터 셋

- 취지:별과 펄서를 비슷한 수로 만들어 펄서 학습 기회를 늘리자

*별 데이터를 일부 버려 개수를 펄서에 맞추는 것은 가장 나쁜 대책

- 펄서 데이터를 중복 사용하여 별과 같은 개수로 하자

*2.11.3에서 확장처리

학습 데이터셋과 평가 데이터셋에 같은 내용 배정되는 문제 발생

과적합의 원인이 되고 있음

*약간의 잡음을 추가하는 것도 좋은 방법

 

착시 없는 평가 방법

-높은 정확도: 균형 잡히지 않은 데이터셋에서는 쉽게 도달 가능

*모든 문제에 펄서가 아니라고 답하면 90% 넘는 정확도 달성 가능

*정확도만으로는 온전한 성능 평가 곤란

- 확장된 평가 척도

*정밀도: 신경망이 참으로 추정한 것 중 실제로 답이 참인 것의 비율

*재현율: 실제로 답이 참인 것 중 신경망이 참으로 추정한 것의 비율

*F-1 값: 정밀도와 재현율의 조화 평균