Skewed Classes
Skewed Classes 학습 문제점
데이터를 다운로드 받습니다.
csv 형식의 데이터를 읽어옵니다.
위의 데이터는 sklearn.datasets의 make_classification()를 이용하여 skewed 데이터를 임의로 생성한 것입니다.
데이터 feature는 3개 있으며(var1~var2) label은 0 혹은 1의 값을 갖습니다.
Logistic Regression로 학습하여 정확도를 측정합니다. 학습 모델의 정확도는 얼마인가요?
학습된 모델로 예측한 값을 보겠습니다
모두 0으로 예측한 것을 볼 수 있습니다. Logistic regression은 에러를 줄이고 정확도를 올리기 위한 학습이므로 학습데이터의 비율은 고려하지 않고 정확도를 높이는 방향으로만 학습되는 것을 볼 수 있습니다.
토론이 없습니다