CodeOnWeb - ML 방법론 및 결과 해석 실습

데이터를 다운로드 받습니다.

csv 형식의 데이터를 읽어옵니다.

위의 데이터는 sklearn.datasets의 make_classification()를 이용하여 skewed 데이터를 임의로 생성한 것입니다.
데이터 feature는 3개 있으며(var1~var2) label은 0 혹은 1의 값을 갖습니다.

Logistic Regression로 학습하여 정확도를 측정합니다. 학습 모델의 정확도는 얼마인가요?

학습된 모델로 예측한 값을 보겠습니다

모두 0으로 예측한 것을 볼 수 있습니다. Logistic regression은 에러를 줄이고 정확도를 올리기 위한 학습이므로 학습데이터의 비율은 고려하지 않고 정확도를 높이는 방향으로만 학습되는 것을 볼 수 있습니다.

464 읽음

이전 ML 방법론 및 결과 해석 실습-underfitting/overfitting

다음 ML 방법론 및 결과 해석 실습 - Precision/Recall

Please log in to leave a comment