과제
문제 1
초승달 데이터셋을 이용한 결정트리 모델을 미세 조정합니다.
-
교차검증을 사용하는 그리드 탐색 실행
-
85 ~ 87% 정도의 정확도가 나와야 함
문제 2
랜덤 포레스트(Random Forest) 모델을 훈련하는 방법을 살펴봅니다. 랜덤 포레스트는 여러 개의 결정트리로 구성된다.
- 무작위로 선택된 100개의 초승달 훈련 샘플로 구성된 훈련셋 1,000개를 생성한다. 이를 위해 ShuffleSplit 클래스를 이용한다.
- 앞서 찾은 최적의 모델을 각 미니 훈련셋에 대해 추가 훈련한 다음 테스트셋에 대한 정확도의 평균값을 계산한다.(결과는 80% 정도)
- 정확도의 평균이 아닌 1,000개의 모델이 가장 많이 예측하는 값을 예측값으로 사용해보자.(최빈값 계산 - 앙상블 학습)