Over-Sampling & Under-Sampling & SMOTE(Synthetic Minority Oversampling Technique)
# 클래스 불균형 자료(Imbalanced Data) 클래스 불균형 자료는 타겟변수의 클래스가 불균형한 자료를 의미합니다. 타겟변수의 클래스가 불균형하다는게 무슨 말인지 잘 이해가 되지 않으신다고요? 언제나 그랬듯이 이번에도 간단한 예시와 함께 살펴봅시다! 자, 여기에 이메일 데...
# 클래스 불균형 자료(Imbalanced Data) 클래스 불균형 자료는 타겟변수의 클래스가 불균형한 자료를 의미합니다. 타겟변수의 클래스가 불균형하다는게 무슨 말인지 잘 이해가 되지 않으신다고요? 언제나 그랬듯이 이번에도 간단한 예시와 함께 살펴봅시다! 자, 여기에 이메일 데...
다항회귀 (Polynomial Regression) 지난 글에서는 선형회귀 (Linear regression)에 대해 알아보고 실습까지 진행해보았다. 이번 시간에는 다항회귀와 다중선형회귀가 무엇인지와 이 둘의 차이에 대해 알아보도록 하자. (그 전에, 선형회귀에 대해 잘 ...
하이퍼 파라미터 튜닝 수행 방법 대표적으로 GridSearch, RandomSearch, Bayesian Optimization, 수동 튜닝이 있다. 하이퍼 파라미터 튜닝의 주요 이슈 ●Gradient Boosting 기반 알고리즘은 튜닝 해야 할 하이퍼 파라미터 개수가 많고...
이진 분류란? 이진 분류란, 문제에 대한 정답을 두 가지 답 중 하나로 분류하는 것을 의미한다. 예를 들어, 문제에 대한 정답이 0 과 1 중 하나라면, 해당 문제에 대한 정답이 1 일 확률이 출력되고, 해당 확률이 0.5 이상이면 ...
(과제) 앙상블 학습과 랜덤 포레스트 참고 (구글코랩) 앙상블 학습과 랜덤 포레스트 의 소스코드를 먼저 공부하세요. 문제 1 Machine Learning 5 Random Forests의 내용을 캐글(Kaggle)에서 정리, 학습해보세요. 문제 2 Machine Lear...