Recent posts

Binary Cross Entropy, Cross Entropy

1 minute read

진행 순서 이진 분류 멀티 이진 분류 다중 분류 이진 분류 이진 분류란, 데이터가 주어졌을 때, 해당 데이터를 두 가지 정답 중 하나로 분류하는 것을 의미합니다. 예를 들어, 홍길동이라는 데이터가 주어졌을 때, 해당...

K-최근접 이웃 (K-Nearest Neighbor)이란?

1 minute read

K-최근접 이웃 알고리즘이란? K-최근접 이웃 (K-Nearest Neighbor) 알고리즘은 지도학습 알고리즘 중 하나입니다. 새로운 데이터를 입력 받았을 때, 해당 데이터와 가장 가까이에...

K-평균(K-Means)이란?

1 minute read

비지도 학습 비지도 학습이란, 입력 데이터에 대한 출력 값(정답) 없이, 오직 입력 데이터만으로 학습을 진행한 뒤, 데이터로부터 유의미한 정보를 추출하는 머신러닝 기법입니다. 주요 기술 ...

배깅(Bagging), 부스팅(Boosting), 보팅(Voting)?

1 minute read

앙상블(Ensemble) 앙상블은 여러 개의 의사 결정 트리(Decision Tree)를 결합하여 하나의 결정 트리보다 더 좋은 성능을 내는 머신러닝 기법입니다. 앙상블 학습의 핵심은, 여러 개의 약 분류기(Weak Classifier)를 병렬 또는 직렬로 결합하여 강 ...

XGBoost

3 minute read

Boosting 이란? 여러 개의 약한 Decision Tree를 조합해서 사용하는 Ensemble 기법 중 하나이다. 즉, 약한 예측 모형들의 학습 에러에 가중치를 두고, 순차적으로 다음 학습 모델에 반영하여 강한 예측모형을 만드는 것이다. ...