딥러닝/ML

Ensemble (앙상블)
Ensemble 모델은 여러 개의 기본 모델들을 조합하여 정확한 예측을 수행하는 머신러닝 기법 Ensemble 모델에는 여러 가지 방법이 있지만, 대표적으로는 아래와 같은 4가지 방법이 있다 보팅 (Voting) 여러 모델의 예측을 모아서 다수결로 최종 예측을 결정하는 방법이며, 여러 모델이 서로 다른 샘플에서 높은 정확도를 보일 때 효과적입니다. 배깅 (Bagging) 데이터셋을 여러 개로 나누어서 각 모델에게 다른 데이터셋을 학습하도록 하는 방법. 각 모델이 다양한 관점에서 학습할 수 있으며, 이들의 예측을 평균내어 최종 예측을 결정 . 대표적으로 랜덤 포레스트 (Random Forest)가 있습니다. 부스팅 (Boosting) 부스팅은 여러 모델이 연속적으로 학습하도록 하여, 이전 모델이 잘못 예측..

넘파이 (NumPy) - ndarray , 관련 함수들
NumPy는 Numerical Python을 의미한다. 파이썬에서 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원하는 대표적인 패키지다. NumPy는 C/C++과 같은 저수준 언어 기반의 호환 API를 제공한다. NumPy는 빠른 배열 연산을 보장하지만, 파이썬 언어 자체가 가지는 수행 성능의 제약으로 중요한 부분은 C/C++ 기반의 코드로 작성하고 이를 NumPy에서 호출하는 방식으로 통합한다. (Tensorflow가 대표적인 예시) ndarray 개요 array1 = np.array([1, 2, 3]) print('array1 type:', type(array1)) print('array1 array 형태:', array1.shape) array2 = np.array([[1, 2, 3], [2,..

Machine Learning (with Python)
본 카테고리 글들은 "파이썬 머신러닝 완벅 가이드" 라는 책을 보고 작성하였습니다. + 강의 내용 및 책 내용을 요약하여 정리하였음. 머신러닝의 개념 머신러닝이란, 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법을 통칭한다. 머신러닝의 분류 지도학습 분류 회귀 추천 시스템 시각/음성 감지/인지 텍스트 분석, NLP 비지도학습 클러스터링 자원 축소 강화 학습 파이썬 머신러닝 주요 패키지 머신러닝 패키지 사이킷런(Scikit-Learn) DL Library : Tensorflow, Keras, Pytorch 행렬/선형대수/통계 패키지 머신러닝의 이론적 백그라운드는 선형대수와 통계로 이뤄져 있다 NumPy : 행렬과 선형대수를 다루는 패키지 SciPy : 자연과학과 통계를 위한 패키지 데이터 ..