[3] 머신러닝 프로세스
3.1. 데이터 수집
- 내부
- 외부 데이터
- 공개 데이터
- 캐글 (https://www.kaggle.com/)
- 오픈엠엘 (https://www.openml.org/)
- 공개 데이터
3.2. 데이터 전 처리
- 수집된 데이터는 대개는 잘못된 값이 들어 있거나 활용하기 불편하게 정리되어 있음
- 수정 및 정리 및 데이터를 추가로 만들어내는 과정
- 피처 엔지니어링
3.3. 모델 학습
- 주요 모델
3.4. 모델 평가
- 학습이 완료된 모델을 사용해 예측해 봄, 결과를 평가
3.5. 모델 배포
- 머신러닝 결과물을 활용하는 단계
- 서비스에 직/간접적으로 활용
- 예측 결과물을 대시보드 형태로 시각화해 공개
- 모델링을 통해 얻은 인사이트를 유관부서에 전달하는 방식
3.6. 반복 (ML Ops)
'PYTHON > Machine Learning' 카테고리의 다른 글
[Machine Learning / ML] 머신러닝 정의 - 지도학습, 비지도학습, 회귀, 분류, 군집화, 변환, 강화학습 (0) | 2023.03.30 |
---|---|
[Machine Learning] 배경지식 - PANDAS, PYTORCH, TENSORFLOW, NUMPY, Sklearn, Matplotlib (0) | 2023.03.29 |
댓글