[2] 머신러닝 정의
2.1. Machine Learning : 컴퓨터가 주어진 입력값(X)과 찾고자 하는 값(y) 사이의 관계를 모델링하는 방법
공부하는 것과 비슷함
기말고사에서 주어진 족보를 풀어서 기말고사 점수가 향상되는 과정을 학습이라고 함(Human Learning)
데이터와 데이터 사이의 관계를 찾는 것
모델 -- y = f(X) -- -- 타겟값() 입력(input)
- 입력 데이터(X)와 타겟값(y)을 알고 있는 데이터를 학습하여, 이들의 관계를 모델링하는 학습 방법
Supervised Learning - 지도 학습(답O)
- 입력 데이터(X)와 그에 해당하는 정답(y)가 함께 학습에 사영되는 방법론.
- 예) 자동차의 특성 (연식, 주행거리, 배기량, 연료 타입 등)과 가격을 입력해 중고차 가격을 예측하는 모델.
- a. Classification (분류) - 주어진 데이터(X)를 몇가지 종류(y, category)로 나누는 방법 - 예측 결과값이 비연속적인 경우 - 예 / 아니오 처럼 답변을 얻게 됨 - 예) 마케팅 (동의)문자를 보냈을 때 구매할 것 같은 고객을 예측하는 문제는 Yes/No 두가지 범주로 표현됨 - b. Regression (회귀) - 주어진 데이터(X)와 관련이 있다고 생각하는 값(y) 사이의 관계를 찾는 방법 - 예측 결과값이 연속성을 지니는 경우 - 예) 매출액 예측, 부동산 가격 예측, 거래량 예측
UnSupervised Learning - 비지도학습 (답(X))
입력 데이터(X)만 학습에 사용되는 방법론 (y가 주어져 있지 않은 경우)
정답이 없는 데이터만으로 학습함
예) 신용카드 회사에서 고객 데이터를 가지고 최대한 특징이 비슷한 부류끼리 묶는 행위
- a. Clustering (군집화) - 주어진 데이터(X)를 몇 가지 그룹(subset of X)으로 나누는 방법 - 소비패턴이 유사한 카드 고객을 묶어주는 것과 같은 용도로 사용 - b. Dimensionality Reduction (변환) - 주어진 데이터(X)의 중요한 정보들을 뽑아내는 방법 - 목적에 따라 데이터를 다른 형태로 변환하는 방법
Reinforcement Learning - 강화 학습
- 목표를 최대화하는 학습 방법론
'PYTHON > Machine Learning' 카테고리의 다른 글
[Machine Learning / ML] 머신러닝 프로세스 (0) | 2023.03.31 |
---|---|
[Machine Learning] 배경지식 - PANDAS, PYTORCH, TENSORFLOW, NUMPY, Sklearn, Matplotlib (0) | 2023.03.29 |
댓글