본문 바로가기
PYTHON/Machine Learning

[Machine Learning / ML] 머신러닝 정의 - 지도학습, 비지도학습, 회귀, 분류, 군집화, 변환, 강화학습

by B_E_D 2023. 3. 30.

[2] 머신러닝 정의

2.1. Machine Learning : 컴퓨터가 주어진 입력값(X)과 찾고자 하는 값(y) 사이의 관계를 모델링하는 방법

  • 공부하는 것과 비슷함

    • 기말고사에서 주어진 족보를 풀어서 기말고사 점수가 향상되는 과정을 학습이라고 함(Human Learning)

    • 데이터와 데이터 사이의 관계를 찾는 것

              모델
              --
          y = f(X)
         --     -- 
      타겟값()     입력(input)
      • 입력 데이터(X)와 타겟값(y)을 알고 있는 데이터를 학습하여, 이들의 관계를 모델링하는 학습 방법
  • Supervised Learning - 지도 학습(답O)

    • 입력 데이터(X)와 그에 해당하는 정답(y)가 함께 학습에 사영되는 방법론.
    • 예) 자동차의 특성 (연식, 주행거리, 배기량, 연료 타입 등)과 가격을 입력해 중고차 가격을 예측하는 모델.
    - a. Classification (분류)
      - 주어진 데이터(X)를 몇가지 종류(y, category)로 나누는 방법
      - 예측 결과값이 비연속적인 경우
      - 예 / 아니오 처럼 답변을 얻게 됨
      - 예) 마케팅 (동의)문자를 보냈을 때 구매할 것 같은 고객을 예측하는 문제는 Yes/No 두가지 범주로 표현됨
    - b. Regression (회귀)
      - 주어진 데이터(X)와 관련이 있다고 생각하는 값(y) 사이의 관계를 찾는 방법
      - 예측 결과값이 연속성을 지니는 경우
      - 예) 매출액 예측, 부동산 가격 예측, 거래량 예측
  • UnSupervised Learning - 비지도학습 (답(X))

    • 입력 데이터(X)만 학습에 사용되는 방법론 (y가 주어져 있지 않은 경우)

    • 정답이 없는 데이터만으로 학습함

    • 예) 신용카드 회사에서 고객 데이터를 가지고 최대한 특징이 비슷한 부류끼리 묶는 행위

      - a. Clustering (군집화)
        - 주어진 데이터(X)를 몇 가지 그룹(subset of X)으로 나누는 방법
        - 소비패턴이 유사한 카드 고객을 묶어주는 것과 같은 용도로 사용
      - b. Dimensionality Reduction (변환)
        - 주어진 데이터(X)의 중요한 정보들을 뽑아내는 방법
        - 목적에 따라 데이터를 다른 형태로 변환하는 방법
  • Reinforcement Learning - 강화 학습

    • 목표를 최대화하는 학습 방법론

댓글