[STATISTICS] 선형대수학, 벡터 통계
1. 선형대수학 1) 벡터 - 숫자의 나열 - 숫자의 묶음 예) x = (1, 2, 3), y = (4, 3, 1) 2) 벡터의 연산 x + y = (5, 5, 4) 3 * x = (3, 6, 9) 3) 벡터의 특징 - 원소값, 방향(상대적인 위치) 4) 벡터의 차원 - 원소의 개수 5) 벡터의 크기(원점과의 거리) - 벡터의 모든 원소를 제곱하고 다 더한 뒤, 루트를 씌워준 값 2. 통계 1) 기술통계량(descriptive statistics) - 데이터에서 측정할 수 있는 요약된 수치값들 - 평균 : 데이터의 값을 더한 다음, 개수로 나눈 값 - 분산 : 데이터의 퍼진 정도. 각 데이터에서 평균을 뺀 값을 제곱해서 다 더한 뒤 데이터 개수로 나눈 값. - 표준분산 : 분산의 양의 제곱근 - 중앙값 ..
2023. 4. 11.
[Machine Learning / ML] 머신러닝 정의 - 지도학습, 비지도학습, 회귀, 분류, 군집화, 변환, 강화학습
[2] 머신러닝 정의 2.1. Machine Learning : 컴퓨터가 주어진 입력값(X)과 찾고자 하는 값(y) 사이의 관계를 모델링하는 방법 공부하는 것과 비슷함 기말고사에서 주어진 족보를 풀어서 기말고사 점수가 향상되는 과정을 학습이라고 함(Human Learning) 데이터와 데이터 사이의 관계를 찾는 것 모델 -- y = f(X) -- -- 타겟값() 입력(input) 입력 데이터(X)와 타겟값(y)을 알고 있는 데이터를 학습하여, 이들의 관계를 모델링하는 학습 방법 Supervised Learning - 지도 학습(답O) 입력 데이터(X)와 그에 해당하는 정답(y)가 함께 학습에 사영되는 방법론. 예) 자동차의 특성 (연식, 주행거리, 배기량, 연료 타입 등)과 가격을 입력해 중고차 가격을 ..
2023. 3. 30.
[Machine Learning] 배경지식 - PANDAS, PYTORCH, TENSORFLOW, NUMPY, Sklearn, Matplotlib
[1] 배경지식 1.1. 인공지능, 머신러닝, 딥러닝 인공지능(AI) 인간의 뇌를 모방하는 모든 프로그램 머신러닝(ML) 데이터를 기반으로 학습해 무언가를 예측하거나, 데이터 자체의 어떤 특성을 찾아내는 프로그램 딥러닝(DL) 머신러닝 알고리즘 중 하나로, 인공신경망에서 진화한 형태. 이미지, 비디오, 자연어 분석에 쓰임 1.2. 머신러닝 기계학습 머신이 학습을 하는 걸 말함 비교 [전통적인(일반적인) 프로그램] Traditional Programming 데이터 ==> Y = 3x + 10 [1, 3, 5] ==> Y = 3x + 10 ==> [13, 19, 25] Machine Learning [1, 3, 5] ==> Y = 3x + 10 ==> [13, 19, 25] [샘플 데이터] ==> 모델 ==..
2023. 3. 29.