3-1/Data Mining

4주차-Linear Models

Donghun Kang 2024. 5. 11. 16:06

-Deterministic: 확정적인 관계, X variable만으로 Y variable을 전부 표현

-Stochastic: 확률적인 관계, X variable과 error로 Y variable을 표현

 

Linear Regression: 입력 변수 X와 출력 변수 Y의 평균 사이의 관계를 나타내는 직선을 찾는다.

-Assumption of error

1) 정규화 2) 비편향성 3) 등분산성 4) 독립성

-Parameter 찾기

Linear regression + regularization

-Regularized regression

 

-> 만약 어떤 특정한 w의 값에 따라서 모델의 추론 값이 크게 달라진다면 variance가 높아진다.

 

1. Linear regression

2. Ridge regression (L2 regularization)

3. Lasso regression (L1 regularization)

4. Elastix Net regression (L2 + L1 regularization)

Rigdge regression

Lasso regression

-Penalty function og Ridge and Lasso

-> Lasso의 경우 예측에 중요하지 않은 변수는 0이 된다.

-Logistic regression

'3-1 > Data Mining' 카테고리의 다른 글

7주차-SVM(1)  (3) 2024.05.11
6주차-Random Forest  (0) 2024.05.11
5주차-Decision Tree  (0) 2024.05.11
3주차-K Nearest Neighbors  (0) 2024.05.11
2주차-Supervised Learning  (1) 2024.05.11