๊ฐ์ค์น์ ์ ํํ๊ท ์ ๋ฆฌ
๊ฐ์ค์น(weight)๋
ํน์ ๋ฐ์ดํฐ๋ ์์์ ์ค์๋๋ฅผ ๋ํ๋ด๊ธฐ ์ํด
์ฌ์ฉ๋๋ ๊ฐ.
์ฃผ๋ก ๋ค์๊ณผ ๊ฐ์ ์ํฉ์์ ์ฌ์ฉ๋๋ค.
1. ํต๊ณ ๋ฐ ์ํ
- ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ฑฐ๋ ๊ณ์ฐํ ๋, ํน์ ํญ๋ชฉ์ด ์ ์ฒด ๊ณ์ฐ์์ ๋ ์ค์ํ ์ญํ ์ ํ๋๋ก ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
- ์: ํ๊ท ์ ๊ณ์ฐํ ๋, ๊ฐ ๋ฐ์ดํฐ์ ๋์ผํ ๋น์ค์ ์ฃผ์ง ์๊ณ ์ค์ํ ๋ฐ์ดํฐ์๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ๊ณ์ฐํ๋ ๊ฐ์คํ๊ท .
2. ๋จธ์ ๋ฌ๋ ๋ฐ ์ธ๊ณต์ง๋ฅ
- ๋ชจ๋ธ์ด ํ์ตํ ๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ค์๋๋ฅผ ์กฐ์ ํ๋๋ฐ ์ฌ์ฉ.
- ์: ์ ๊ฒฝ๋ง(Neural Network)์์ ๊ฐ ์ฐ๊ฒฐ(๋
ธ๋ ๊ฐ์ ์ฐ๊ฒฐ)์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง๋ฉฐ, ํ์ต ๊ณผ์ ์์ ์ด ๊ฐ์ด ์กฐ์ ๋๋ค. ๊ฐ์ค์น๊ฐ
ํด ์๋ก ํด๋น ์ ๋ ฅ์ด ๊ฒฐ๊ณผ์ ๋ ํฐ ์ํฅ์ ๋ฏธ์น๋ค.
3. ์์ฌ๊ฒฐ์ ๋ฐ ์ต์ ํ ๋ฌธ์
- ์ฌ๋ฌ ์ต์ ์ค์์ ์ ํํ๊ฑฐ๋ ์ต์ ํํ ๋, ๊ฐ๊ฐ์ ๊ธฐ์ค์ ๋ฐ๋ผ ์ค์๋๋ฅผ ๋ํ๋ด๊ธฐ ์ํด ๊ฐ์ค์น๋ฅผ ์ฌ์ฉํ๋ค.
- ์: ๋ค์ค ๊ธฐ์ค ์์ฌ๊ฒฐ์ ์์ ํน์ ๊ธฐ์ค์ด ๋ ์ค์ํ๋ค๋ฉด ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
์ ํํ๊ท(Linear Regression)๋ ๋ ๋ฆฝ ๋ณ์์ ์ข ์ ๋ณ์ ์ฌ์ด์
์ ํ์ ์ธ ๊ด๊ณ๋ฅผ ๋ชจ๋ธ๋ง ํ๋ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํต๊ณ ๋ฐ ๋จธ์ ๋ฌ๋
๊ธฐ๋ฒ ์ค ํ๋.
๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํน์ ๋ณ์(์ข ์ ๋ณ์)๋ฅผ ์์ธกํ๊ฑฐ๋ ์ค๋ช ํ๋๋ฐ
์ฌ์ฉ๋๋ค.
1. ์ ํํ๊ท์ ๋ชฉํ
- ์ ํํ๊ท์ ๋ชฉํ๋ ๋ฐ์ดํฐ์ ๋ถํฌ์ ๊ฐ์ฅ ์ ๋ง๋ ์ง์ ์ ์ฐพ๋ ๊ฒ์ด๋ค.
- ์ด๋ฅผ ์ํด ๊ฐ์ค์น์ ์ ํธ์ ํ์ต ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ์ฌ ์ต์ ํํ๋ค.
2. ์ข ๋ฅ
1. ๋จ์ ์ ํํ๊ท(Simple Linear regression):
- ๋ ๋ฆฝ ๋ณ์๊ฐ ํ๋์ธ ๊ฒฝ์ฐ.
- ์: ๊ด๊ณ ๋น(x)์ ๋งค์ถ(y)๊ฐ์ ๊ด๊ณ๋ฅผ ๋ชจ๋ธ๋ง.
2. ๋ค์ค ์ ํํ๊ท(Multiple Linear Regression):
- ๋ ๋ฆฝ ๋ณ์๊ฐ ์ฌ๋ฌ ๊ฐ์ธ ๊ฒฝ์ฐ.
- ์: ์ฌ๋ฌ ์์ธ(์จ๋, ์ต๋, ์๊ฐ ๋ฑ)์ ์ฌ์ฉํด ์ ๋ ฅ ์๋น๋ ์์ธก.
3. ํ์ฉ ์์
- ์ง๊ฐ ์์ธก(ํ์, ๋ฐฉ ๊ฐ์, ์์น ๋ฑ์ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ํจ).
- ํ๋งค๋ ์์ธก(๊ด๊ณ ๋น, ๊ณ์ , ๊ฐ๊ฒฉ ๋ฑ์ ๊ธฐ์ค).
- ์ฃผ์ ์์ฅ ๋ถ์(๊ฑฐ๋๋, ๋ด์ค, ๊ณผ๊ฑฐ ๊ฐ๊ฒฉ ๋ฑ์ ํ์ฉ).
4. Python์ผ๋ก ๊ตฌํ(์์)
from sklearn.linear_model import LinearRegression
import numpy as np
# ์์ ๋ฐ์ดํฐ
X = np.array([[1], [2], [3], [4], [5]]) # ๋
๋ฆฝ ๋ณ์
y = np.array([2, 4, 6, 8, 10]) # ์ข
์ ๋ณ์
# ๋ชจ๋ธ ์์ฑ ๋ฐ ํ์ต
model = LinearRegression()
model.fit(X, y)
# ์์ธก
y_pred = model.predict(X)
# ๊ฒฐ๊ณผ ์ถ๋ ฅ
print("๊ฐ์ค์น (w):", model.coef_)
print("์ ํธ (b):", model.intercept_)
print("์์ธก๊ฐ:", y_pred)
5. ์ฅ์ ๊ณผ ํ๊ณ
- ์ฅ์
- ๋จ์ํ๊ณ ์ดํดํ๊ธฐ ์ฌ์.
- ๊ณ์ฐ์ด ๋น ๋ฅด๊ณ ํด์์ด ์ฌ์.
- ํ๊ณ
- ๋ ๋ฆฝ ๋ณ์์ ์ข ์ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ๊ฐ ์ ํ์ ์ด์ด์ผ ํ๋ค.
- ์ด์์น(outlier)์ ๋ฏผ๊ฐํจ.
- ๋ ๋ฆฝ ๋ณ์ ๊ฐ ๋ค์ค ๊ณต์ ์ฑ ๋ฌธ์ ๊ฐ ์์ ๊ฒฝ์ฐ ์ ํ๋๊ฐ ์ ํ๋จ.
6. ํ์ฅ ๊ฐ๋
- ๋คํญ ํ๊ท(Polynomial Regression): ์ ํ ํ๊ท๋ฅผ ํ์ฅํ์ฌ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ๋ง.
- ๋ฆฟ์ง ํ๊ท(Ridge Regression), ๋ผ์ ํ๊ท(Lasso Regression): ์ ๊ทํ๋ฅผ ์ถ๊ฐํ์ฌ ๊ณผ์ ํฉ(overfitting)
์ ๋ฐฉ์งํ๋ค.
'[๋ด๋ฐฐ์บ ] ๋ณธ ์บ ํ (24.11.25 ~ 25.03.01)๐๐ปโโ๏ธโ > ๊ฐ๋ ์ ๋ฆฌ๐' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[241212] ํ์ด์ฌ VSCode ๋ก ๊ฐ์ํ๊ฒฝ ์ค์ ๋ฐ ๋ณ์ ๋ณต์ต (4) | 2024.12.12 |
---|---|
[241211] git ๋ช ๋ น์ด์ ๊ฐ๋ ํน๊ฐ ๋ด์ฉ ์ ๋ฆฌ (1) | 2024.12.11 |
[241206] MarkDown .md ํ์ผ ์์ฑํ๋ ๋ฒ (2) | 2024.12.06 |
[241203] ๊ฒฐ์ธก์น์ ์ด์์น (3) | 2024.12.03 |
[241128] ํ๋ค์ค์ ๋ํ์ด ์ ๋ฆฌ (2) | 2024.11.28 |