๐ŸŸก ๋ผ์˜ ํšŒ๊ท€๋ž€?

โ†’ ๋ผ์˜ ํšŒ๊ท€๋Š” ์„ ํ˜• ํšŒ๊ท€์˜ ๋˜ ๋‹ค๋ฅธ ๊ทœ์ œ๋œ ๋ฒ„์ „

๋ฆฟ์ง€ ํšŒ๊ท€์ฒ˜๋Ÿผ ๋น„์šฉ ํ•จ์ˆ˜์— ๊ทœ์ œํ•ญ์„ ๋”ํ•˜์ง€๋งŒ ๋ฆฟ์ง€ ํšŒ๊ท€์™€ ๋‹ค๋ฅด๊ฒŒ ๊ฐ€์ค‘์น˜ ๋ฒกํ„ฐ l1 ๋…ธ๋ฆ„์„ ์‚ฌ์šฉํ•œ๋‹ค.

๐ŸŸจ ๋ผ์˜๊ฐ€ ๋“ฑ์žฅํ•œ ์ด์œ 

๋ฆฟ์ง€ ํšŒ๊ท€๋Š” ๋ชจ๋“  p๊ฐœ์˜ ๋ณ€์ˆ˜๋ฅผ ํฌํ•จํ•˜๊ณ  ํŒจ๋„ํ‹ฐ ํ•ญ์€ ๋ชจ๋“  ๊ณ„์ˆ˜๊ฐ€ 0์ด ๋˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ˆ˜์ถ•ํ•œ๋‹ค. ๋žŒ๋‹ค๊ฐ€ ๋ฌดํ•œ์ด ์•„๋‹Œ ๊ฒฝ์šฐ์— ๊ณ„์ˆ˜๋ฅผ ์ •ํ™•ํžˆ ์ˆ˜์ถ•ํ•˜์ง€ ์•Š๋Š”๋‹ค. ๋ชจ๋ธ์˜ ์ •ํ™•๋„ ๊ด€์ ์—์„œ๋Š” ๋ฌธ์ œ๊ฐ€ ๋˜์ง€ ์•Š์ง€๋งŒ ๋ชจ๋ธ์„ ํ•ด์„ํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ ๋ฌธ์ œ์ ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— Lasso ๊ฐ€ ๋“ฑ์žฅํ•˜์˜€๋‹ค.

๋ผ์˜ ํšŒ๊ท€์˜ ๋น„์šฉ ํ•จ์ˆ˜

J(ฮธ)=MSE(ฮธ)+ฮฑi*=1โˆ‘*n*โˆฃ*ฮธiโˆฃ

-๋ผ์˜ ํšŒ๊ท€์˜ ์ค‘์š”ํ•œ ํŠน์ง•์€ ๋œ ์ค‘์š”ํ•œ ํŠน์„ฑ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ œ๊ฑฐํ•˜๋ ค๊ณ  ํ•˜๋Š” ๊ฒƒ ( ๊ฐ€์ค‘์น˜๊ฐ€ 0 ์ด ๋œ๋‹ค๋Š” ๋œป !)

img

โ†’ ๋ผ์˜ ๊ทœ์ œ๋ฅผ ์‚ฌ์šฉํ•œ ์„ ํ˜• ํšŒ๊ท€

img

โ†’ ๋ผ์˜ ๊ทœ์ œ๋ฅผ ์‚ฌ์šฉํ•œ ๋‹คํ•ญ ํšŒ๊ท€

a = 1e-07 ์˜ ๊ทธ๋ž˜ํ”„๋Š” 3์ฐจ ๋ฐฉ์ •์‹ ์ฒ˜๋Ÿผ ๋ณด์ธ๋‹ค. **- โœ… ๋ผ์˜ ํšŒ๊ท€๋Š” ์ž๋™์œผ๋กœ ํŠน์„ฑ ์„ ํƒ์„ ํ•˜๊ณ  ํฌ์†Œ ๋ชจ๋ธ์„ ๋งŒ๋“ ๋‹ค. **

๐Ÿค” ๋ผ์˜ ํšŒ๊ท€(Lasso Regression) ๊ณผ ๋ฆฟ์ง€ ํšŒ๊ท€(Ridge Regression) ์˜ ์ฐจ์ด์ ์„ ์•Œ์•„๋ณด์ž โ€ผ๏ธ

img

๐ŸŸจ ๋ผ์˜ ํšŒ๊ท€ : ์™ผ์ชฝ ์œ„ ๊ทธ๋ž˜ํ”„๊ฐ€ ๋ผ์˜์˜ ์†์‹ค์„ ๋‚˜ํƒ€๋‚ธ๋‹ค . ฮธ1=2,ฮธ2=0.5 ๊ฐ’์—์„œ ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์„ ์‹ค์‹œํ•˜๋ฉด ฮธ2 ๊ฐ€ ๋จผ์ € 0์— ๋„๋‹ฌํ•œ๋‹ค. ์˜ค๋ฅธ์ชฝ ์œ„ ๊ทธ๋ž˜ํ”„๋Š” ๋ผ์˜์˜ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์—ฌ๊ธฐ์„œ๋„ *ฮธ*2=0์œผ๋กœ ๋น ๋ฅด๊ฒŒ ์ค„์–ด๋“ค๊ณ  ๊ทธ ๋‹ค์Œ ์ถ•์„ ๋”ฐ๋ผ ์ง„๋™ํ•˜๋ฉฐ ์ „์—ญ ์ตœ์ ์ ์— ๋„๋‹ฌํ•œ๋‹ค.

๐ŸŸจ ๋ฆฟ์ง€ ํšŒ๊ท€: ์™ผ์ชฝ ์•„๋ž˜ ๊ทธ๋ž˜ํ”„๋Š” ๋ฆฟ์ง€์˜ ์†์‹ค์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์›์ ์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ์†์‹ค์ด ์ค„์–ด๋“œ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ค๋ฅธ์ชฝ ์•„๋ž˜ ๊ทธ๋ž˜ํ”„๋Š” ๋ฆฟ์ง€์˜ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. *ฮฑ* ๋ฅผ ์ฆ๊ฐ€์‹œํ‚ฌ์ˆ˜๋ก ์ตœ์ ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์›์ ์— ๋” ๊ฐ€๊นŒ์›Œ์ง„๋‹ค. (์ง„๋™์ด ์—†์Œ)

โœ”๏ธ ๋ผ์˜๋Š” ์ œ์•ฝ ์กฐ๊ฑด์ด ์ ˆ๋Œ“๊ฐ’ ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋งˆ๋ฆ„๋ชจ ๊ผด๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค. ๋ผ์˜ ํšŒ๊ท€์˜ ๊ฒฝ์šฐ ์ตœ์ ๊ฐ’์€ ๋ชจ์„œ๋ฆฌ ๋ถ€๋ถ„์—์„œ ๋‚˜ํƒ€๋‚  ํ™•๋ฅ ์ด ๋ฆฟ์ง€์— ๋น„ํ•ด ๋†’๊ธฐ ๋•Œ๋ฌธ์— ๋ช‡๋ช‡ ์œ ์˜๋ฏธํ•˜์ง€ ์•Š์€ ๋ณ€์ˆ˜๋“ค์— ๋Œ€ํ•ด ๊ณ„์ˆ˜๋ฅผ 0์— ๊ฐ€๊น๊ฒŒ (๋˜๋Š” 0) ์œผ๋กœ ์ถ”์ •ํ•ด feature selection์˜ ํšจ๊ณผ ๋ฅผ ๊ฐ€์ ธ์˜จ๋‹ค. ๋ผ์˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ํฌ๊ธฐ์— ๊ด€๊ณ„ ์—†์ด ๊ฐ™์€ ์ˆ˜์ค€์˜ reularizaton ์„ ์ ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ž‘์€ ๊ฐ’์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค์–ด ํ•ด๋‹น ๋ณ€์ˆ˜๋ฅผ ๋ชจ๋ธ์—์„œ ์‚ญ์ œํ•˜๊ณ , ๋”ฐ๋ผ์„œ ๋ชจ๋ธ์„ ๋‹จ์ˆœํ•˜๊ฒŒ ๋งŒ๋“ค์–ด์ฃผ๊ณ  ํ•ด์„์„ ์šฉ์ดํ•˜๊ฒŒ ํ•œ๋‹ค.

โœ”๏ธ ํ•˜์ง€๋งŒ ๋ฆฟ์ง€์˜ ๊ฒฝ์šฐ ์–ด๋А์ •๋„ ์ƒ๊ด€์„ฑ์„ ๊ฐ€์ง€๋Š” ๋ณ€์ˆ˜๋“ค์— ๋Œ€ํ•ด pulling ์ด ๋˜๋Š” ํšจ๊ณผ๋ฅผ ๋ณด์—ฌ์ค˜์„œ ๋ณ€์ˆ˜ ์„ ํƒ ๋ณด๋‹ค๋Š” ์ƒ๊ด€์„ฑ์ด ์žˆ๋Š” ๋ณ€์ˆ˜๋“ค์— ๋Œ€ํ•ด ์ ์ ˆํ•œ ๊ฐ€์ค‘์น˜ ๋ฐฐ๋ถ„์„ ํ•˜๊ฒŒ ๋œ๋‹ค. ๋”ฐ๋ผ์„œ ๋ฆฟ์ง€์˜ ๊ฒฝ์šฐ PCA ์™€ ๊ด€๋ จ์„ฑ์ด ์žˆ๋‹ค.

๐ŸŸ  Ridge ์™€ Lasso

Ridge Lasso
L2 - norm L1 - norm
๋ณ€์ˆ˜ ์„ ํƒ ๋ถˆ๊ฐ€๋Šฅ ๋ณ€์ˆ˜ ์„ ํƒ ๊ฐ€๋Šฅ
Closed form solution ์กด์žฌ ( ๋ฏธ๋ถ„์œผ๋กœ ๊ตฌํ•จ ) Closed form solution์ด ์กด์žฌํ•˜์ง€ ์•Š์Œ(numerical optimization ์ด์šฉ)
๋ณ€์ˆ˜ ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€ ์ƒํ™ฉ์—์„œ ์ข‹์€ ์˜ˆ์ธก ์„ฑ๋Šฅ ๋ณ€์ˆ˜ ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์„ ๋•Œ Ridge์— ๋น„ํ•ด ์—์ธก ์„ฑ๋Šฅ์ด ๋–จ์–ด์ง
ํฌ๊ธฐ๊ฐ€ ํฐ ๋ณ€์ˆ˜๋ฅผ ์šฐ์„ ์ ์œผ๋กœ ์ค„์ด๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Œ ย 

๐ŸŸ  ์‚ฌ์ดํ‚ท๋Ÿฐ์„ ์ด์šฉํ•œ Lasso ์ฝ”๋“œ

from sklearn.linear_model import Lasso
lasso_reg = Lasso(alpha = 0.1)
lasso_reg.fit(X,y)
lasso_reg.predict([[1.5]])

๐Ÿ’ก Lasso ๋Œ€์‹  SGDRegressor(penalty = โ€œl1โ€) ์„ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

์‚ฌ์ „ ๋ฐฐ๊ฒฝ ์ดํ•ด

ํ†ต๊ณ„ ๋ฐ์ดํ„ฐ ๋ถ„์„์— ์žˆ์–ด์„œ ๋ชจ๋ธ์˜ ๋‹จ์ˆœํ™”๋Š” ๋ชจ๋ธ ์ผ๋ฐ˜ํ™”๋ฅผ ์œ„ํ•ด ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค.

์ผ๋ฐ˜์ ์ธ ๋‹ค์ค‘์„ ํ˜•ํšŒ๊ท€์—์„œ๋Š”

img

  1. ๋…๋ฆฝ๋ณ€์ˆ˜ ๊ฐฏ์ˆ˜๊ฐ€ ํ‘œ๋ณธํฌ๊ธฐ์— ๋น„ํ•ด์„œ ์ง€๋‚˜์น˜๊ฒŒ ๋งŽ์„ ๊ฒฝ์šฐ ์ œ๋Œ€๋กœ๋œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๊ธฐ ์–ด๋ ต๋‹ค.

๋ถˆํ•„์š”ํ•œ ํšŒ๊ท€๊ณ„์ˆ˜๋Š” ๋ชจ๋ธ์˜ ์˜ˆ์ธก์„ฑ๋Šฅ์„ ์ €ํ•˜์‹œํ‚ค๊ธฐ ๋–„๋ฌธ

  1. ๋งŽ์€ ๋…๋ฆฝ๋ณ€์ˆ˜๊ฐ€ ์กด์žฌํ•  ๊ฒฝ์šฐ ๋‹ค์ค‘๊ณต์„ ์„ฑ์œผ๋กœ ์ธํ•ด ํšŒ๊ท€๊ณ„์ˆ˜์˜ ์˜ํ–ฅ๋ ฅ์ด ๊ณผ๋„ํ•˜๊ฒŒ ๋†’๊ฒŒ ์ธก์ •๋  ์ˆ˜ ์žˆ๋‹ค.

ํŒจ๋„ํ‹ฐ ํšŒ๊ท€๋ถ„์„ (Penalized Regression)

: ๋„ˆ๋ฌด ๋งŽ์€ ๋…๋ฆฝ๋ณ€์ˆ˜๋ฅผ ๊ฐ–๋Š” ๋ชจ๋ธ์— ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€๊ณผํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ธฐ์กด ์„ ํ˜•ํšŒ๊ท€์˜ ๊ณผ์ ํ•ฉ์„ ๋ฐฉ์ง€์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

ใ„ด๋ชจ๋ธ ์„ฑ๋Šฅ์— ํฌ๊ฒŒ ๊ธฐ์—ฌํ•˜์ง€ ๋ชปํ•˜๋Š” ๋ณ€์ˆ˜์˜ ์˜ํ–ฅ๋ ฅ์„ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ ์ถ•์†Œํ‚จ๋‹ค.

ใ„ด์ผ๋ฐ˜์ ์ธ ์„ ํ˜•ํšŒ๊ท€๋Š” MSE(์ž”์ฐจ์ œ๊ณฑํ•ฉ์ด ์ตœ์†Œ)์œผ๋กœ ๊ณ„์‚ฐํ•˜์ง€๋งŒ ํŒจ๋„ํ‹ฐ ํšŒ๊ท€๋ถ„์„์—๋Š” ์ œ๊ณฑํ•ฉ์— ํŒจ๋„ํ‹ฐ ํ•ญ์ด ๋ถ™์–ด

์ œ๊ณฑํ•ฉ๊ณผ ํŒจ๋„ํ‹ฐํ•ญ์˜ ํ•ฉ์ด ์ตœ์†Œ๊ฐ€ ๋˜๋Š” ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ์ถ”์ •ํ•œ๋‹ค.

ใ„ด๋Œ€ํ‘œ์ ์ธ ํŒจ๋„ํ‹ฐ ํšŒ๊ท€๋ถ„์„์œผ๋กœ๋Š” ๋ฆฟ์ง€ํšŒ๊ท€๋ถ„์„, ๋ผ์†ŒํšŒ๊ท€๋ถ„์„, ์ผ๋ž˜์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์ด ์žˆ๋‹ค.

๋ฆฟ์ง€ํšŒ๊ท€๋ถ„์„ (Ridge Regression)

: ๋ชจ๋ธ์˜ ์„ค๋ช…๋ ฅ์— ๊ธฐ์—ฌํ•˜์ง€ ๋ชปํ•˜๋Š” ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ํšŒ๊ท€๊ณ„์ˆ˜ ํฌ๊ธฐ๋ฅผ 0์— ๊ทผ์ ‘ํ•˜๋„๋ก ์ถ•์†Œ์‹œํ‚จ๋‹ค. (์ž‘์•„์ ธ๋„ 0์€ ๋˜์ง€ ์•Š์Œ)

img

L2-norm ์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ํŽ˜๋„ํ‹ฐํ•ญ์„ ํ†ตํ•ด ์ผ๋ฐ˜ ์„ ํ˜•ํšŒ๊ท€ ๋ชจ๋ธ์— ํŽ˜๋„ํ‹ฐ๋ฅผ ๋ถ€๊ณผํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ

ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ์ถ•์†Œ์‹œํ‚จ๋‹ค.

์‹ ์ดํ•ด

1) ๋ฒ ํƒ€

๊ฐ ํšŒ๊ท€๊ณ„์ˆ˜ ~ ์ด ๋ฒ ํƒ€(๊ฐ ํšŒ๊ท€๊ณ„์ˆ˜)๋ฅผ ์ œ๊ณฑํ•œ๋’ค ๋”ํ•œ ๊ฐ’์„ ๊ฐ๊ฐ€๊ฐ’๊ณผ ๊ณฑํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

2) ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹

๊ฐ๋งˆ ๊ฐ’์ด ์ปค์ง์— ๋”ฐ๋ผ ํšŒ๊ท€๊ณ„์ˆ˜๋Š” ์ž‘์•„์งˆ ์ˆ˜ ๋ฐ–์— ์—†๋‹ค.

or ๊ฐ๋งˆ ๊ฐ’์ด ์ž‘์•„์ง์— ๋”ฐ๋ผ ํšŒ๊ท€๊ณ„์ˆ˜๋Š” ์›๋ž˜ ์„ ํ˜•ํšŒ๊ท€ ์ฒ˜๋Ÿผ ๊ณ„์‚ฐํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ

์ฃผ์˜์‚ฌํ•ญ

๋ฆฟ์ง€ ํšŒ๊ท€๋ถ„์„์€ ๋…๋ฆฝ๋ณ€์ˆ˜ ์ฒ™๋„์— ํฌ๊ฒŒ ์˜ํ–ฅ์„ ๋ฐ›๋Š”๋‹ค. ํ‘œ์ค€์ ์ธ ์„ ํ˜•ํšŒ๊ท€ ๋ถ„์„๊ณผ ๋”์šฑ ์˜ํ–ฅ์„ ๋ฐ›๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ฏ€๋กœ,

๋ฆฟ์ง€ ํšŒ๊ท€๋ฅผ ์ ์šฉํ•˜๊ธฐ ์ „์— ๋ชจ๋“  ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ์ฒ™๋„๊ฐ€ ๋™์ผํ•˜๋„๋ก ํ‘œ์ค€ํ™”ํ•˜๋Š” ์ž‘์—…์ด ์„ ํ–‰๋˜์–ด์•ผ ํ•œ๋‹ค.

๋ฆฟ์ง€ ํšŒ๊ท€ ํŠน์ง•

> ๊ด€์ธก๊ฐฏ์ˆ˜ ๋ณด๋‹ค ๋…๋ฆฝ๋ณ€์ˆ˜๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ๋งŽ์„ ๊ฒฝ์šฐ, ์ผ๋ฐ˜ ํ‘œ์ค€ ์„ ํ˜•ํšŒ๊ท€๋ณด๋‹ค ๋ฆฟ์ง€ํšŒ๊ท€๊ฐ€ ๋”์šฑ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜

> ๋ฆฟ์ง€ ํšŒ๊ท€๋ถ„์„์€ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ 0์— ๊ฐ€๊น๋„๋ก ์ถ•์†Œ์‹œํ‚ค์ง€๋งŒ ์–ด๋–ค ํšŒ๊ท€๊ณ„์ˆ˜๋„ 0์œผ๋กœ ๋งŒ๋“ค์ง€๋Š” ์•Š๋Š”๋‹ค.

ใ„ด์ฆ‰, ์›๋ž˜ ๋ฐ์ดํ„ฐ์…‹์— ์žˆ๋Š” ๋ชจ๋“  ๋…๋ฆฝ๋ณ€์ˆ˜๊ฐ€ ๋ฆฟ์ง€ํšŒ๊ท€์—์„œ๋„ ๊ทธ๋Œ€๋กœ ์ ์šฉ๋œ๋‹ค๋Š” ๊ฒƒ์„ ๋งํ•œ๋‹ค.

ใ„ด๋”ฐ๋ผ์„œ ๋‹จ๊ณ„์„ ํƒ๋ฒ•์„ ํ†ตํ•ด ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜ํ•œ ๋…๋ฆฝ๋ณ€์ˆ˜๋งŒ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋Š” ์„ ํ˜•ํšŒ๊ท€์™€๋Š” ๋‹ฌ๋ฆฌ,

๋ฆฟ์ง€ ํšŒ๊ท€๋ถ„์„์€ ํšŒ๊ท€๋ชจ๋ธ์˜ ๋ชจ๋“  ๋…๋ฆฝ๋ณ€์ˆ˜๋ฅผ ๊ทธ๋Œ€๋กœ ๋ณด์กดํ•˜๊ณ  ์žˆ๋‹ค. ( ๋˜ ๋ฐ˜๋Œ€๋กœ ๋งํ•˜๋ฉด, ๋ณ€์ˆ˜์„ ํƒ๋ฒ• ์ œ๊ณต ๋ถˆ๊ฐ€)

๋ผ์˜ ํšŒ๊ท€๋ถ„์„ (Lasso Regression)

: ๋ผ์˜ํšŒ๊ท€๋ชจ๋ธ์€ ๋ฆฟ์ง€ํšŒ๊ท€๋ชจ๋ธ๊ณผ ๋‹ค๋ฅด๊ฒŒ ์„ค๋ช…๋ ฅ์— ๊ธฐ์—ฌํ•˜์ง€ ๋ชปํ•˜๋Š” ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ 0์œผ๋กœ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

ใ„ด ๋ฆฟ์ง€ํšŒ๊ท€์™€ ๋‹ฌ๋ฆฌ ํšŒ๊ท€๊ณ„์ˆ˜๊ฐ€ 0์ด ๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ณ€์ˆ˜์„ ํƒ์„ ํ†ตํ•ด ๋” ๊ฐ„๋‹จํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

img์‹1_๋ฒ ํƒ€(ํšŒ๊ท€๊ณ„์ˆ˜ ๋ณด๊ธฐ ํŽธํ•˜๊ฒŒ w๋กœ ํ‘œ์‹œ)

img

๋ผ์˜ํšŒ๊ท€์—์„œ๋Š” L1-norm ํŒจ๋„ํ‹ฐํ•ญ์œผ๋กœ ํšŒ๊ท€๋ชจ๋ธ์— ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€๊ณผํ•จ์œผ๋กœ์จ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ์ถ•์†Œ์‹œํ‚จ๋‹ค.

์‹ ์ดํ•ด

๋ฒ ํƒ€ : ๊ฐ ํšŒ๊ท€๊ณ„์ˆ˜~ ๊ฐ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ์ ˆ๋Œ€๊ฐ’ ํ•˜์—ฌ ๊ณ„์‚ฐํ•˜์—ฌ ์ถ”์ •ํ•œ๋‹ค.

๊ฐ๋งˆ : ๋ฆฟ์ง€ํšŒ๊ท€์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํŒจ๋„ํ‹ฐ์˜ ํฌ๊ธฐ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ

๋ฆฟ์ง€์™€์˜ ์ฐจ์ด

๋ผ์˜ํšŒ๊ท€๋ชจ๋ธ์—์„œ ํŒจ๋„ํ‹ฐํ•ญ์€ ๋ชจ๋ธ์— ๋Œ€ํ•œ ๊ธฐ์—ฌ๋„๊ฐ€ ๋‚ฎ์€ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

ใ„ด์ด๋Š” ํ•ด๋‹น ๋ณ€์ˆ˜๊ฐ€ ๋ชจ๋ธ์—์„œ ์ œ๊ฑฐ๋จ์„ ์˜๋ฏธํ•œ๋‹ค.

ใ„ด๋”ฐ๋ผ์„œ ๋ผ์˜ํšŒ๊ท€๋ชจ๋ธ์„ ์ด์šฉํ•˜๋ฉด ๋ณ€์ˆ˜์„ ํƒ์„ ํ†ตํ•ด ์„ค๋ช…๋ ฅ์ด ์šฐ์ˆ˜ํ•œ ๋…๋ฆฝ๋ณ€์ˆ˜๋งŒ์œผ๋กœ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•ด ๋‹จ์ˆœํ™”์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค. (๋ชจ๋ธ์ด ๋” ๊ฐ„๋ช…ํ•ด์ง์— ๋”ฐ๋ผ ํ•ด์„๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•œ๋‹ค๋Š” ์žฅ์ ์„ ๊ฐ–๋Š”๋‹ค)

> ๋‹จ, ์ด ํŠน์žฅ์ ์ด ๋ผ์˜ ํšŒ๊ท€๋ชจ๋ธ์ด ๋ฆฟ์ง€ ํšŒ๊ท€๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค.

ใ„ด ๋ผ์˜ ํšŒ๊ท€๋ถ„์„์—์„œ๋Š” ์ผ๋ถ€ ๋…๋ฆฝ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๊ธฐ ๋–„๋ฌธ์—, ์ผ๋ถ€ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ์„ค๋ช…๋ ฅ์ด ํฌ๊ณ , ๋‚˜๋จธ์ง€ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ์„ค๋ช…๋ณ€์ˆ˜๊ฐ€ ์„ค๋ช…๋ ฅ์ด ๋‚ฎ์„ ๋•Œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

ใ„ด ๋ฐ˜๋ฉด, ๋ฆฟ์ง€ํšŒ๊ท€๋Š” ๋งŽ์€ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ์„ ํ˜•๊ฒฐํ•ฉ์œผ๋กœ ๋ชจ๋ธ์„ ์ƒ์„ฑํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด ๋…๋ฆฝ๋ณ€์ˆ˜๋“ค์˜ ์„ค๋ช…๋ ฅ์ด ์„œ๋กœ ์ฐจ์ด๊ฐ€ ํฌ๊ฒŒ ๋‚˜์ง€ ์•Š์„์ˆ˜๋ก ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

ใ„ด ๊ฒฐ๋ก ์ ์œผ๋กœ ๋ชจ๋‘ ๋‹ค ์‚ฌ์šฉํ•ด์„œ ํ‰๊ฐ€ํ•ด์•ผ ํ•œ๋‹ค.

์ผ๋ž˜์Šคํ‹ฑํšŒ๊ท€๋ถ„์„

: ๋ฆฟ์ง€์™€ ๋ผ์˜์˜ ๊ฒฐํ•ฉ์ด๋‹ค. ์ฆ‰ L1-norm ๊ณผ L2-norm์„ ๋ชจ๋‘ ์ด์šฉํ•˜์—ฌ ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€๊ณผํ•˜์—ฌ ํšŒ๊ท€๋ชจ๋ธ์„ ์ƒ์„ฑํ•œ๋‹ค.

ใ„ด ๋ฆฟ์ง€ ํšŒ๊ท€๋ชจ๋ธ์ฒ˜๋Ÿผ ๋ชจ๋ธ์„ ์ถฉ๋ถ„ํ•˜๊ฒŒ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ•˜๋Š” ์ผ๋ถ€ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ํšŒ๊ท€๊ณ„์ˆ˜ ํฌ๊ธฐ๋ฅผ ์ถ•์†Œํ•  ์ˆ˜ ์žˆ๊ณ ,

๋ž์˜ ํšŒ๊ท€๋ชจ๋ธ์ฒ˜๋Ÿผ ๋ชจ๋ธ์„ ์ถฉ๋ถ„ํ•˜๊ฒŒ ์„ค๋ช…ํ•˜๊ธฐ ๋ชปํ•˜๋Š” ์ผ๋ถ€ ๋…๋ฆฝ๋ณ€์ˆ˜์œผ ํšŒ๊ท€๊ณ„์ˆ˜๋ฅผ ๊ฐ•์ œ๋กœ 0์œผ๋กœ ํ• ๋‹นํ•˜์—ฌ

ํŠน์ • ๋…๋ฆฝ๋ณ€์ˆ˜๋ฅผ ๋ชจ๋ธ์—์„œ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋‹ค.

img

์‹ ์ดํ•ด

์•ŒํŒŒ : ์•ŒํŒŒ๊ฐ€ ์ž‘์„ ์ˆ˜๋ก ๋ฆฟ์ง€ ํšŒ๊ท€๋ชจ๋ธ(L1-norm)์ด ๋” ๊ฐ•ํ•˜๊ฒŒ ์ž‘์šฉํ•˜๊ณ , ํด์ˆ˜๋ก ๋ผ์˜ ํšŒ๊ท€๋ชจ๋ธ(L2-norm)์ด ๋” ํฌ๊ฒŒ ์ž‘์šฉ

๊ฐ๋งˆ : ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํŒจ๋„ํ‹ฐํ•ญ(L1-norm, L2-norm)์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹

source : https://velog.io/@jochedda/%EB%A8%B8%EC%8B%A0-%EB%9F%AC%EB%8B%9D%EB%9D%BC%EC%8F%98-%ED%9A%8C%EA%B7%80Lasso-Regression,

https://challenge.tistory.com/30