๐ ๋ชฉ์ฐจ
1. Linear Regression
2. Decision Theory
3. Bias-Variance Trade-off
๐ง preview: Linear Regression
Linear Regression์ ๊ธฐ๋ณธ๊ฐ๋ ์ค ์ผ๋ถ๋ฅผ ์์๋ณด๊ณ ์ ํ๋ค.
์ด์ ์ฅ์์ ๋คํญ์๊ณก์ fitting๋งฅ๋ฝ์์ ๊ฐ๋จํ ๋ค๋ค์๋ค.
Linear Regression๋ชจ๋ธ์ ํ์ต๊ฐ๋ฅํ parameter๋ฅผ ๊ฐ๋ Single Layer ์ ๊ฒฝ๋ง์ผ๋ก
๋น๋ก ๋จ์ผ ๋ ์ด์ด ์ ๊ฒฝ๋ง์ด ์ค์ ์์ฉ์์๋ ๋งค์ฐ ์ ํ์ ์ผ์ง๋ผ๋,
์ด๋ค์ ๊ฐ๋จํ ๋ถ์์ ํน์ฑ์ ๊ฐ๊ธฐ์ ํ์ ์ฅ์์ ์ฌ์ธต์ ๊ฒฝ๋ง์ ๋ํ ๋ ผ์๋ฅผ ์ํด ํต์ฌ ๊ฐ๋ ์ ์์๋ณด์.
1. Linear Regression
prev.
ํ๊ท์ ๋ชฉํ๋ D-์ฐจ์ ๋ฒกํฐ x์ ๊ฐ์ด ์ฃผ์ด์ก์ ๋ ํ๋ ์ด์์ ์ฐ์์ ์ธ ๋ชฉํ ๋ณ์ t์ ๊ฐ์ ์์ธกํ๋ ๊ฒ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก๋ N๊ฐ์ ๊ด์ธก์น {xn}, ์ฌ๊ธฐ์ n = 1, . . . , N ๋ฐ ํด๋นํ๋ ๋ชฉํ ๊ฐ {tn}์ผ๋ก ์ด๋ฃจ์ด์ง ๊ต์ก ๋ฐ์ดํฐ ์ธํธ๊ฐ ์ฃผ์ด์ง๋ฉฐ, ๋ชฉํ๋ x์ ์๋ก์ด ๊ฐ์ ๋ํ t์ ๊ฐ์ ์์ธกํ๋ ๊ฒ์ ๋๋ค.
์ด๋ฅผ ์ํด ํ๋ จ ๋ฐ์ดํฐ์์ ํ์ตํ ์ ์๋ ๋งค๊ฐ๋ณ์ ๋ฒกํฐ w๋ฅผ ๋ํ๋ด๋ ํจ์ y(x, w)๋ฅผ ์ ์ํฉ๋๋ค. ํ๊ท์ ๋ํ ๊ฐ์ฅ ๊ฐ๋จํ ๋ชจ๋ธ์ ์ ๋ ฅ ๋ณ์๋ค์ ์ ํ ์กฐํฉ์ ํฌํจํ๋ ๊ฒ์ ๋๋ค: y(x, w) = w0 + w1x1 + ... + wDxD (4.1), ์ฌ๊ธฐ์ x = (x1, . . . , x1)T์ ๋๋ค.
๋๋ก๋ ์ด ํํ์ ๋ชจ๋ธ์ ํน๋ณํ ์ ํ ํ๊ท๋ผ๊ณ ํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ์ฃผ์ ํน์ฑ์ w0, ..., wD ๋งค๊ฐ๋ณ์์ ์ ํ ํจ์์์ ๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ ๋ํ ์ ๋ ฅ ๋ณ์ xi์ ์ ํ ํจ์์ด๊ธฐ๋ ํ๋ฉฐ, ์ด๋ ๋ชจ๋ธ์ ์ค์ํ ์ ํ์ ๋ถ์ฌํฉ๋๋ค.
1.1 Bias Functions
์ฐ๋ฆฌ๋ (4.1)๋ก ์ ์๋ ๋ชจ๋ธ ํด๋์ค๋ฅผ ํ์ฅํจ์ผ๋ก์จ ์ ๋ ฅ ๋ณ์์ ๊ณ ์ ๋น์ ํ ํจ์์ ์ ํ ๊ฒฐํฉ์ ๊ณ ๋ คํ ์ ์์ต๋๋ค. ์ด๋ ๋ค์๊ณผ ๊ฐ์ ํํ์ ๊ฒ์ ๋๋ค. (4.2) ์ฌ๊ธฐ์ φj (x)๋ ๊ธฐ์ ํจ์๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค. ์ง์ j์ ์ต๋๊ฐ์ M - 1๋ก ํ์ํ๋ฉด์ด ๋ชจ๋ธ์ ์ด ๋งค๊ฐ ๋ณ์ ์๋ M์ด ๋ ๊ฒ์ ๋๋ค. ๋งค๊ฐ ๋ณ์ w0๋ ๋ฐ์ดํฐ์์ ์์์ ๊ณ ์ ์คํ์ ์ ํ์ฉํ๋ฉฐ ๋๋ก๋ ํธํฅ ๋งค๊ฐ ๋ณ์๋ผ๊ณ ๋ ํฉ๋๋ค (ํต๊ณ์ ์๋ฏธ์ ํธํฅ๊ณผ ํผ๋ํด์๋ ์ ๋จ). ์ข ์ข ํธ์์ ๊ฐ์ด φ0(x) = 1์ธ ์ถ๊ฐ์ ์ธ ๋๋ฏธ ๊ธฐ์ ํจ์๋ฅผ ์ ์ํ์ฌ (4.2)๊ฐ (4.3)์ด ๋๋๋ก ํ ์ ์์ต๋๋ค. ์ฌ๊ธฐ์ w = (w0, ..., wM-1)T ๋ฐ φ = (φ0, ..., φM-1)T์ ๋๋ค. ์ฐ๋ฆฌ๋ ๋ชจ๋ธ (4.3)์ Figure 4.1์ ๋ํ๋ธ ๊ฒ์ฒ๋ผ ์ ๊ฒฝ๋ง ๋ค์ด์ด๊ทธ๋จ์ ์ฌ์ฉํ์ฌ ํํํ ์ ์์ต๋๋ค. ๋น์ ํ ๊ธฐ์ ํจ์๋ฅผ ์ฌ์ฉํจ์ผ๋ก์จ ํจ์ y(x, w)๊ฐ ์ ๋ ฅ ๋ฒกํฐ x์ ๋น์ ํ ํจ์๊ฐ ๋ ์ ์๋๋ก ํ์ฉํฉ๋๋ค. ๊ทธ๋ฌ๋ (4.2) ํํ์ ํจ์๋ w์ ๋ํด ์ ํ์ด๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค. ์ด ๋งค๊ฐ ๋ณ์์ ์ ํ์ฑ์ ์ด๋ฌํ ๋ชจ๋ธ ํด๋์ค์ ๋ถ์์ ํฌ๊ฒ ๋จ์ํ์ํค๋ ์ญํ ์ ํฉ๋๋ค. ๊ทธ๋ฌ๋ ์ด๊ฒ์ ๋ช ๊ฐ์ง ์ค์ํ ์ ํ๋ ์ผ๊ธฐํฉ๋๋ค. ๋ฅ ๋ฌ๋์ ์ถํ ์ด์ ์ ๋จธ์ ๋ฌ๋์์๋ ์ ๋ ฅ ๋ณ์ x์ ๊ณ ์ ๋ ์ ์ฒ๋ฆฌ ๋๋ ํน์ฑ ์ถ์ถ์ด๋ผ๊ณ ๋ ํ๋ {φj (x)} ๊ธฐ์ ํจ์ ์ธํธ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์ผ๋ฐ์ ์ด์์ต๋๋ค. ๋ชฉํ๋ ๊ฒฐ๊ณผ ํ์ต ์์ ์ ๊ฐ๋จํ ๋คํธ์ํฌ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ํด๊ฒฐํ ์ ์๋ ์ถฉ๋ถํ ๊ฐ๋ ฅํ ๊ธฐ์ ํจ์ ์ธํธ๋ฅผ ์ ํํ๋ ๊ฒ์ด์์ต๋๋ค. ๋ถํํ๋ ๊ฐ๋จํ ์์ฉ ํ๋ก๊ทธ๋จ ์ด์ธ์ ๊ฒ์๋ ์ ํฉํ ๊ธฐ์ ํจ์๋ฅผ ์๋์ผ๋ก ๋ง๋๋ ๊ฒ์ ๋งค์ฐ ์ด๋ ค์ ์ต๋๋ค. ๋ฅ ๋ฌ๋์ ๋ฐ์ดํฐ ์งํฉ ์์ฒด์์ ๋ฐ์ดํฐ์ ํ์ํ ๋น์ ํ ๋ณํ์ ํ์ตํจ์ผ๋ก์จ ์ด ๋ฌธ์ ๋ฅผ ํผํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฏธ ๋คํญ์์ ์ฌ์ฉํ ๊ณก์ ํผํ ์ ํตํด ํ๊ท ๋ฌธ์ ์ ์๋ฅผ ๋ง๋ฌ์ต๋๋ค. ๋คํญ์ ํจ์ (1.1)์ x๊ฐ ๋จ์ผ ์ ๋ ฅ ๋ณ์์ด๊ณ ๊ธฐ์ ํจ์๊ฐ φj (x) = xj๋ก ์ ์๋๋ ๊ฒฝ์ฐ (4.3)์ ํํ๋ก ํํ๋ ์ ์์ต๋๋ค. ๊ธฐ์ ํจ์์ ์ฌ๋ฌ ๊ฐ๋ฅํ ์ ํ์ง๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด (4.4) ์ฌ๊ธฐ์ μj๋ ์ ๋ ฅ ๊ณต๊ฐ์์ ๊ธฐ์ ํจ์์ ์์น๋ฅผ ์ง๋ฐฐํ๊ณ ๋งค๊ฐ ๋ณ์ s๋ ๊ณต๊ฐ์ ๊ท๋ชจ๋ฅผ ์ง๋ฐฐํฉ๋๋ค. ์ด๋ฌํ ๊ฒ๋ค์ ์ผ๋ฐ์ ์ผ๋ก '๊ฐ์ฐ์์' ๊ธฐ์ ํจ์๋ผ๊ณ ๋ถ๋ฆฌ์ง๋ง ํ๋ฅ ์ ํด์์ ๊ฐ์ถ์ด์ผ ํ๋ ๊ฒ์ ์๋๋๋ค. ํนํ ์ ๊ทํ ๊ณ์๋ ์ค์ํ์ง ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ์ ํจ์๋ ํ์ต ๊ฐ๋ฅํ ๋งค๊ฐ ๋ณ์ wj์ ์ํด ๊ณฑํด์ง๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ ๋ค๋ฅธ ๊ฐ๋ฅํ ๊ธฐ์ ํจ์ ์ ํ์ (4.5)์ ๊ฐ์ ์๊ทธ๋ชจ์ด๋ ๊ธฐ์ ํจ์์ ๋๋ค. ์ฌ๊ธฐ์ σ(a)๋ (4.6)์ผ๋ก ์ ์๋ ๋ก์ง์คํฑ ์๊ทธ๋ชจ์ด๋ ํจ์์ ๋๋ค. ๋๋ฑํ๊ฒ ๋ก์ง์คํฑ ์๊ทธ๋ชจ์ด๋์ ๊ด๋ จ์ด ์๋ ํ์ ํธ ๊ธฐ์ ํจ์๋ฅผ ์ฌ์ฉํ ์๋ ์์ต๋๋ค. ์๋ํ๋ฉด tanh(a) = 2σ(2a) - 1์ด๊ธฐ ๋๋ฌธ์ ๋ก์ง์คํฑ ์๊ทธ๋ชจ์ด๋ ํจ์์ ์ผ๋ฐ์ ์ธ ์ ํ ์กฐํฉ์ ์ ๋ ฅ-์ถ๋ ฅ ํจ์์ ๋์ผํ ํด๋์ค๋ฅผ ๋ํ๋ผ ์ ์๊ธฐ ๋๋ฌธ์ ๋๋ค. Figure 4.2์์ ์ด๋ฌํ ๊ธฐ์ ํจ์์ ๋ค์ํ ์ ํ์ง๊ฐ ์ค๋ช ๋์ด ์์ต๋๋ค. ๋ ๋ค๋ฅธ ๊ฐ๋ฅํ ๊ธฐ์ ํจ์ ์ ํ์ ์ผ๊ฐ ํจ์์ ํ์ฅ์ธ ํธ๋ฆฌ์ ๊ธฐ์ ์ ๋๋ค. ๊ฐ ๊ธฐ์ ํจ์๋ ํน์ ์ฃผํ์๋ฅผ ๋ํ๋ด๋ฉฐ ๋ฌดํํ ๊ณต๊ฐ ๋ฒ์๋ฅผ ๊ฐ์ง๋๋ค. ๋ฐ๋ฉด์ ์ ๋ ฅ ๊ณต๊ฐ์ ์ ํํ ์์ญ์ ๊ตญํ๋ ๊ธฐ์ ํจ์๋ ๋ค์ํ ๊ณต๊ฐ ์ฃผํ์๋ก ์ด๋ฃจ์ด์ ธ์ผ ํฉ๋๋ค. ์ ํธ ์ฒ๋ฆฌ ์์ฉ์์๋ ๊ณต๊ฐ๊ณผ ์ฃผํ์ ๋ชจ๋์ ๊ตญํ๋ ๊ธฐ์ ํจ์๋ฅผ ๊ณ ๋ คํ๋ ๊ฒ์ด ํํ ์์ผ๋ฉฐ ์ด๋ ์จ์ด๋ธ๋ฆฟ (Wavelets)์ด๋ผ๋ ํจ์ ํด๋์ค๋ก ์ด์ด์ง๋๋ค(Ogden, 1997; Mallat, 1999; Vidakovic, 1999). ์ด๋ค์ ๋ํ ๋จ์ํ๋ฅผ ์ํด ์ํธ ์ง๊ต๋ก ์ ์๋ฉ๋๋ค. ์จ์ด๋ธ๋ฆฟ์ ์ ๋ ฅ ๊ฐ์ด ์๊ฐ ์์์ ์ฐ์์ ์ธ ์๊ฐ ์ ์ด๊ฑฐ๋ ์ด๋ฏธ์ง์ ํฝ์ ๊ณผ ๊ฐ์ ์ ๊ท ๊ฒฉ์ ์์ ์๋ ๊ฒฝ์ฐ์ ๊ฐ์ฅ ์ ํฉํฉ๋๋ค. ๊ทธ๋ฌ๋ ์ด ์ฅ์ ๋๋ถ๋ถ์ ํ ๋ก ์ ๊ธฐ์ ํจ์ ์ธํธ์ ์ ํ๊ณผ ๊ด๋ จ์ด ์์ผ๋ฉฐ, ํน๋ณํ ๊ธฐ์ ํจ์ ํํ๋ฅผ ์ง์ ํ์ง ์๊ฒ ์ต๋๋ค. ์์น์ ์ค๋ช ์ ์ํ ๊ฒ์ ์ ์ธํ๊ณ ํ๊ธฐ๋ฒ์ ๊ฐ๋จํ๊ฒ ์ ์งํ๊ธฐ ์ํด ์ฌ๊ธฐ์์๋ ๋จ์ผ ๋์ ๋ณ์ t์ ๊ฒฝ์ฐ์ ์ค์ ์ ๋ ๊ฒ์ ๋๋ค. ๊ทธ๋ฌ๋ ๊ฐ๋จํ ์ฌ๋ฌ ๋์ ๋ณ์๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐ ํ์ํ ์์ ์ฌํญ์ ๊ฐ๋ตํ ์๊ฐํ ๊ฒ์ ๋๋ค.
1.2 Likelihood Function
์ฐ๋ฆฌ๋ ๋ฐ์ดํฐ์ ๋คํญ ํจ์๋ฅผ ๋ง์ถ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ๊ณฑํฉ ์ค์ฐจ ํจ์๋ฅผ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ์ผ๋ฉฐ, ๋ํ ์ด ์ค์ฐจ ํจ์๋ฅผ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ ๋ชจ๋ธ์ ๊ฐ์ ํ ์ต๋ ์ฐ๋ ํด๋ฒ์ผ๋ก ๋์ถํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์์ต๋๋ค. ์ด์ ์ด ํ ๋ก ์ผ๋ก ๋์๊ฐ ์ต์ ์ ๊ณฑ ๋ฐฉ๋ฒ๊ณผ ์ต๋ ์ฐ๋์์ ๊ด๊ณ๋ฅผ ๋ ์์ธํ ์ดํด๋ณด๊ฒ ์ต๋๋ค. ์ด์ ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ๋์ ๋ณ์ t๊ฐ ๊ฒฐ์ ๋ก ์ ํจ์ y(x, w)์ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ๊ฐ ์ฒจ๊ฐ๋ ํํ๋ก ์ฃผ์ด์ง๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. (4.7)์ด๊ณ , ์ฌ๊ธฐ์ ε๋ ํ๊ท ์ด 0์ด๊ณ ๋ถ์ฐ์ด σ2์ธ ๊ฐ์ฐ์์ ๋๋ค ๋ณ์์ ๋๋ค. ๋ฐ๋ผ์ (4.8)๋ก ์ธ ์ ์์ต๋๋ค. ์ด์ ์ ๋ ฅ๊ฐ X = {x1, ..., x1}๊ณผ ํด๋นํ๋ ๋์ ๊ฐ t1 ..., t1์ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๊ณ ๋ คํด ๋ด ์๋ค. ๋์ ๋ณ์ {tn}์ t๋ก ๋ํ๋ด๋๋ฐ, ์ฌ๊ธฐ์ ์์ฒด๋ฅผ ์ฌ์ฉํ์ฌ ๋จ์ผ ๋ค๋ณ๋ ๋์์ ๋จ์ผ ๊ด์ธก๊ฐ๊ณผ ๊ตฌ๋ณํ๋๋ก ํฉ๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ (4.8) ๋ถํฌ์์ ๋ ๋ฆฝ์ ์ผ๋ก ์ถ์ถ๋๋ค๋ ๊ฐ์ ์ ํ๋ฉด ๋งค๊ฐ๋ณ์ w์ σ2์ ๋ํ ์ฐ๋ ํจ์์ ํํ์ ์ป์ ์ ์์ต๋๋ค. (4.9)์ด๋ฉฐ, ์ฌ๊ธฐ์ (4.3)์ ์ฌ์ฉํ์ต๋๋ค. ์ฐ๋ ํจ์์ ๋ํ ์์ฐ๋ก๊ทธ๋ฅผ ์ทจํ๊ณ , ๋จ์ผ ๋ณ์ ๊ฐ์ฐ์์์ ๋ํ ํ์ค ํ์(2.49)์ ์ฌ์ฉํ๋ฉด (4.10)์ด๋ผ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค. ์ฌ๊ธฐ์ ์ ๊ณฑํฉ ์ค์ฐจ ํจ์๋ (4.11)์ ์ํด ์ ์๋ฉ๋๋ค. (4.10)์ ์ฒซ ๋ ํญ์ w๋ฅผ ๊ฒฐ์ ํ ๋ ์์๋ก ์ฒ๋ฆฌ๋ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์์ ๋ณธ ๊ฒ์ฒ๋ผ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ ๋ถํฌ ํ์์ ์ฐ๋ ํจ์๋ฅผ ์ต๋ํํ๋ ๊ฒ์ ์ ๊ณฑํฉ ์ค์ฐจ ํจ์ (4.11)๋ฅผ ์ต์ํํ๋ ๊ฒ๊ณผ ๋๋ฑํฉ๋๋ค.
1.3 Maximum Likelihood
์ฐ๋ฆฌ๊ฐ ์ฐ๋ ํจ์๋ฅผ ์์ฑํ ํ, ์ต๋ ์ฐ๋๋ฅผ ์ฌ์ฉํ์ฌ w์ σ2๋ฅผ ๊ฒฐ์ ํ ์ ์์ต๋๋ค. ๋จผ์ w์ ๋ํ ์ต๋ํ๋ฅผ ๊ณ ๋ คํด ๋ด ์๋ค. ๋ก๊ทธ ์ฐ๋ ํจ์ (4.10)์ w์ ๋ํ ๊ธฐ์ธ๊ธฐ๋ (4.12) ํํ๋ฅผ ๊ฐ์ง๋๋ค. ์ด ๊ธฐ์ธ๊ธฐ๋ฅผ ์ ๋ก๋ก ์ค์ ํ๋ฉด (4.13)์ด ๋ฉ๋๋ค. w์ ๋ํด ํ์ด์ฃผ๋ฉด (4.14)๊ฐ ๋๋๋ฐ, ์ด๋ ์ต์ ์ ๊ณฑ ๋ฌธ์ ์ ๋ํ ์ ๊ท ๋ฐฉ์ ์์ผ๋ก ์๋ ค์ ธ ์์ต๋๋ค. ์ฌ๊ธฐ์ Φ๋ N×M ํ๋ ฌ๋ก, ๋์์ธ ํ๋ ฌ์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ฉฐ ๊ทธ ์์๋ Φnj = φj(xn)๋ก ์ฃผ์ด์ง๋ฏ๋ก (4.15)์ ๋๋ค. ์์ด (4.16)์ Moore-Penrose ์ ์ฌ ์ญํ๋ ฌ(Moore–Penrose pseudo-inverse)๋ก ์๋ ค์ ธ ์์ต๋๋ค (Rao and Mitra, 1971; Golub and Van Loan, 1996).
์ด๋ ์ ์ฌ๊ฐํ์ด ์๋ ํ๋ ฌ์ ๋ํ ํ๋ ฌ ์ญํ๋ ฌ์ ๊ฐ๋ ์ ์ผ๋ฐํํ ๊ฒ์ผ๋ก ๋ณผ ์ ์์ต๋๋ค. ์ค์ ๋ก Φ๊ฐ ์ ์ฌ๊ฐํ์ด๊ณ ๊ฐ์ญ์ ์ด๋ฉด ์ฑ์ง (AB)−1 = B−1A−1์ ์ฌ์ฉํ์ฌ Φ† ≡ Φ−1์์ ์ ์ ์์ต๋๋ค. ์ด ์์ ์์ ํธํฅ ๋งค๊ฐ ๋ณ์ w0์ ์ญํ ์ ๋ํ ์ด๋ค ํต์ฐฐ๋ ฅ์ ์ป์ ์ ์์ต๋๋ค. ํธํฅ ๋งค๊ฐ ๋ณ์๋ฅผ ๋ช ์์ ์ผ๋ก ๋ง๋ค๋ฉด ์ค์ฐจ ํจ์ (4.11)๋ (4.17)์ด ๋ฉ๋๋ค. w0์ ๋ํ ๋ํจ์๋ฅผ 0์ผ๋ก ์ค์ ํ๊ณ w0์ ๋ํด ํ๋ฉด (4.18)์ด ๋๋ฉฐ ์ฌ๊ธฐ์ (4.19)๋ฅผ ์ ์ํ์ต๋๋ค. ๋ฐ๋ผ์ ํธํฅ w0์ ๋์ ๊ฐ์ ํ๊ท ๊ณผ ๊ธฐ์ ํจ์ ๊ฐ์ ๊ฐ์ค ํ๊ท ๊ฐ์ ์ฐจ์ด๋ฅผ ๋ณด์ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋ํ ๋ถ์ฐ σ2์ ๋ํ ๋ก๊ทธ ์ฐ๋ ํจ์ (4.10)๋ฅผ ์ต๋ํํ ์ ์์ผ๋ฉฐ, ์ด๋ (4.20)์ ์ฃผ๊ณ ์์ต๋๋ค. ๊ทธ๋์ ๋ถ์ฐ ๋งค๊ฐ ๋ณ์์ ์ต๋ ์ฐ๋ ๊ฐ์ ํ๊ท ํจ์ ์ฃผ๋ณ์ ๋์ ๊ฐ์ ์์ฐจ ๋ถ์ฐ์ ์ํด ์ฃผ์ด์ง๋๋ค.
1.4 Geometry of Least Squares
์ด ์์ ์์ ์ต์ ์ ๊ณฑ ํด๋ฒ์ ๊ธฐํํ์ ํด์์ ๊ณ ๋ คํ๋ ๊ฒ์ด ์ ์ตํฉ๋๋ค. ์ด๋ฅผ ์ํด tn์ผ๋ก ์ฃผ์ด์ง N ์ฐจ์ ๊ณต๊ฐ์ ๊ณ ๋ คํ๋ฉด t = (t1, ..., tN)T๋ ์ด ๊ณต๊ฐ์ ๋ฒกํฐ์ ๋๋ค. ๊ฐ ๊ธฐ์ ํจ์ φj(xn), N ๋ฐ์ดํฐ ํฌ์ธํธ์์ ๊ณ์ฐ๋ ๊ฒ,์ ๋ํ ๋์ผํ ๊ณต๊ฐ์ ๋ฒกํฐ๋ก ํํ๋ ์ ์์ผ๋ฉฐ ์ด๋ฅผ φj๋ก ํ์ํฉ๋๋ค. Figure 4.3์์ ์ค๋ช ๋ ๊ฒ์ฒ๋ผ φj๋ Φ์ j๋ฒ์งธ ์ด์ ํด๋นํ๋ฉฐ, φ(xn)์ Φ์ nth ํ์ ์ ์น์ ํด๋นํฉ๋๋ค. ๊ธฐ์ ํจ์์ ์ M์ด ๋ฐ์ดํฐ ํฌ์ธํธ ์ N๋ณด๋ค ์์ ๊ฒฝ์ฐ, M ๊ฐ์ ๋ฒกํฐ φj(xn)๋ ์ฐจ์์ด M์ธ ์ ํ ๋ถ๋ถ ๊ณต๊ฐ S๋ฅผ ๊ตฌ์ฑํฉ๋๋ค. y๋ฅผ n = 1, ..., N์ผ ๋ y(xn, w)๋ก ์ฃผ์ด์ง N ์ฐจ์ ๋ฒกํฐ๋ก ์ ์ํฉ๋๋ค. y๋ ๋ฒกํฐ φj์ ์์์ ์ ํ ์กฐํฉ์ด๋ฏ๋ก M ์ฐจ์ ๋ถ๋ถ ๊ณต๊ฐ ์ด๋์๋ ์์นํ ์ ์์ต๋๋ค. ์ ๊ณฑํฉ ์ค์ฐจ (4.11)๋ ๋ฐ๋ผ์ y์ t ์ฌ์ด์ ์ ๊ณฑ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ์ ํด๋นํฉ๋๋ค(1/2์ ๋ฐฐ์๋ฅผ ์ ์ธํ๊ณ ). ๋ฐ๋ผ์ w์ ๋ํ ์ต์ ์ ๊ณฑ ํด๋ฒ์ subspace S ๋ด์ ์์นํ๊ณ t์ ๊ฐ์ฅ ๊ฐ๊น์ด y์ ์ ํ์ ํด๋นํฉ๋๋ค. ์ง๊ด์ ์ผ๋ก Figure 4.3์์ ์ด ํด๋ฒ์ด t๋ฅผ subspace S๋ก์ ์์ง ํฌ์์ ํด๋นํจ์ ์์ํ ์ ์์ต๋๋ค. ์ด๋ ์ค์ ๋ก ΦwML๋ก y์ ๋ํ ํด๋ฒ์ด ์ฃผ์ด์ง๊ณ ์ด๊ฒ์ด ์์ง ํฌ์์ ํํ๋ฅผ ์ทจํจ์ ํ์ธํจ์ผ๋ก์จ ์ฝ๊ฒ ํ์ธํ ์ ์์ต๋๋ค. ์ค์ ๋ก ์ ๊ท ๋ฐฉ์ ์์ ์ง์ ์ ์ธ ํด๋ฒ์ ΦTΦ๊ฐ ํน์ด์ ๊ฐ๊น์ธ ๋ ์์น์ ์ธ ์ด๋ ค์์ ์ผ๊ธฐํ ์ ์์ต๋๋ค. ํนํ ๋ ๊ฐ ์ด์์ ๊ธฐ์ ๋ฒกํฐ φj๊ฐ ๊ณต์ ์ฑ์ ๋๊ฑฐ๋ ๊ฑฐ์ ๊ณต์ ์ฑ์ ๋ ๋ ๊ฒฐ๊ณผ์ ์ธ ๋งค๊ฐ๋ณ์ ๊ฐ์ ํฐ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ์ ์์ต๋๋ค. ์ค์ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๋ค๋ฃฐ ๋ ์ด๋ฌํ ๊ทผ์ ํ ํดํ๋ ํํ์ง ์์ง ์์ต๋๋ค. ๊ฒฐ๊ณผ์ ์ธ ์์น์ ์ธ ์ด๋ ค์์ ํน์ด ๊ฐ ๋ถํด ๋๋ SVD (Deisenroth, Faisal, and Ong, 2020) ๊ธฐ์ ์ ์ฌ์ฉํ์ฌ ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ ๊ทํ ํญ์ ์ถ๊ฐํ๋ฉด ํ๋ ฌ์ด ํดํ๊ฐ ์๋๋ผ๋ ํน์ดํ์ง ์์์ด ๋ณด์ฅ๋ฉ๋๋ค.
1.5 Sequential Learning
์ต๋ ์ฐ๋ ํด๋ฒ(4.14)์ ์ ์ฒด ํ๋ จ ์ธํธ๋ฅผ ํ ๋ฒ์ ์ฒ๋ฆฌํ๋ ์ผ๊ด ์ฒ๋ฆฌ ๋ฐฉ๋ฒ์ผ๋ก ์๋ ค์ ธ ์์ต๋๋ค. ์ด๋ ๋๊ท๋ชจ ๋ฐ์ดํฐ ์ธํธ์ ๋ํด ๊ณ์ฐ ๋น์ฉ์ด ๋ง์ด ๋ค ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธํธ๊ฐ ์ถฉ๋ถํ ํฌ๋ค๋ฉด, ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ ํ๋์ฉ ๊ณ ๋ ค๋๊ณ ๊ฐ ์ ์ ํ์ ๋ชจ๋ธ ๋งค๊ฐ๋ณ์๊ฐ ์ ๋ฐ์ดํธ๋๋ ์์ฐจ ์๊ณ ๋ฆฌ์ฆ์ธ ์์ฐจ ์๊ณ ๋ฆฌ์ฆ, ๋๋ ์จ๋ผ์ธ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ ๊ฒ์ด ๊ฐ์น ์์ ์ ์์ต๋๋ค. ์์ฐจ ํ์ต์ ๋ฐ์ดํฐ ๊ด์ธก์ด ์ฐ์์ ์ผ๋ก ๋ฐ์ํ๊ณ ๋ชจ๋ ๋ฐ์ดํฐ ํฌ์ธํธ๊ฐ ๋ณผ ๋๊น์ง ์์ธก์ด ์ด๋ฃจ์ด์ ธ์ผ ํ๋ ์ค์๊ฐ ์์ฉ ํ๋ก๊ทธ๋จ์๋ ์ ํฉํฉ๋๋ค. ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ, ๋๋ ์์ฐจ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ด๋ผ๊ณ ๋ ์๋ ค์ง ๊ธฐ์ ์ ์ ์ฉํ์ฌ ์์ฐจ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ป์ ์ ์์ต๋๋ค. ์ค์ฐจ ํจ์๊ฐ ๋ฐ์ดํฐ ํฌ์ธํธ์ ๋ํ ํฉ์ธ ๊ฒฝ์ฐ E = ∑nEn, ๋ฐ์ดํฐ ํฌ์ธํธ n์ด ์ ์๋ ํ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ ์๊ณ ๋ฆฌ์ฆ์ (4.21)์ ์ฌ์ฉํ์ฌ ๋งค๊ฐ๋ณ์ ๋ฒกํฐ w๋ฅผ ์ ๋ฐ์ดํธํฉ๋๋ค. ์ฌ๊ธฐ์ τ๋ ๋ฐ๋ณต ํ์๋ฅผ ๋ํ๋ด๋ฉฐ, η๋ ์ ์ ํ ์ ํ๋ ํ์ต ์๋ ๋งค๊ฐ๋ณ์์ ๋๋ค. w์ ๊ฐ์ ์ด๋ค ์์ ๋ฒกํฐ w(0)๋ก ์ด๊ธฐํ๋ฉ๋๋ค. ์ ๊ณฑ ์ค์ฐจ ํจ์ (4.11)์ ๊ฒฝ์ฐ ์ด๋ (4.22)๋ฅผ ์ฃผ์ด์ง๋ฉฐ, ์ฌ๊ธฐ์ φn = φ(xn)์ ๋๋ค. ์ด๋ ์ต์ ํ๊ท ์ ๊ณฑ ๋๋ LMS ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ์๋ ค์ ธ ์์ต๋๋ค.
1.6 Regularized Least Squares
๊ณผ์ ํฉ์ ์ ์ดํ๊ธฐ ์ํด ์ค์ฐจ ํจ์์ ์ ๊ทํ ํญ์ ์ถ๊ฐํ๋ ๊ฐ๋ ์ ์ด์ ์ ์๊ฐํ์ต๋๋ค. ์ด๋ก ์ธํด ์ต์ํํด์ผ ํ๋ ์ด ์ค์ฐจ ํจ์๋ ๋ค์๊ณผ ๊ฐ์ ํํ๋ฅผ ๊ฐ์ง๋๋ค (4.23), ์ฌ๊ธฐ์ λ๋ ์ ๊ทํ ๊ณ์๋ก ๋ฐ์ดํฐ ์ข ์์ ์ค์ฐจ ED(w)์ ์ ๊ทํ ํญ EW(w)์ ์๋์ ์ค์์ฑ์ ์ ์ดํฉ๋๋ค. ์ ๊ทํ ํญ์ ๊ฐ์ฅ ๊ฐ๋จํ ํํ ์ค ํ๋๋ ๊ฐ์ค์น ๋ฒกํฐ ์์๋ค์ ์ ๊ณฑ์ ํฉ์ผ๋ก ์ฃผ์ด์ง๋๋ค (4.24). ๋ง์ฝ ์ฐ๋ฆฌ๊ฐ ๋ํ (4.25)์ ์ฃผ์ด์ง ์ ๊ณฑ ํฉ ์ค์ฐจ ํจ์๋ฅผ ๊ณ ๋ คํ๋ค๋ฉด, ์ ์ฒด ์ค์ฐจ ํจ์๋ ๋ค์๊ณผ ๊ฐ์์ง๋๋ค (4.26). ํต๊ณ์์ ์ด ์ ๊ทํ ํญ์ ๋งค๊ฐ๋ณ์ ๊ฐ์ ์ ๋ก๋ก ์์ถ์ํค๊ธฐ ๋๋ฌธ์ ๋งค๊ฐ๋ณ์ ์์ถ ๋ฐฉ๋ฒ์ ํ ์๋ฅผ ์ ๊ณตํฉ๋๋ค. ๊ทธ๊ฒ์ ์ค์ฐจ ํจ์๊ฐ ์ฌ์ ํ w์ ์ด์ฐจ ํจ์๋ก ์ ์ง๋๋ ์ฅ์ ์ด ์์ผ๋ฉฐ, ๋ฐ๋ผ์ ๊ทธ ์ ํํ ์ต์ํ ๊ฐ์ ๋ซํ ํ์์ผ๋ก ์ฐพ์ ์ ์์ต๋๋ค. ํนํ (4.26)์ w์ ๋ํ ๊ธฐ์ธ๊ธฐ๋ฅผ ์ ๋ก๋ก ์ค์ ํ๊ณ ์ด์ ๊ณผ ๊ฐ์ด w์ ๋ํด ํด๊ฒฐํ๋ฉด (4.27)์ ์ป์ต๋๋ค. ์ด๋ ์ต์์ ๊ณฑ ์๋ฃจ์ (4.14)์ ๊ฐ๋จํ ํ์ฅ์ ๋ํ๋ ๋๋ค.
1.7 Multiple Outputs
์ง๊ธ๊น์ง ๋จ์ผ ๋์ ๋ณ์ t๊ฐ ์๋ ์ํฉ์ ๊ณ ๋ คํ์ต๋๋ค. ์ด๋ค ์์ฉ ํ๋ก๊ทธ๋จ์์๋ K > 1 ๋์ ๋ณ์๋ฅผ ์์ธกํ๊ณ ์ถ์ ์ ์์ผ๋ฉฐ, ์ด๋ค์ ๋์ ๋ฒกํฐ t = (t1 , . . . , tk )T๋ก ํต์นญํฉ๋๋ค. ๊ฐ t ๊ตฌ์ฑ ์์์ ๋ํด ๋ค๋ฅธ ๊ธฐ์ ํจ์ ์งํฉ์ ๋์ ํ์ฌ ์ฌ๋ฌ ๋ ๋ฆฝ์ ์ธ ํ๊ท ๋ฌธ์ ๋ก ์งํํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ ์ผ๋ฐ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ๋์ ๋ฒกํฐ์ ๋ชจ๋ ๊ตฌ์ฑ ์์๋ฅผ ๋ชจ๋ธ๋งํ๋ ๋ฐ ๋์ผํ ๊ธฐ์ ํจ์ ์งํฉ์ ์ฌ์ฉํ๋ ๊ฒ์ ๋๋ค. ์ด๋ก ์ธํด ๋ค์๊ณผ ๊ฐ์ ํํ๊ฐ ๋ฉ๋๋ค (4.28), ์ฌ๊ธฐ์ y๋ K ์ฐจ์ ์ด ๋ฒกํฐ์ด๊ณ , W๋ ๋งค๊ฐ๋ณ์์ M × K ํ๋ ฌ์ด๋ฉฐ, φ(x)๋ ์ด์ ๊ณผ ๊ฐ์ด ์์๊ฐ φj(x)์ธ M ์ฐจ์ ์ด ๋ฒกํฐ์ ๋๋ค. ์ด๋ ๋ค์ ํ ๊ณ์ธต์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ์ ๊ฒฝ๋ง์ผ๋ก ๋ํ๋ผ ์ ์์ต๋๋ค. Figure 4.4์ ํ์๋ ๊ฒ์ฒ๋ผ์ ๋๋ค. ๋์ ๋ฒกํฐ์ ์กฐ๊ฑด๋ถ ๋ถํฌ๋ฅผ ํ์ (4.29)์ ๋ฑ๋ฐฉ์ฑ ๊ฐ์ฐ์์์ผ๋ก ์ทจํ๋ค๊ณ ๊ฐ์ ํด ๋ด ์๋ค. t1, . . . , t1์ ๊ด์ธก์น ์ธํธ๊ฐ ์๋ค๋ฉด ์ด๋ฅผ tTn์ด ์ฃผ์ด์ง๋ ํ๋ ฌ T๋ก ๊ฒฐํฉํ ์ ์์ผ๋ฉฐ, ํฌ๊ธฐ๊ฐ N × K์ธ ํ๋ ฌ X๋ก x1, ..., xN์ ์ ๋ ฅ ๋ฒกํฐ๋ฅผ ๊ฒฐํฉํ ์ ์์ต๋๋ค. ๊ทธ๋ฐ ๋ค์ ๋ก๊ทธ์ฐ๋ ํจ์๋ (4.30)์ผ๋ก ์ฃผ์ด์ง๋๋ค. ์ด์ ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก W์ ๋ํด ์ด ํจ์๋ฅผ ์ต๋ํํ ์ ์์ผ๋ฉฐ, ์ด๋ (4.31)์ ์ ๊ณตํฉ๋๋ค. ์ฌ๊ธฐ์ ์ ๋ ฅ ํน์ง ๋ฒกํฐ φ(x1 ), . . . , φ(xN )์ ํ๋ ฌ Φ๋ก ๊ฒฐํฉํ์ต๋๋ค. ๊ฐ ๋์ ๋ณ์ tk์ ๋ํด ์ด ๊ฒฐ๊ณผ๋ฅผ ์กฐ์ฌํ๋ฉด (4.32)๊ฐ ๋์ค๋ฉฐ, ์ฌ๊ธฐ์ tk๋ n = 1, . . . N์ ๊ตฌ์ฑ ์์ tnk๋ฅผ ๊ฐ๋ N ์ฐจ์ ์ด ๋ฒกํฐ์ ๋๋ค. ๋ฐ๋ผ์ ํ๊ท ๋ฌธ์ ์ ํด๊ฒฐ์ ์๋ก ๋ค๋ฅธ ๋์ ๋ณ์ ๊ฐ์ ๋ถ๋ฆฌ๋๋ฉฐ ๋ชจ๋ ๋ฒกํฐ wk์ ๊ณต์ ๋๋ ๋จ์ผ ์์ฌ ์ญํ๋ ฌ ํ๋ ฌ Φ†๋ง ๊ณ์ฐํ๋ฉด ๋ฉ๋๋ค. ์์์ ๊ณต๋ถ์ฐ ํ๋ ฌ์ ๊ฐ๋ ์ผ๋ฐ์ ์ธ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ ๋ถํฌ๋ก์ ํ์ฅ์ ๊ฐ๋จํฉ๋๋ค. ๋ค์ ํ ๋ฒ K ๊ฐ์ ๋ ๋ฆฝ์ ์ธ ํ๊ท ๋ฌธ์ ๋ก ๋ถ๋ฆฌ๋ฉ๋๋ค. ์ด ๊ฒฐ๊ณผ๋ W ๋งค๊ฐ๋ณ์๊ฐ ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ ๋ถํฌ์ ํ๊ท ๋ง์ ์ ์ํ๊ณ ์์ผ๋ฉฐ, ๋ค๋ณ๋ ๊ฐ์ฐ์์์ ํ๊ท ์ ๋ํ ์ต๋ ์ฐ๋ ์๋ฃจ์ ์ด ๊ณต๋ถ์ฐ๊ณผ ๋ ๋ฆฝ์ ์ด๋ผ๋ ์ฌ์ค์ ์๊ณ ์๊ธฐ ๋๋ฌธ์ ์์ ๊ฐ๋ฅํฉ๋๋ค. ์ด์ ๋ถํฐ๋ ํธ์์ ๋จ์ผ ๋์ ๋ณ์ t๋ง์ ๊ณ ๋ คํ ๊ฒ์ ๋๋ค.
2. Decision Theory
prev.
์ฐ๋ฆฌ๋ ํ๊ท ์์ ์ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ p(t|x)๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ฒ์ผ๋ก ์ ์ํ์ผ๋ฉฐ, ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ํน์ ํํ๋ก๋ ๋งค๊ฐ๋ณ์ w์ ์ํด ์กฐ์ ๋๋ x-์์กด์ ํ๊ท y(x, w)๊ณผ ๋งค๊ฐ๋ณ์ σ2์ ์ํ ๋ถ์ฐ์ ๊ฐ์ง๋ ๊ฐ์ฐ์์(4.8)์ ์ ํํ์ต๋๋ค. w์ σ2๋ ์ต๋์ฐ๋๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ์์ ํ์ต๋ ์ ์์ต๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก (4.33)์ผ๋ก ํํ๋๋ ์์ธก ๋ถํฌ๊ฐ ๋ฉ๋๋ค. ์์ธก ๋ถํฌ๋ ์๋ก์ด ์ ๋ ฅ x์ ๋ํ t์ ๊ฐ์ ๋ํ ๋ถํ์ค์ฑ์ ๋ํ๋ ๋๋ค. ๊ทธ๋ฌ๋ ๋ง์ ์ค์ฉ์ ์ธ ์์ฉ ํ๋ก๊ทธ๋จ์์๋ ์ ์ฒด ๋ถํฌ๋ฅผ ๋ฐํํ๋ ๋์ ํน์ ๊ฐ์ ์์ธกํด์ผ ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ํนํ ํน์ ์์ ์ ์ํํด์ผ ํ๋ ๊ฒฝ์ฐ์ ๋๋ค. ์๋ฅผ ๋ค์ด ์ข ์์ ์น๋ฃํ๊ธฐ ์ํ ๋ฐฉ์ฌ์ ์ ์ต์ ๋ ๋ฒจ์ ๊ฒฐ์ ํ๋ ค๋ฉด ๋ชจ๋ธ์ด ๋ฐฉ์ฌ์ ์ฉ๋์ ๋ํ ํ๋ฅ ๋ถํฌ๋ฅผ ์์ธกํ๊ณ , ๊ทธ ๋ถํฌ๋ฅผ ์ฌ์ฉํ์ฌ ํน์ ์ฉ๋์ ๊ฒฐ์ ํด์ผ ํฉ๋๋ค. ์ด๋ฐ ๊ฒฝ์ฐ ์ฐ๋ฆฌ์ ์์ ์ ์ฒซ ๋ฒ์งธ ๋จ๊ณ์์๋ ์ถ๋ก ๋จ๊ณ๋ก ๋๋ฉ๋๋ค. ์ถ๋ก ๋จ๊ณ์์๋ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์์ธก ๋ถํฌ p(t|x)๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ๋ ๋ฒ์งธ ๋จ๊ณ๋ ์์ฌ ๊ฒฐ์ ๋จ๊ณ๋ก, ์ด ์์ธก ๋ถํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ผ์ ๊ธฐ์ค์ ๋ฐ๋ผ ์ต์ ์ ํน์ ๊ฐ์ f(x)๋ก ๊ฒฐ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์์ธก ๋ถํฌ p(t|x)์ f์ ์์กดํ๋ ์์ค ํจ์๋ฅผ ์ต์ํํฉ๋๋ค. ์ง๊ด์ ์ผ๋ก ์ฐ๋ฆฌ๋ ์กฐ๊ฑด๋ถ ๋ถํฌ์ ํ๊ท ์ ์ ํํ ๊ฒ์ ๋๋ค. ๋ฐ๋ผ์ f(x) = y(x,w_ML)์ ์ฌ์ฉํ ๊ฒ์ ๋๋ค. ์ด ์ง๊ด์ด ์ด๋ค ๊ฒฝ์ฐ์๋ ๋ง์ ์ ์์ง๋ง, ๋ค๋ฅธ ์ํฉ์์๋ ๋งค์ฐ ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด๊ฒ์ด ์ธ์ ์ ์ฉ๋๋ฉฐ ์ด๋ค ๊ฐ์ ํ์์ ์ ์ฉ๋๋์ง๋ฅผ ์ดํดํ๊ธฐ ์ํด ์ด๋ฅผ ๊ณต์ํํ๋ ๊ฒ์ด ์ ์ฉํ๋ฉฐ, ์ด๋ฅผ ์ํํ๋ ํ๋ ์์ํฌ๋ฅผ ์์ฌ ๊ฒฐ์ ์ด๋ก ์ด๋ผ๊ณ ํฉ๋๋ค. ์ฐ๋ฆฌ๊ฐ ์์ธก์ ๋ํ ์ต์ ๊ฐ f(x)๋ฅผ ์ ํํ ๋ ์ค์ ๊ฐ์ด t์ผ ๋ ์ผ์ข ์ ํจ๋ํฐ ๋๋ ๋น์ฉ์ด ๋ฐ์ํฉ๋๋ค. ์ด๋ ์์ค๋ก ๋ํ๋ด๋ฉฐ L(t, f(x))๋ก ํ๊ธฐํฉ๋๋ค. ๋ฌผ๋ก ์ฐ๋ฆฌ๋ t์ ์ค์ ๊ฐ์ ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ์ L ์์ฒด๋ฅผ ์ต์ํํ๋ ๋์ (4.34)์์ ์ฃผ์ด์ง ๊ฒ์ฒ๋ผ ์ ๋ ฅ๊ณผ ๋์ ๋ณ์์ ๊ฒฐํฉ ๋ถํฌ p(x, t)์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ํ๊ท ๋๋ ๊ธฐ๋ ์์ค์ ์ต์ํํฉ๋๋ค. ํ๊ท ๋ฌธ์ ์์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ ์์ค ํจ์์ ์ ํ์ L(t, f(x)) = {f(x) - t}2๋ก ์ฃผ์ด์ง๋๋ค. ์ด ๊ฒฝ์ฐ ๊ธฐ๋ ์์ค์ (4.35)๋ก ํํ๋ฉ๋๋ค. E[L]์ ์ต์ํํ๊ธฐ ์ํด ์ฐ๋ฆฌ์ ๋ชฉํ๋ f(x)๋ฅผ ์ ํํ๋ ๊ฒ์ ๋๋ค. ์์ ํ ์ ์ฐํ ํจ์ f(x)๋ฅผ ๊ฐ์ ํ๋ค๋ฉด, ์ฐ๋ฆฌ๋ ๋ฏธ๋ถ ๊ฐ๋ณ์ ๊ณ์ฐ์ ์ฌ์ฉํ์ฌ ์ด๋ฅผ ํ์์ ์ผ๋ก ์ํํ ์ ์์ต๋๋ค. (4.36)์ผ๋ก ์ฃผ์ด์ง ๊ฒฐ๊ณผ๋ฅผ ์ป์ต๋๋ค. f(x)์ ๋ํด ํ์ด๋๊ฐ๊ณ ํ๋ฅ ์ ํฉ๊ณผ ๊ณฑ ๊ท์น์ ์ฌ์ฉํ์ฌ (4.37)์ ์ป์ต๋๋ค. ์ด๋ x์ ๋ํ ์กฐ๊ฑด๋ถ ํ๊ท ์ด๋ฉฐ ํ๊ท ํจ์๋ก ์๋ ค์ ธ ์์ต๋๋ค. ์ด ๊ฒฐ๊ณผ๋ Figure 4.5์์ ์ค๋ช ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์ด๋ ๋ค๋ณ์ ๋์ ๋ณ์๋ฅผ ๋ํ๋ด๋ ๋ฒกํฐ t๋ก ํ์ฅํ ์ ์์ผ๋ฉฐ, ์ด ๊ฒฝ์ฐ ์ต์ ํด๋ ์กฐ๊ฑด๋ถ ํ๊ท fโ(x) = E[t|x]์ ๋๋ค. ๊ฐ์ฐ์์ ์กฐ๊ฑด๋ถ ๋ถํฌ์ ๊ฒฝ์ฐ (4.8) ํํ๋ก, ์กฐ๊ฑด๋ถ ํ๊ท ์ ๋จ์ํ (4.38)์ ๋๋ค. (4.37)๋ฅผ ์ ๋ํ๋ ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ผ๋ก๋ ํ๊ท ๋ฌธ์ ์ ๋ณธ์ง์ ๋ ์ ์ดํดํ ์ ์๋ ๋ฐฉ์์ผ๋ก ์ ๋ํ ์ ์์ต๋๋ค. ์ต์ ํด๊ฐ ์กฐ๊ฑด๋ถ ๊ธฐ๋๊ฐ์ธ ์ง์์ ๋ฐํ์ผ๋ก ์ ๊ณฑ ํญ์ ๋ค์๊ณผ ๊ฐ์ด ํ์ฅํ ์ ์์ต๋๋ค. {f(x) - t}2 = {f(x) - E[t|x] + E[t|x] - t}2 = {f(x) - E[t|x]}2 + 2{f(x) - E[t|x]}{E[t|x] - t} + {E[t|x] - t}2 ํ๊ธฐ๋ฅผ ๋จ์ํ๊ฒ ์ ์งํ๊ธฐ ์ํด E[t|x]๋ฅผ Et[t|x]๋ก ์ฌ์ฉํฉ๋๋ค. ์์ค ํจ์ (4.35)์ ๋์ ํ๊ณ t์ ๋ํ ์ ๋ถ์ ์ํํ๋ฉด ๊ต์ฐจ ํญ์ด ์์ด์ง๊ณ ์์ค ํจ์๋ฅผ (4.39) ํํ๋ก ์ป์ต๋๋ค. ์ฐ๋ฆฌ๊ฐ ๊ฒฐ์ ํ๋ ค๋ ํจ์ f(x)๋ ์ฒซ ๋ฒ์งธ ํญ ์๋ง ๋ํ๋๋ฉฐ, ์ด ํญ์ f(x)๊ฐ E[t|x]์ ๊ฐ์ ๋ ์ต์ํ๋ฉ๋๋ค. ์ด ๊ฒฝ์ฐ ์ด ํญ์ ์์ด์ง๋๋ค. ์ด๋ ์ฐ๋ฆฌ๊ฐ ์ด์ ์ ์ ๋ํ ๊ฒฐ๊ณผ์ผ ๋ฟ์ด๋ฉฐ, ์ต์ ์ ์ต์์ ๊ณฑ ์์ธก์๋ ์กฐ๊ฑด๋ถ ํ๊ท ์ผ๋ก ์ฃผ์ด์ง๋๋ค. ๋ ๋ฒ์งธ ํญ์ x์ ๋ํด ํ๊ท ํ๋ t์ ๋ถํฌ์ ๋ถ์ฐ์ด๋ฉฐ ๋์ ๋ฐ์ดํฐ์ ๋ด์ฌ์ ๋ณ๋์ฑ์ ๋ํ๋ด๋ฉฐ ์์ค ํจ์์ ๊ธฐ๋ณธ ์ต์๊ฐ์ผ๋ก ๊ฐ์ฃผ๋ ์ ์์ต๋๋ค. ์ ๊ณฑ ์์ค์ ํ๊ท๋ฅผ ์ํ ์์ค ํจ์์ ์ ์ผํ ์ ํ์ด ์๋๋๋ค. ์ฌ๊ธฐ์ ์ฐ๋ฆฌ๋ ์ ๊ณฑ ์์ค์ ๊ฐ๋จํ ์ผ๋ฐํ ์ค ํ๋์ธ ๋ฏผ์ฝํ์คํค ์์ค์ ๊ฐ๋จํ ๊ฒํ ํฉ๋๋ค. ๊ทธ ๊ธฐ๋๊ฐ์ (4.40)์ผ๋ก ์ฃผ์ด์ง๋ฉฐ q = 2์ ๊ฒฝ์ฐ ์์๋ ์ ๊ณฑ ์์ค๋ก ๊ฐ์ํฉ๋๋ค. ์ฌ๋ฌ q ๊ฐ์ ๋ํ f - t์ ๋ํด |f - t|q ํจ์๋ Figure 4.6์์ ํ๋กํ ๋ฉ๋๋ค. E[Lq]์ ์ต์๊ฐ์ q = 2์ ๊ฒฝ์ฐ ์กฐ๊ฑด๋ถ ํ๊ท , q = 1์ ๊ฒฝ์ฐ ์กฐ๊ฑด๋ถ ์ค์๊ฐ ๋ฐ q → 0์ ๊ฒฝ์ฐ ์กฐ๊ฑด๋ถ ๋ชจ๋์ ๋๋ค. ๊ฐ์ฐ์์ ๋ ธ์ด์ฆ ๊ฐ์ ์ x๊ฐ ์ฃผ์ด์ก์ ๋ t์ ์กฐ๊ฑด๋ถ ๋ถํฌ๊ฐ ๋จ์ผ ๋ชจ์์์ ์๋ฏธํ๋ฉฐ, ์ด๋ ์ผ๋ถ ์์ฉ ํ๋ก๊ทธ๋จ์๋ ๋ถ์ ์ ํ ์ ์์ต๋๋ค. ์ด ๊ฒฝ์ฐ ์ ๊ณฑ ์์ค์ ๋งค์ฐ ๋์ ๊ฒฐ๊ณผ๋ก ์ด์ด์ง ์ ์์ผ๋ฉฐ ๋ ์ ๊ตํ ์ ๊ทผ ๋ฐฉ์์ด ํ์ํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์ฐ๋ฆฌ๋ ๊ฐ์ฐ์์์ ํผํฉ์ ์ฌ์ฉํ์ฌ ๋ค์ค ๋ชจ๋ ์กฐ๊ฑด๋ถ ๋ถํฌ๋ฅผ ๋ง๋ค์ด ์ด๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด๋ ์ญ ๋ฌธ์ ์ ํด๊ฒฐ์์ ์์ฃผ ๋ฐ์ํฉ๋๋ค. ์ด ์น์ ์์๋ ํ๊ท ๋ฌธ์ ์ ๋ํ ์์ฌ ๊ฒฐ์ ์ด๋ก ์ ์ค์ ์ ๋์์ผ๋ฉฐ, ๋ค์ ์ฅ์์๋ ๋ถ๋ฅ ์์ ์ ๋ํ ์ ์ฌํ ๊ฐ๋ ์ ๊ฐ๋ฐํ ๊ฒ์ ๋๋ค.
3. Bias-Variance Trade-off
prev.
์ง๊ธ๊น์ง ํ๊ท์ ๋ํ ์ ํ ๋ชจ๋ธ์ ๋ํ ๋ ผ์์์ ์ฐ๋ฆฌ๋ ๊ธฐ์ ํจ์์ ํํ์ ๊ฐ์๊ฐ ๋ชจ๋ ์ฃผ์ด์ง ๊ฒ์ผ๋ก ๊ฐ์ ํ์ต๋๋ค. ๋ํ ์ต๋์ฐ๋๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ ์ธํธ ํฌ๊ธฐ๊ฐ ์ ํ๋ ๊ฒฝ์ฐ ๋ณต์กํ ๋ชจ๋ธ์ ํ๋ จ์ํฌ ๋ ์ฌ๊ฐํ ๊ณผ์ ํฉ์ด ๋ฐ์ํ ์ ์์์ ๋ณด์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ณผ์ ํฉ์ ํผํ๊ธฐ ์ํด ๊ธฐ์ ํจ์์ ๊ฐ์๋ฅผ ์ ํํ๋ฉด ๋ชจ๋ธ์ด ๋ฐ์ดํฐ์ ํฅ๋ฏธ๋ก์ด ๊ฒฝํฅ์ ์บก์ฒํ๋ ์ ์ฐ์ฑ์ด ์ ํ๋๋ ๋ถ์์ฉ์ด ๋ฐ์ํฉ๋๋ค. ๋ง์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ ๋ํ ๊ณผ์ ํฉ์ ์ ์ดํ๋ ์ ๊ทํ ํญ์ด ์๋๋ผ๋ ์ ๊ทํ ๊ณ์ λ์ ์ ์ ํ ๊ฐ์ ์ด๋ป๊ฒ ๊ฒฐ์ ํ ์ง์ ๋ํ ๋ฌธ์ ๊ฐ ๋ฐ์ํฉ๋๋ค. ๊ฐ์ค์น ๋ฒกํฐ w ๋ฐ ์ ๊ทํ ๊ณ์ λ์ ๋ํ ์ ๊ทํ๋ ์ค๋ฅ ํจ์๋ฅผ ์ต์ํํ๋ ํด๋ฅผ ์ฐพ๋ ๊ฒ์ ๋ถ๋ช ํ ์ณ์ง ์์ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. ์๋ํ๋ฉด ์ด๋ λ = 0์ ์ ๊ทํ๋์ง ์์ ํด๋ก ์ด์ด์ง๊ธฐ ๋๋ฌธ์ ๋๋ค.
๋ชจ๋ธ ๋ณต์ก์ฑ ๋ฌธ์ ์ ๋ํ ๋น๋์ฃผ์์ ๊ด์ ์ธ ํธํฅ-๋ถ์ฐ ๊ท ํ์ ๊ณ ๋ คํ๋ ๊ฒ์ด ์ ์ตํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด ๊ฐ๋ ์ ์ ํ ๊ธฐ์ ํจ์ ๋ชจ๋ธ์ ๋งฅ๋ฝ์์ ์๊ฐํ ๊ฒ์ด๋ฉฐ, ์ฌ๊ธฐ์ ๊ฐ๋จํ ์์ ๋ฅผ ์ฌ์ฉํ์ฌ ์์ด๋์ด๋ฅผ ์ค๋ช ํ๊ธฐ๊ฐ ์ฝ์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด ๋ ผ์๋ ๋งค์ฐ ์ผ๋ฐ์ ์ผ๋ก ์ ์ฉ๋ ์ ์์ต๋๋ค. ๋ค๋ง, ์ค๋ฒํผํ ์ ์ค์ ๋ก ์ต๋์ฐ๋์ ๋ถํํ ์์ฑ์ด๋ฉฐ ๋ฒ ์ด์ง์ ํ๊ฒฝ์์ ๋งค๊ฐ๋ณ์์ ๋ํ ์ฃผ๋ณํ๋ฅผ ์ํํ ๋๋ ๋ฐ์ํ์ง ์์ต๋๋ค(Bishop, 2006).
์ฐ๋ฆฌ๊ฐ ํ๊ท ๋ฌธ์ ์ ๋ํ ์์ฌ ๊ฒฐ์ ์ด๋ก ์ ๋ ผ์ํ ๋ ์ฐ๋ฆฌ๋ ๋ค์ํ ์์ค ํจ์๋ฅผ ๊ณ ๋ คํ๊ณ , ๊ฐ๊ฐ์ ์กฐ๊ฑด๋ถ ๋ถํฌ p(t|x)๊ฐ ์ฃผ์ด์ง ๊ฒฝ์ฐ์ ๋์ํ๋ ์ต์ ์ ์์ธก์ ์ ๊ณตํฉ๋๋ค. ์ธ๊ธฐ ์๋ ์ ํ์ ์ ๊ณฑ ์์ค ํจ์์ด๋ฉฐ, ์ด ๊ฒฝ์ฐ ์ต์ ์ ์์ธก์ ์กฐ๊ฑด๋ถ ๊ธฐ๋์น๋ก ์ฃผ์ด์ง๋ฉฐ, ์ด๋ฅผ h(x)๋ก ํ์ํ๊ณ (4.41)๋ก ์ฃผ์ด์ง๋๋ค. ๋ํ ๊ธฐ๋๋๋ ์ ๊ณฑ ์์ค์ (4.42) ํํ๋ก ํํ๋ ์ ์์ต๋๋ค. ๋ ๋ฒ์งธ ํญ์ f(x)์ ๋ ๋ฆฝ์ ์ธ ์ธํธ๋ฆฐ์ง ๋ฐ์ดํฐ ๋ ธ์ด์ฆ์์ ๋ฐ์ํ๋ฉฐ ์์ ์์ค์ ์ต์๊ฐ์ ๋๋ค. ์ฒซ ๋ฒ์งธ ํญ์ ํจ์ f(x)์ ์ ํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ฉฐ ์ด ํญ์ ์ต์ํํ๋ f(x)์ ํด๋ฅผ ์ฐพ์ ๊ฒ์ ๋๋ค. ์ด ํญ์ด ์์ด ์๋๊ธฐ ๋๋ฌธ์ ์ด ํญ์ ๊ฐ์ฅ ์์ ๊ฐ์ 0์ ๋๋ค. ์ฐ๋ฆฌ๊ฐ ๋ฌดํํ ๋ฐ์ดํฐ ๊ณต๊ธ์ด ์๋ค๋ฉด (๊ทธ๋ฆฌ๊ณ ๋ฌดํํ ๊ณ์ฐ ์์์ด ์๋ค๋ฉด) ์ํ๋ ์ ๋์ ์ ํ๋๋ก ํ๊ท ํจ์ h(x)๋ฅผ ์์น์ ์ผ๋ก ์ฐพ์ ์ ์์ผ๋ฉฐ, ์ด๊ฒ์ด f(x)์ ๋ํ ์ต์ ์ ์ ํ์ผ ๊ฒ์ ๋๋ค. ๊ทธ๋ฌ๋ ์ค์ ๋ก๋ ์ ํํ ์์ ๋ฐ์ดํฐ ํฌ์ธํธ N๋ง ํฌํจ๋ ๋ฐ์ดํฐ ์ธํธ D๊ฐ ์๊ณ , ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ํ๊ท ํจ์ h(x)๋ฅผ ์ ํํ๊ฒ ์ ์ ์์ต๋๋ค. ๋ง์ฝ ๋งค๊ฐ ๋ณ์ ๋ฒกํฐ w์ ์ํด ์ง๋ฐฐ๋๋ ํจ์๋ก h(x)๋ฅผ ๋ชจ๋ธ๋งํ๋ค๋ฉด ๋ฒ ์ด์ง์ ๊ด์ ์์๋ ๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ด w์ ๋ํ ์ฌํ ๋ถํฌ๋ฅผ ํตํด ํํ๋ฉ๋๋ค. ๊ทธ๋ฌ๋ ๋น๋์ฃผ์์ ์ฒ๋ฆฌ๋ ๋ฐ์ดํฐ ์ธํธ D๋ฅผ ๊ธฐ๋ฐ์ผ๋ก w์ ์ ์ถ์ ์น๋ฅผ ์์ฑํ๊ณ , ์ด ์ถ์ ์น์ ๋ถํ์ค์ฑ์ ๋ค์๊ณผ ๊ฐ์ ์ฌ๊ณ ์คํ์ ํตํด ํด์ํ๋ ค๊ณ ์๋ํฉ๋๋ค. N ํฌ๊ธฐ์ ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ์ถ์ถ๋ ๋ฐ์ดํฐ ์ธํธ D๊ฐ ๋ถํฌ p(t, x)์์ ๋ ๋ฆฝ์ ์ผ๋ก ๊ทธ๋ ค์ง ๊ฒ์ผ๋ก ๊ฐ์ ํฉ๋๋ค. ํน์ ๋ฐ์ดํฐ ์ธํธ D์ ๋ํด ์ฐ๋ฆฌ์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์คํํ๊ณ ์์ธก ํจ์ f(x; D)๋ฅผ ์ป์ ์ ์์ต๋๋ค. ์์๋ธ์ ๋ค๋ฅธ ๋ฐ์ดํฐ ์ธํธ๋ ๋ค๋ฅธ ํจ์๋ฅผ ์ ๊ณตํ๋ฉฐ ๊ฒฐ๊ณผ์ ์ผ๋ก ์ ๊ณฑ ์์ค์ ๋ค๋ฅธ ๊ฐ๋ค์ ์ป๊ฒ ๋ฉ๋๋ค. ํน์ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ ๋ฐ์ดํฐ ์ธํธ์ ์ด๋ฌํ ์์๋ธ์ ๋ํ ํ๊ท ์ ์ทจํจ์ผ๋ก์จ ํ๊ฐ๋ฉ๋๋ค. (4.42)์ ์ฒซ ๋ฒ์งธ ํญ์ ์ ๋ถ ํผ๊ฐ์ด N ํฌ๊ธฐ์ ํน์ ๋ฐ์ดํฐ ์ธํธ D์ ๋ํด (4.43)์ ํํ๋ฅผ ์ทจํฉ๋๋ค. ์ด ์์ ํน์ ๋ฐ์ดํฐ ์ธํธ D์ ๋ฐ๋ผ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ ์ธํธ ์์๋ธ์์ ์ด๋ฅผ ํ๊ท ์ ์ทจํฉ๋๋ค. ์ค๊ดํธ ์์ ED[f(x; D)]๋ฅผ ๋ํ๊ณ ๋นผ๋ฉด์ ํ์ฅํ๋ฉด (4.44)๋ฅผ ์ป์ ์ ์์ต๋๋ค. ์ด์ D์ ๋ํ ์ด ํํ์์ ๊ธฐ๋๊ฐ์ ์ทจํ๊ณ ์ต์ข ํญ์ด ์ฌ๋ผ์ง๊ฒ ํ
๋ฉด (4.45)๋ฅผ ์ป์ ์ ์์ต๋๋ค. f(x; D)์ ํ๊ท ํจ์ h(x) ๊ฐ์ ์์ ์ ๊ณฑ ์ฐจ์ด๋ ๋ ํญ์ ํฉ์ผ๋ก ํํ๋ ์ ์์ต๋๋ค. ์ฒซ ๋ฒ์งธ ํญ์ ์ ๊ณฑ ๋ฐ์ด์ด์ค๋ผ๊ณ ๋ถ๋ฆฌ๋ฉฐ ๋ชจ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ํ๊ท ์์ธก์ด ์ํ๋ ํ๊ท ํจ์์์ ์ผ๋ง๋ ๋ค๋ฅธ์ง๋ฅผ ๋ํ๋ ๋๋ค. ๋ ๋ฒ์งธ ํญ์ ๋ถ์ฐ์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ฉฐ ๊ฐ๋ณ ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ์๋ฃจ์ ์ด ํ๊ท ์ฃผ๋ณ์์ ์ผ๋ง๋ ๋ค๋ฅธ์ง๋ฅผ ์ธก์ ํ๋ฉฐ ๋ฐ๋ผ์ f(x; D) ํจ์๊ฐ ํน์ ๋ฐ์ดํฐ ์ธํธ์ ํน์ ์ ํ์ ๋ฏผ๊ฐํ ์ ๋๋ฅผ ๋ํ๋ ๋๋ค. ์ด๋ฌํ ์ ์๋ฅผ ์ง์งํ๋ ๋ช ๊ฐ์ง ์ง๊ด์ ๊ณง ๊ฐ๋จํ ์์ ๋ฅผ ํตํด ๊ณ ๋ คํ ๊ฒ์ ๋๋ค. ์ง๊ธ๊น์ง x์ ๋จ์ผ ์ ๋ ฅ ๊ฐ์ ๊ณ ๋ คํ์ต๋๋ค. ์ด ํ์ฅ์ (4.42)๋ก ๋๋๋ฆฌ๋ฉด ๊ธฐ๋ ์ ๊ณฑ ์์ค์ ๋ค์ ๋ถํด๋ฅผ ์ป์ต๋๋ค. (4.46), ์ฌ๊ธฐ์ (4.47 ~ 4.49)์ด๊ณ ์ด์ ๋ฐ์ด์ด์ค ๋ฐ ๋ถ์ฐ ์ฉ์ด๋ ํตํฉ๋ ์์ผ๋ก ์ฐธ์กฐ๋ฉ๋๋ค. ์ฐ๋ฆฌ์ ๋ชฉํ๋ ๊ธฐ๋ ์์ค์ ์ต์ํํ๋ ๊ฒ์ธ๋ฐ, ์ด๋ (์ ๊ณฑ) ๋ฐ์ด์ด์ค, ๋ถ์ฐ ๋ฐ ์์ ๋ ธ์ด์ฆ ํญ์ ํฉ์ผ๋ก ๋ถํด๋์์ต๋๋ค. ๋ณด๊ฒ ๋ ๊ฒ์ฒ๋ผ ๋ฐ์ด์ด์ค์ ๋ถ์ฐ ๊ฐ์๋ ํธ๋ ์ด๋ ์คํ๊ฐ ์์ผ๋ฉฐ, ๋งค์ฐ ์ ์ฐํ ๋ชจ๋ธ์ ๋ฎ์ ๋ฐ์ด์ด์ค์ ๋์ ๋ถ์ฐ์ ๊ฐ์ง๋ฉฐ, ๋น๊ต์ ๊ฐ๊ฑดํ ๋ชจ๋ธ์ ๋์ ๋ฐ์ด์ด์ค์ ๋ฎ์ ๋ถ์ฐ์ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค. ์ต์ ์ ์์ธก ๋ฅ๋ ฅ์ ๊ฐ์ง ๋ชจ๋ธ์ ๋ฐ์ด์ด์ค์ ๋ถ์ฐ ๊ฐ์ ์ต์์ ๊ท ํ์ ์ฐพ๋ ๊ฒ์ ๋๋ค. ์ด๋ ์์ ์๊ฐํ ์ฌ์ธ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๊ณ ๋ คํ์ฌ ์ค๋ช ๋ฉ๋๋ค. ์ฌ๊ธฐ์ ์ฐ๋ฆฌ๋ N = 25 ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ํฌํจํ๋ ๊ฐ๊ฐ 100 ๊ฐ์ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์์ฑํ๊ณ ์ฌ์ธ ๊ณก์ h(x) = sin(2πx)์์๋ถํฐ์ ๋๋ค. ๋ฐ์ดํฐ ์ธํธ๋ l = 1,...,L๋ก ์์ธ๋๋ฉฐ, ์ฌ๊ธฐ์ L = 100์ ๋๋ค. ๊ฐ ๋ฐ์ดํฐ ์ธํธ D(l)์ ๋ํด ์ด 25 ๊ฐ์ ๋งค๊ฐ ๋ณ์๋ฅผ ์ ๊ณตํ๊ธฐ ์ํด M = 24 ๊ฐ์ ๊ฐ์ฐ์์ ๊ธฐ์ ํจ์์ ์์ '๋ฐ์ด์ด์ค' ๊ธฐ์ ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ์ ํฉ์ํต๋๋ค. ์ ๊ทํ๋ ์ค๋ฅ ํจ์ (4.26)๋ฅผ ์ต์ํํจ์ผ๋ก์จ ์์ธก ํจ์ f(l)(x)๋ฅผ ์ป์ต๋๋ค. Figure 4.7์ ํ์๋ ๊ฒ์ฒ๋ผ ์๋จ ํ์ ๋ฎ์ ๋ถ์ฐ(์ผ์ชฝ ๊ทธ๋ฆผ์์ ๋นจ๊ฐ ๊ณก์ ์ด ์ ์ฌํ๊ฒ ๋ณด์ด๊ธฐ ๋๋ฌธ)๊ณผ ๋์ ๋ฐ์ด์ด์ค(์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ์์ ๋ ๊ณก์ ์ด ๋งค์ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ)๋ฅผ ๊ฐ์ง ์ ๊ทํ ๊ณ์ λ์ ํฐ ๊ฐ์ ํด๋นํฉ๋๋ค. ๋ฐ๋ฉด์ ์๋ ํ์ λ๊ฐ ์์ ๊ฒฝ์ฐ๋ก ํฐ ๋ถ์ฐ(์ผ์ชฝ ๊ทธ๋ฆผ์์ ๋นจ๊ฐ ๊ณก์ ๊ฐ์ ๋์ ๋ณ๋์ฑ์ผ๋ก ๋ํ๋จ)๊ณผ ๋ฎ์ ๋ฐ์ด์ด์ค(ํ๊ท ๋ชจ๋ธ ์ ํฉ๊ณผ ์๋ ์ฌ์ธ ํจ์ ๊ฐ์ ์ข์ ์ ํฉ์ด ๋ํ๋จ)๋ฅผ ๊ฐ์ง๋๋ค.
๋ณต์กํ ๋ชจ๋ธ์ ๋ํ M = 25์ ์ฌ๋ฌ ํด๋ฅผ ํ๊ท ํ๋ ๊ฒฐ๊ณผ๋ ํ๊ท ํจ์์ ๋งค์ฐ ์ ๋ง๋ ๊ฒ์ผ๋ก ๋ํ๋๋ฉฐ, ์ด๋ ํ๊ท ํ๊ฐ ์ ์ตํ ์ ์ฐจ์ผ ์ ์๋ค๋ ๊ฒ์ ์์ฌํฉ๋๋ค. ์ค์ ๋ก ๊ฐ์ค ํ๊ท ํ๋ ๋ฒ ์ด์ง์ ์ ๊ทผ์ ํต์ฌ์ ๋์ฌ ์์ผ๋, ์ด ํ๊ท ํ๋ ๋งค๊ฐ๋ณ์์ ์ฌํ ๋ถํฌ์ ๋ํ ๊ฒ์ด๋ฉฐ ๋ค์์ ๋ฐ์ดํฐ ์งํฉ์ ๋ํ ๊ฒ์ ์๋๋๋ค. ์ด ์์ ์ ๋ํด ํธํฅ-๋ถ์ฐ ํธ๋ ์ด๋์คํ๋ฅผ ์์ ์ผ๋ก ์กฐ์ฌํ ์๋ ์์ต๋๋ค. ํ๊ท ์์ธก์ (4.50)์์ ์ถ์ ๋๋ฉฐ, ๊ทธ๋ฐ ๋ค์ ํตํฉ ์ ๊ณฑ ํธํฅ๊ณผ ํตํฉ ๋ถ์ฐ์ (4.51~4.52)์์ ์ฃผ์ด์ง๋๋ค. ์ฌ๊ธฐ์ x์ ๋ํ ์ ๋ถ์ ๋ถํฌ p(x)๋ก ๊ฐ์ค๋ ์ํ์์ ํด๋น ๋ถํฌ์์ ๋ฝ์ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ํตํ ์ ํํ ํฉ์ผ๋ก ๊ทผ์ฌํ๋ฉ๋๋ค. ์ด๋ฌํ ์์ Figure 4.8์์ ln λ์ ํจ์๋ก ํ๋กํ ๋ฉ๋๋ค. ์ฐ๋ฆฌ๋ λ์ ์์ ๊ฐ๋ค์ด ๊ฐ ๊ฐ๋ณ ๋ฐ์ดํฐ ์ธํธ์ ๋ ธ์ด์ฆ์ ๋ฏผ๊ฐํ๊ฒ ์กฐ์ ๋์ด ํฐ ๋ถ์ฐ์ ์ด๋ํ๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค. ๋ฐ๋๋ก, ํฐ λ ๊ฐ์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์๋ฅผ ์ ๋ก๋ก ๋์ด๋น๊ฒจ ํฐ ํธํฅ์ ์ด๋ํฉ๋๋ค. ํธํฅ-๋ถ์ฐ ๋ถํด๋ ๋ฐ์ดํฐ ์งํฉ์ ์์๋ธ์ ๋ํ ํ๊ท ์ ๊ธฐ์ดํ๋ฏ๋ก ์ค์ ๋ก๋ ๋จ์ผ ๊ด์ธก๋ ๋ฐ์ดํฐ ์ธํธ๋ง ๊ฐ์ง๊ณ ์์ต๋๋ค. ์ฃผ์ด์ง ํฌ๊ธฐ์ ๋ ๋ฆฝ์ ์ธ ๊ต์ก ์ธํธ๊ฐ ๋ง๋ค๋ฉด ์ด๋ฅผ ๋จ์ผ ํฐ ๊ต์ก ์ธํธ๋ก ๊ฒฐํฉํ๋ ๊ฒ์ด ๋ ์ข์ ๊ฒ์ด๋ฉฐ, ๋ฌผ๋ก ์ฃผ์ด์ง ๋ชจ๋ธ ๋ณต์ก์ฑ์ ๋ํ ์ค๋ฒํ ์์ค์ ๊ฐ์์ํฌ ๊ฒ์ ๋๋ค. ๊ทธ๋ฌ๋ ํธํฅ-๋ถ์ฐ ๋ถํด๋ ์ข ์ข ๋ชจ๋ธ ๋ณต์ก์ฑ ๋ฌธ์ ์ ๋ํ ์ ์ฉํ ํต์ฐฐ์ ์ ๊ณตํ๋ฉฐ, ์ด ์ฅ์์๋ ํ๊ท ๋ฌธ์ ์ ๊ด์ ์์ ์๊ฐํ์ง๋ง ๊ทผ๋ณธ์ ์ธ ์ง๊ด์ ๊ด๋ฒ์ํ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
๐ง ์ ๋ฆฌ
โ
ใ
'Deep Learning : Vision System > Deep Learning(Christopher M.Bishop)' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DL]00.๋ชฉ์ฐจ ๋ฐ ์ฑ ์๊ฐ. (4) | 2024.01.30 |
---|---|
[DL]03. Standard Distributions (2) | 2024.01.22 |
[DL]02. Probabilities (1) | 2024.01.14 |
[DL]01.The Deep Learning Revolution. (2) | 2023.12.23 |