๐ง ๋ชฉ์ฐจ
1์ฅ Highlights of Linear Algebra
1.1 ํ๋ ฌ A์ ์ด์ ์ด์ฉํ ๊ณฑ์ Ax
1.2 ํ๋ ฌ ๊ณฑ์ AB
1.3 ๋ค ๊ฐ์ง ๊ธฐ๋ณธ ๋ถ๋ถ๊ณต๊ฐ (4 Fundamential Subspaces)
1.4 ์๊ฑฐ๋ฒ๊ณผ A=LU
1.5 ์ง๊ตํ๋ ฌ๊ณผ ๋ถ๋ถ๊ณต๊ฐ
1.6 ๊ณ ์ณ๊ฐ๊ณผ ๊ณ ์ ๋ฒกํฐ
1.7 ๋์นญ์ธ ์์ ์ ๋ถํธ ํ๋ ฌ (Symmetric Positive Definite Matrices)
1.8 ํน์๊ฐ ๋ถํด(SVD)์์ ํน์๊ฐ๊ณผ ํน์ด๋ฒกํฐ
1.9 ์ฃผ์ฑ๋ถ๊ณผ ์ต์ ์ ๋ฎ์ ๋ญํฌ ํ๋ ฌ
1.10 ๋ ์ผ๋ฆฌ(Rayleigh) ๋ชซ๊ณผ ์ผ๋ฐํ๋ ๊ณ ์ณ๊ฐ
1.11 ๋ฒกํฐ, ํจ์, ํ๋ ฌ์ Norm
1.12 ํ๋ ฌ๊ณผ ํ ์์ ๋ถํด : ์๊ณผ ํฌ์ (Positive & Sparse)
2์ฅ Computations with Large Matrices
2.1 ์์น์ ํ๋์ํ
2.2 ๋ค ๊ฐ์ง ์ต์์ ๊ณฑ
2.3 ์ด๊ณต๊ฐ์ ์ธ ๊ฐ์ง ๊ธฐ์
2.4 ์์ํ ์ ํ๋์ํ
3์ฅ Low Rank and Compressed Sensing
3.1 A์ ๋ณํ์ ๋ฐ๋ฅธ A^{-1}์ ๋ณํ
3.2 ๊ณ ์ณ๊ฐ ์ธํฐ๋ ์ด์ฑ๊ณผ ๋ฎ์ ๋ญํฌ ์ ํธ
3.3 ๊ธ๊ฒฉํ ๊ฐ์ํ๋ ํน์๊ฐ
3.4 l²+l¹์ ๋ํ ๋ถํด ์๊ณ ๋ฆฌ์ฆ
3.5 ์์ถ ์ผ์ฑ๊ณผ ํ๋ ฌ์์ฑ
4์ฅ Special Matrices
4.1 ํธ๋ฆฌ์ ๋ณํ : ์ด์ฐ๊ณผ ์ฐ์์ฑ
4.2 ์ด๋ํ๋ ฌ๊ณผ ์ํํ๋ ฌ
4.3 ํฌ๋ก๋ค์ปค ๊ณฑ AโงB
4.4 ํฌ๋ก๋ค์ปค ํฉ์ ํตํ ์ฌ์ธ๊ณผ ์ฝ์ฌ์ธ ๋ณํ
4.5 ํดํ๋ฆฌ์ธ ํ๋ ฌ๊ณผ ์ด๋ ๋ถ๋ณ ํํฐ
4.6 ๊ทธ๋ํ์ ๋ผํ๋ผ์์ ๊ทธ๋ฆฌ๊ณ ํค๋ฅดํํธํ์ ๋ฒ์น
4.7 ์คํํธ๋ผ ๋ฐฉ๋ฒ๊ณผ K-ํ๊ท ์ ์ด์ฉํ ๊ตฐ์งํ
4.8 ๋ญํฌ 1 ํ๋ ฌ์์ฑ
4.9 ์ง๊ต ํ๋กํฌ๋ฃจ์คํ ์ค ๋ฌธ์
4.10 ๊ฑฐ๋ฆฌํ๋ ฌ
5์ฅ Probability and Statistics
5.1 ํ๊ท , ๋ถ์ฐ, ํ๋ฅ
5.2 ํ๋ฅ ๋ถํฌ
5.3 ๋ชจ๋ฉํธ์์ฑํจ์, ๋์ ์์ฑํจ์, ํต๊ณ ๋ถ๋ฑ์
5.4 ๊ณต๋ถ์ฐํ๋ ฌ๊ณผ ๊ฒฐํฉํ๋ฅ
5.5 ๋ค๋ณ๋ ์ ๊ท๋ถํฌ์ ๊ฐ์ค์ต์์ ๊ณฑ
5.6 ๋ง๋ฅด์ฝํ ์ฐ์
6์ฅ Optimization
6.1 ์ต์๊ฐ ๋ฌธ์ : ๋ณผ๋ก์ฑ๊ณผ ๋ดํด ๋ฐฉ๋ฒ
6.2 ๋ผ๊ทธ๋์ฃผ ์น์์ ๋น์ฉ ๋ํจ์
6.3 ์ ํ ๊ณํ๋ฒ, ๊ฒ์์ด๋ก , ์๋์ฑ
6.4 ์ต์๊ฐ์ผ๋ก ํฅํ๋ ๊ฒฝ์ฌํ๊ฐ
6.5 ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๊ณผ ADAM
7์ฅ Learning from Data
7.1 ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๊ตฌ์กฐ
7.2 ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง
7.3 ์ค์ฐจ์ญ์ ํ์ ์ฐ์๋ฒ์น
7.4 ์ด๋งค๊ฐ๋ณ์ : ์๋ช ์ ๊ฒฐ์
7.5 ๋จธ์ ๋ฌ๋ ์ธ๊ณ
๐ง Purpose
๐ถ ์ด ์ฑ ์ ๋ชฉํ
1. Data Science์ ์ฃผ์ ๋ฐฉ๋ฒ๋ก ๊ณผ ์์ด๋์ด๋ฅผ ์ ๋ฆฌ
2. 1.์ ์ด๋ป๊ฒ ์ ํ๋์ํ์ผ๋ก ํํํ ์ง ํ์ต
3. 1.์ ์ด๋ป๊ฒ ์ค๋ช ํ ์ง ํ์ต
๐ง Basic for Machine Learning
๐ถ ML & DL
๋จธ์ ๋ฌ๋์์ ์ ํ๋์ํ, ํ๋ฅ ํต๊ณ, ์ต์ ํ๋ ๋ง์น ๋๋ค๋ณด์ ๊ฐ๋ค.
๋ณธ ์ฑ ์ train data๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅ, ์ฒ์๋ณด๋ data๊น์ง ๋ถ๋ฅํ๋ "learning function"๊ตฌ์ฑ์ด ๋ชฉํ
๋ณดํต ์ด๋ฐ learning function ๊ตฌ์ฑ์ ํ๋ ๋ฐฉ์ ์ค ์์ฆ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ๊ฒ์ด ๋ฐ๋ก "Deep Learning"์ด๋ค.
๐ถ Linear & Nonlinear Activation
- Linear์ ๊ฐ์ฅ ํฐ ์์ ์ค Affine function์ ๊ฒฝ์ฐ, ๋น ๋ฅด๊ฒ ํ์ต์ด ๊ฐ๋ฅํ์ง๋ง ๊ทธ ์์ฒด๋ก๋ ๋๋ฌด ๋จ์ํ๋ค๋ ๋จ์ ์ด ์๋ค.
์ฆ, ์ ํ์ฑ์ด๋ ๋งค์ฐ ์ ํ์ด ํฐ ์กฐ๊ฑด์ด๋ค.
- Nonlinear๋ ์ ๋ ฅ๋ฒกํฐ v์ ์ฑ๋ถ์ ์ ๊ณฑ(norm2)ํ๋ ํํ๋ก ๋ํ๋๋ค.
๐ถ Neural Network & F(v)์ ๊ตฌ์กฐ
๋ฅ๋ฌ๋ ๊ตฌ์ฑ ํจ์ F(v) = L(R(L(R(...(Lv)))))์ ํํ์ด๋ค.
- ์ด๋, F๋ ํจ์ R๊ณผ Affineํจ์์ธ Lv = Av + b ๊ฐ์ ํฉ์ฑํจ์์ด๋ค.
- A์ b๋ F์ ๊ฐ์ค์น๋ก ํ๋ ฌ๋ก ํํ๋๋ฉฐ, train data๋ก ํ์ต๋๋ค.
์ด๋, train data์ ํน์ฑ์ ๋ฝ๊ธฐ์ํด ๊ฐ์ค์น๋ฅผ ๊ณ์ฐ, ์ด๋ ๊ฐ์ค์น๋ ํ๋ ฌ์ฑ๋ถ์ด๋ฉฐ ๋ฏธ๋ถ์ ๋ถํ์ "ํธ๋ฏธ๋ถ"์ ์ด์ฉํด ํ์ฌ ๊ฐ์ค์น๋ฅผ ํฅ์์ํค๋ ๋ฐฉํฅ์ ์ ์ํ๋ค.
- ์ธต์ด ๋ง์์ง์๋ก F(v)์ ์ ํ๋๊ฐ ์ฌ๋ผ๊ฐ๋ค.
cf. stochastic(=random)์ด๋ผ๋ ํํ์ ์ฑ๊ณต์ด ํ์ค์ฑ์ด ์๋ ํ๋ฅ ์ ์ข์ฐ๋จ์ ์๋ฏธํ๋ค.
์ฆ, ํฐ ์์ ๋ฒ์น์ ํฐ ํจ์์ ๋ฒ์น์ผ๋ก ํ์ฅ๋๋ฉฐ ๋ง์ฝ ๋ชจ๋ธ๊ตฌ์กฐ๊ฐ ์ ์ค๊ณ๋๊ณ parameter๊ฐ ์ ๊ณ์ฐ๋๋ค๋ฉด ์ฑ๊ณตํ ํ๋ฅ ์ด ๋์์ ๋๋ณํ ์ ์๋ค.
์ ํ๋์ ์์ฉ ์, ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ด๊ณ ์ค์ํ ๊ฐ๋ ์ด ๋๋ 5๊ฐ์ง ๋ฌธ์
1. Ax = b (๋ง์กฑํ๋ x๊ฐ ๊ตฌํ๊ธฐ)
2. Ax = λx (๋ง์กฑํ๋ x์ λ๊ฐ ๊ตฌํ๊ธฐ)
- x์ λ๊ฐ์ ์๋ค๋ฉด, ๋จ์ ์ ํ๋ฌธ์ ๋ก ๋ณํ๊ธฐ์ ์ด๋ค ์ ํ๋ฌธ์ ๋ผ๋ ํ ์ ์๊ฒ ๋๋ค.
3. Av = σu (๋ง์กฑํ๋ v, u, σ๊ฐ ๊ตฌํ๊ธฐ)
- SVD๋ ๊ฐ์ฅ ๊ฐ๋จํ ํํ์ σuvT๋ฅผ ์ฐพ์ผ๋ฉฐ, Data Science๋ SVD์์ ์ ํ๋์ํ๊ณผ ์ฐ๊ฒฐ๋๋ค.
- ์ด๋, σuvT๋ฅผ ์ฐพ๋ ๊ฒ์ PCA์ ๋ชฉ์ ์ด ๋๋ค.
4. argmin( ||Ax||² / ||x||² )
5. Factor A (A๋ฅผ ์ด๊ณผ ํ์ ๊ณฑ์ผ๋ก ๋ถํดํ๊ธฐ)
- ์ต์์ ๊ณฑ(least squares)์์ ์ต์ ์ xฬ์ ๊ตฌํ๊ณ ,
- PCA์์ ์ฃผ์ฑ๋ถ์ธ vโ์ ๊ณ์ฐํ๋๊ฒ์ fitting์ ๋์์ ๋ฌธ์ ์ด๋ค.
cf. column space, null space, Eigen vector, SVD, Least Squares, Fourier transform, LASSO(in ํต๊ณํ)
'Gain Study > Linear Algebra & Learning from Data' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
1.4 ์๊ฑฐ๋ฒ๊ณผ A = LU๋ถํด, Cholesky๋ถํด (0) | 2023.06.29 |
---|---|
1.3 4๊ฐ์ง fundmental subspaces (0) | 2023.06.29 |
1.2 ํ๋ ฌ๊ณฑ์ (๋ด์ ) AB์ rank=1, ํ๋ ฌ ๋ถํด (0) | 2023.06.27 |
1.1 Ax = b์ space์ independent, rank (0) | 2023.06.27 |