๐ ๋ชฉ์ฐจ
1. preview
2. Dimension Reduction
3. ํํ ์คํด 1
4. word2vec [2013]
5. GloVe (Global Vectors for word representation)
6. word2vec ์์ (FastText ์คํ์์ค)
๐ ๊ธ์ ๋ง์น๋ฉฐ...
1. Preview
์์ ๋จ์ด์ ์๋ฏธ์ ๋ชจํธ์ฑ์ ์ดํด๋ณด์๋๋ฐ, ์ฌ๋์ ์ธ์ด๋ ๋ถ์ฐ์์ ํํ์ธ ๋จ์ด๋ก ์ด๋ค์ง๋ฉฐ, ๊ฐ ๋จ์ด๊ฐ ๊ฐ๋ ์๋ฏธ๋ ์๋ก ์ฐ๊ด์ฑ์ด ์์๋๋ ์์ง๋ง ๊ฒ์ผ๋ก๋ ํ์ ํ๊ธฐ ์ด๋ ต๋ค.
์ด๋ฐ NLP์ ํน์ง๋๋ฌธ์ NLP์์ ๋จ์ดโ๋ฌธ์ฅโ๋ฌธ์๋ฅผ vector๋ก ๋ํ๋ด๋ ๊ฒ์ ๋งค์ฐ ํฐ ์๋ช ์ด์๋ค.
(์ปดํจํฐ๊ฐ ์ดํดํ๊ณ ์ฒ๋ฆฌํ๊ธฐ๋ ์ด๋ ต๊ธฐ ๋๋ฌธ)
๋ฐ๋ผ์ ์ปดํจํฐ๊ฐ ์ดํดํ๋ ๋ฒกํฐ๋ก ๋ณํ์ด ๊ฐ๋ฅํ ํจ์๋ mapping table์ ๋ง๋๋ ๊ณผ์ ์ด ์ค์ํ๋ค.
์ด์ ์๊ฐ์๋ ๋จ์ด์ ์๋ฏธ๋ฅผ ๋ค๋ฃจ๋ฉฐ corpus๋ก๋ถํฐ ๋จ์ด์ feature๋ฅผ ์ถ์ถํด ๋ฒกํฐ๋ก ๋ง๋๋ ๊ณผ์ ์ ์ดํด๋ณด์์ง๋ง
์ด๋ฒ์๊ฐ์๋ ๋จ์ด๋ฅผ ์ปดํจํฐ๊ฐ ์ดํดํ๊ณ ์ฒ๋ฆฌํ๊ธฐ ์ฌ์ด ํํ๋ก ๋ณํํ๋ ๊ณผ์ ์ธ, "word embedding"์ ๋ค๋ค๋ณผ ๊ฒ์ด๋ค.
2. Dimension Reduction
์ด์ ์๊ฐ(https://chan4im.tistory.com/196)์์ ๋์์ฐจ์์์ data๋ฅผ ํํํ๋ ๊ณผ์ ์์ ํฌ์์ฑ ๋ฌธ์ ๊ฐ ๋ง์ด ๋ํ๋จ์ ํ์ธํ๋ค.
๋ฐ๋ผ์ ๊ฐ์์ ๋ณด ํํ ์, ๋ ๋ฎ์์ฐจ์์ ์ฌ์ฉํ๋ ๊ฒ์ด ์ค์ ํ๋ค.
2.1 PCA
๊ฐ์ฅ ๋ํ์ ์ฐจ์์ถ์๋ฐฉ๋ฒ์ธ ์ฃผ์ฑ๋ถ ๋ถ์(PCA)์ ๊ณ ์ฐจ์๋ฐ์ดํฐ๋ฅผ ๋ ๋ฎ์์ฐจ์์ผ๋ก ํํํ ์ ์๋ค.
์ฃผ๋ก ํน์ด๊ฐ๋ถํด(SVD)๋ฅผ ํตํด ์ฃผ์ฑ๋ถ๋ถ์์ด ๊ฐ๋ฅํ๋ค.
์์ ์ฌ์ง์์ ๋ค์๊ณผ ๊ฐ์ ์กฐ๊ฑด์ ๋ง์กฑํด์ผ ํ๋ค.
ํ๋์ ์์ ๋นจ๊ฐ์ ์ผ๋ก ํฌ์๋ ๊ฑฐ๋ฆฌ๊ฐ ์ต์๊ฐ ๋์ด์ผ ํ๊ณ
๋นจ๊ฐ์ ๋ค์ ๋ถ์ฐ์ด ์ต๋๊ฐ ๋์ด์ผ ํ๋ค.
๋ค๋ง, ์ ์ฐจ์์ผ๋ก ํฌ์ํ๊ฒ๋๋ฉด ์ ๋ณด์ ์์ค์ด ๋ถ๊ฐํผํ๊ฒ ๋ฐ์ํ๋ฉฐ, ์ด๋ ๋ณต๊ตฌ๋ถ๊ฐ๋ฅํ๋ค.
๋ฐ๋ผ์ ๊ณ ์ฐจ์์ ํํ๋ ์ ๋ณด๋ฅผ ์ง๋์น๊ฒ ๋ฎ์ ์ฐจ์์ผ๋ก ์ถ์ํด ํํํ๊ธฐ ์ด๋ ต๋ค.
ํนํ, data๊ฐ ๋น์ ํ์ ์ผ๋ก ๊ตฌ์ฑ๋ ์๋ก ๋์ฑ ์ด๋ ค์์ง๋ค.
2.2 Manifold Hypothesis
์์ ๊ฐ์ค๋ก ์ฐจ์์ถ์์ ๋ ํจ์จ์ ์ผ๋ก ์ ๊ทผํด๋ณผ ์ ์๋ค.
๋งค๋ํด๋ ๊ฐ์ค: ๊ณ ์ฐจ์์ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, ํด๋น ๋ฐ์ดํฐ๋ค์ ์์ฐ๋ฅด๋ ์ ์ฐจ์์ ๋ค์์ฒด(manifold)์ญ์ ์กด์ฌ ํ๋ค.
์์ ๊ฐ์ด 3์ฐจ์ ๊ณต๊ฐ์ ๋ถํฌํ๋ data๋ฅผ ์์ฐ๋ฅด๋ 2์ฐจ์ manifold๊ฐ ์กด์ฌํ ์๋ ์์ผ๋ฉฐ ์ด๋ฐ manifold๋ฅผ ์ฐพ์ 2์ฐจ์ ํ๋ฉด์ data point๋ค์ mappingํ ์ ์๋ค.
๋ฐ๋ผ์ manifold๋ฅผ ์ฐพ์ ์๋ง ์๋ค๋ฉด, PCA์ฒ๋ผ ๊ณ ์ฐจ์ํ๋ฉด์ data๋ฅผ ์ ํ์ ์ผ๋ก ํฌ์ฌํ๋ฉฐ ์๊ธฐ๋ ์์ค์ ์ต์ํํ ์ ์๋ค.
๋๋ค๋ฅธ ํฅ๋ฏธ๋ก์ด ํน์ง ํ๋๋ ์์ ๊ทธ๋ฆผ์ฒ๋ผ ๊ณ ์ฐจ์์์์ ๊ฐ๊น์ด ๊ฑฐ๋ฆฌ์ point๋ผ ํ ์ง๋ผ๋
manifold๋ณด๋ค ์ ์ฐจ์์ผ๋ก mappingํ๋ฉด ์คํ๋ ค ๊ฑฐ๋ฆฌ๊ฐ ๋ฉ์ด์ง ์ ์๋ค.
๋ํ, ์ ์ฐจ์์ ๊ณต๊ฐ์์์ ๊ฐ๊น์ด ์ ๋ผ๋ฆฌ๋ ์ค์ ๋ก๋ ๊ฐ๊น์ด ํน์ง์ ๊ฐ๋๋ค๋ ๊ฒ์ด๋ค.
๋ฐ๋ผ์ ๊ฐ ๊ณต๊ฐ์ ์ฐจ์์ถ์ ๊ณ ์ฐจ์์์ ๋น์ ํ์ ์ผ๋ก ํํ๋ ๊ฒ์ด๋ฉฐ, ๋ฐ์ดํฐ์ ํน์ง์ ๊ฐ๊ฐ ํํํ ๊ฒ์ด๋ค.
2.3 ๋ฅ๋ฌ๋์ด ์ ์๋ํ๋ ์ด์
๋๋ถ๋ถ, ๋ฅ๋ฌ๋์ด ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์ํด ์ฐจ์์ถ์๋ฅผ ์ํํ๋ ๊ณผ์ ์ด
๋ฐ๋ก ๋ฐ์ดํฐ๊ฐ ์กด์ฌํ๋ ๊ณ ์ฐจ์์์์ manifold๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ค. (๋ค๋ง ๊ฐ์ค์.)
2.4 Auto Encoder
โ ๊ณ ์ฐจ์์ sample_data๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์
โ ์ ๋ ฅ์ ํ ๋๋ก manifold๋ฅผ ์ฐพ๊ณ , ์ ์ฐจ์์ผ๋ก ์ถ์ํ๋ encoder๋ฅผ ๊ฑฐ์นจ
โ encoder๋ฅผ ๊ฑฐ์น ํ bottel-neck๊ตฌ๊ฐ์์์ hidden ๋ฒกํฐ๋ก ํํํ๋ค.
โ decoder๋ ์์ฐจ์๋ฒกํฐ๋ฅผ ๋ฐ์ ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ก ๋ณต์ํ๋ ์์ ์ ์ํํ๋ค.
๋ณต์๋ ๋ฐ์ดํฐ๋ ๊ณ ์ฐจ์์ manifold์์ ์์นํ๊ฒ ๋๋ค.
์ด๋, ๊ณ ์ฐจ์์ data๋ฅผ ์ ์ฐจ์์ผ๋ก ์์ถ ํ ๋ณต์ํ๋ ๊ณผ์ ์์ AE์ bottle-neck์ฐจ์์ ๋งค์ฐ ๋ฎ๊ธฐ์
๋ณต์์ ํ์ํ ์ ๋ณด๋ง ๋จ๊ธฐ๊ณ ํ์์๋ ์ ๋ณด๋ถํฐ ๋ฒ๋ ค์ง๋ค.
์ด์ ์๊ฐ(https://chan4im.tistory.com/196)์์์ TF-IDF๋ฑ์ ํ์ฉ, ๊ณ์ฐํ ํฌ์๋จ์ดํน์ง๋ฒกํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฃ๊ณ
๊ฐ์ ์ถ๋ ฅ๊ฐ์ ๊ฐ๋๋ก ํ๋ จ ์, AE์ bottle-neck์ธต ๊ฒฐ๊ณผ๊ฐ์ dense word embedding vector๋ก ์ฌ์ฉํ ์ ์๋ค.
3. ํํ ์คํด 1.
Skip-Gram, GloVe๋ฅผ ์ฌ์ฉํด ํ๋ จํ ๋จ์ด ์๋ฒ ๋ฉ ๋ฒกํฐ๊ฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ๋๋ค?
No! ์ด ์๋ฒ ๋ฉ ๋ฒกํฐ๋ pre-train๋ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ก word2vec์ ํตํด ์ป์ ๋จ์ด์๋ฒ ๋ฉ๋ฒกํฐ๊ฐ ํ๋ฅญํ๊ฒ ๋จ์ด์ ํน์ง์ ์ ๋ฐ์์ ํ์ง๋ง ๋ชจ๋ธํ๋ จ์ ํตํ ๋ฌธ์ ํด๊ฒฐ์ ๋ํ ์ต์ ์ ๋ฒกํฐ์๋ฒ ๋ฉ์ ์๋๋ค.
๋ฐ๋ผ์ ๋ค๋ฅธ ๋ชฉ์ ํจ์๋ฅผ ํตํด ํ๋ จํ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ ๊ธฐ์กด๋ชฉ์ ์ ๋ง์ง์์ ๊ฐ๋ฅ์ฑ์ด ๋๊ธฐ์ ๋ฌธ์ ์ ํน์ง์ ๊ณ ๋ คํ์ง ์์ ๋จ์ด์๋ฒ ๋ฉ๋ฒกํฐ๋ ๊ทธ๋ค์ง ์ข์๋ฐฉ๋ฒ์ด ๋ ์ ์๋ค.
4. word2vec [2013]
4.1 word2vec
word2vec์ ๋จ์ด๋ฅผ ์๋ฒ ๋ฉํ๋ 2๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ CBOW์ Skip-Gram์ ์ ์ํ๋ค.
๋ ๋ฐฉ๋ฒ ๋ชจ๋ ํจ๊ป ๋ฑ์ฅํ๋ ๋จ์ด๊ฐ ๋น์ทํ ์๋ก ๋น์ทํ ๋ฒกํฐ๊ฐ์ ๊ฐ์ง ๊ฒ์ด๋ผ๋ ๊ณตํต๋ ๊ฐ์ ์ ์ ์ ๋ก ์งํํ๋ค.
์์์์ฒ๋ผ ๋ ๋ฐฉ๋ฒ ๋ชจ๋ window_size๊ฐ ์ฃผ์ด์ง๋ฉด ํน์ ๋จ์ด๋ฅผ ๊ธฐ์ค์ผ๋ก window ๋ด์ ์ฃผ๋ณ ๋จ์ด๋ค์ ์ฌ์ฉ, word embedding์ ํ์ตํ๋ค.
๋ค๋ง, window๋ด์์์ ์์น๋ ๊ณ ๋ คํ์ง ์์ง๋ง ๊ทธ๋ ๋ค๊ณ ์์น์ ๋ณด๋ฅผ ๋ฌด์ํ์ง๋ ์๋๋ค.
์ด๋ window ์์ฒด์ ๋จ์ด์ ์์น์ ๋ณด๋ฅผ ๋ดํฌํ๊ธฐ์ ๊ฐ๋ฅํ ์ผ์ด๋ค.
4.2 CBOW .&. Skip-Gram
๐ CBOW (Continuous Bag Of Words)
- ์ ๊ฒฝ๋ง ์ฃผ๋ณ์ ๋ํ๋๋ ๋จ์ด๋ค์ one-hot encoding๋ ๋ฒกํฐ๋ก ์ ๋ ฅ๋ฐ์
- ์ ๋ ฅ์ ํ ๋๋ก ํด๋น ๋จ์ด๋ฅผ ์์ธก
๐ Skip-Gram
- ๋์ ๋จ์ด๋ฅผ one-hot encoding๋ฒกํฐ๋ก ์ ๋ ฅ์ ๋ฐ์
- ์ ๋ ฅ์ ํ ๋๋ก ์ฃผ๋ณ๋จ์ด๋ค์ ์์ธกํ๋ ์ ๊ฒฝ๋ง์ ๊ตฌ์ฑ, word embedding vector๋ฅผ ํ์ต
- ๋ณดํต CBOW๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋ ๋ ๋๋ฆฌ ์ฌ์ฉ๋จ
4.3 ์์ธ (Skip-Gram) ํ๋ จ๋ฐฉ์
โ MLE๋ฅผ ํตํด ์๋ ์์์ argmax๋ด์ ์์์ ์ต๋ํํ๋ ํ๋ผ๋ฏธํฐ θ๋ฅผ ์ฐพ์.
โก ์ด๋ฅผ ํตํด wt๊ฐ ์ฃผ์ด์ง๋ฉด, ์๋ค n๊ฐ์ ๋จ์ด(wt-(\frac{n}{2}), ... ,wt+(\frac{n}{2}))๋ฅผ ์์ธกํ๋๋ก ํ๋ จ. (window_size=n)
โข one-hot vector๋ฅผ dense vector์ธ word embedding vector๋ก ๋ณํ
โ ์์ ์์์ ๊ทธ๋ฆผ์ผ๋ก ํํํ๋ฉด ์๋์ ๊ฐ๋ค.
์์์์ ๋ณผ ์ ์๋ฏ, ๋งค์ฐ ๊ฐ๋จํ ๊ตฌ์กฐ๋ก softmax๊ณ์ธต์ด ์ถ๋ ฅ์ธต์ด๋ค.
โ ํฅ๋ฏธ๋ก์ด ์ ์ ์ ๊ฒฝ๋ง ๋ด๋ถ์ sigmoid๊ฐ์ ๋น์ ํํจ์๊ฐ ์๋ค๋ ๊ฒ์ด๋ค.
5. GloVe (Global Vectors for word representation)
5.1 ์๊ณ ๋ฆฌ์ฆ
โ word2vec๊ณผ ๊ฐ์ ๋จ์ด์๋ฒ ๋ฉ๋ฐฉ์ ์ค ํ๋์ธ GloVe๋ "๋์ ๋จ์ด์ ๋ํด corpus์ ํจ๊ป ๋ํ๋ ๋จ์ด๋ณ ์ถํ๋น๋๋ฅผ ์์ธก"ํ๋ค.
โ GloVe ์๊ณ ๋ฆฌ์ฆ์ parameter๋ฅผ ๊ตฌํ๋ ์์์ ์๋์ ๊ฐ๋ค.
Skip-Gram์ ์ํ ์ ๊ฒฝ๋ง๊ณผ ๊ฑฐ์ ์ ์ฌํ ํํ์ธ๋ฐ,๋ค๋ง ์ด๋ classification๋ฌธ์ ๊ฐ ์๋
"์ถํ๋น๋๋ฅผ ๊ทผ์ฌํ๋ regression"๋ฌธ์ ์ด๊ธฐ์ MSE๋ฅผ ์ฌ์ฉํ๋ค.
โ๋ง์ฐฌ๊ฐ์ง๋ก ์ํซ๋ฒกํฐ x๋ฅผ ์ ๋ ฅ์ผ๋ก 1๊ฐ์ ์๋์ธต W๋ฅผ ๊ฑฐ์ณ ์ถ๋ ฅ์ธต W'์ ํตํด ์ถ๋ ฅ๋ฒกํฐ๋ฅผ ๋ฐํํ๋๋ฐ,
์ด ์ถ๋ ฅ๋ฒกํฐ๋ ๋จ์ด x์ ํจ๊ป corpus์ ์ถํํ ๋ชจ๋ ๋จ์ด์ ๋์์ถํ๋น๋๋ค์ ๋ํ๋ธ ๋ฒกํฐ Cx๋ฅผ ๊ทผ์ฌํด์ผํ๋ค.
๋ฐ๋ผ์ ์ด ๋์ ์ฐจ์ด๊ฐ์ธ ์์ค์ ์ต์ํํ๋๋ก ์ญ์ ํ ๋ฐ SGD๋ฅผ ํตํด ํ์ตํ ์ ์๋ค.
โ ์ด๋, ๋จ์ด x ์์ฒด์ ์ถํ๋น๋(= prior probability; ์ฌ์ ํ๋ฅ )์ ๋ฐ๋ผ MSE Loss๊ฐ์ด ๋งค์ฐ ๋ฌ๋ผ์ง๋ค.
โ๏ธ Cx๊ฐ ์์ฒด๊ฐ ํด์๋ก ์์ค๊ฐ์ด ๋งค์ฐ ์ปค์ง๊ฒ์ด๊ธฐ ๋๋ฌธ!!
∴ f(x)๋ ๋จ์ด์ ๋น๋์ ๋ฐ๋ผ ์๋์ ๊ฐ์ด ์์คํจ์์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
์ด์ ๊ด๋ จํด GloVe๋ ผ๋ฌธ[https://aclanthology.org/D14-1162.pdf]์์๋ threshold=100, a=3/4์ผ ๋, ์ต์ ์ ๊ฒฐ๊ณผ๋ผ ๋ช ์
5.2 Skip-Gram. vs. GloVe
โ GloVe๋ ์ฒ์์ corpus๋ฅผ ํตํด ๋จ์ด๋ณ ๋์์ถํ๋น๋๋ฅผ ์กฐ์ฌ,
๊ทธ์๋ํ ์ถํ๋น๋ํ๋ ฌ์ ๋ง๋ค๊ณ ์ดํ ํด๋น ํ๋ ฌ์ ํตํด ๋์์ถํ๋น๋๋ฅผ ๊ทผ์ฌํ๋ค.
๋ฐ๋ผ์ corpus ์ ์ฒด๋ฅผ ํ์ผ๋ฉฐ ๋์๋จ์ด์ ์ฃผ๋ณ ๋จ์ด๋ฅผ ๊ฐ์ ธ์ ํ์ตํ๋ ๊ณผ์ ์ ๋ฐ๋ณตํ๋ skip-gram๋ณด๋ค ํจ์ฌ ํ์ต์ด ๋น ๋ฅด๋ค.
๋ํ, skip-gram์ corpus๋ฅผ ํ์ผ๋ฉฐ(windowํน์ฑ) ํ์ตํ๊ธฐ์
์ฌ์ ํ๋ฅ ์ด ๋ฎ์(= ์ถํ๋น๋์์ฒด๊ฐ ์ ์) ๋จ์ด์ ๋ํด์๋ ํ์ต๊ธฐํ๊ฐ ๋ถ์คํ๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก skip-gram์ ๋น๊ต์ ๋ถ์ ํํ ๋จ์ด์๋ฒ ๋ฉ๋ฒกํฐ๋ฅผ ํ์ตํ๊ฒ ๋๋ค.
ํ์ง๋ง GloVe์ ๊ฒฝ์ฐ, skip-gram์ ๋นํด ์ด๋ฐ ๋จ์ ์ด ์ด๋์ ๋ ๋ณด์๋๋ค.
5.3 ์ ๋ฆฌ
GloVe๊ฐ ๊ฐ์ฅ ๋ฐ์ด๋ ๋จ์ด์๋ฒ ๋ฉ๋ฐฉ์์์ ์ฃผ์ฅํ์ง๋ง,
skip-gram์ window_size, learning_rate, epoch์ ๋ฑ hyper-parameter tuning์ ๋ฐ๋ผ ์ฑ๋ฅ์ ์ผ๋ก ํฐ ์ฐจ์ด๊ฐ ์๊ธฐ์
์ ์ ํ ๋ฐฉ์์ ์์คํ ๊ตฌ์ฑ์ ์ ์ฝ์ ๋ฐ๋ผ ์ ํํ๋ ๊ฒ์ด ์ข๋ค.
6. word2vec ์์ (FastText ์คํ์์ค)
6.1 FastText๋ฅผ ํ์ฉํ word embedding ํ์ต
6.2 ์๊ฐํ
์์ ๋ฐฉ๋ฒ์ผ๋ก ์ป์ ๋ฒกํฐ๋ค์ ์๊ฐํ ํด๋ก ์๊ฐํํ๋ฉด ํ๋ จ๊ฒฐ๊ณผ์ ๋ํด ์ฝ๊ฒ ์ดํด๋ณผ ์ ์๋ค.
์์ฝ๊ฒ๋ pytorch๋ ์์ฒด์๊ฐํํด์ ์ ๊ณตํ์ง ์๊ธฐ์ tensorflow์ tensorboard๋ฅผ ํ์ฉํ๋ฉด ์ข์ ์๊ฐํ๊ฐ ๊ฐ๋ฅํ๋ค.
pytorch 1.1 version๋ถํฐ tensorboard๋ฅผ ๊ณต์์ ์ผ๋ก ์ง์ํ๊ธฐ์ ์ฌ์ฉ๊ฐ๋ฅ!!
๋ง์น๋ฉฐ...
์ด์ ์๊ฐ์๋ ํน์ง๋ฒกํฐ๋ฅผ TF-IDF๋ฐฉ์์ผ๋ก ๊ตฌ์ฑํด ์ฌ์ฉํ์ง๋ง, "ํฌ์์ฑ"๋ฌธ์ ๋ฑ์ผ๋ก
์ด๋ฒ์๊ฐ, ์ฐจ์์ถ์์ ๋ํด ์ดํด๋ณด์๋ค.
๊ธฐ์กด์ ์ ํ์ ์ฐจ์์ถ์๋ฐฉ๋ฒ์ ๋นํด Neural Network๋ ๋น์ ํ์ ์ฐจ์์ถ์๋ฅผ ํตํ ํน์ง์ถ์ถ์ด ํจ๊ณผ์ ์ด๊ธฐ์ ๋ฅ๋ฌ๋์ด ๊ธฐ์กด ๋จธ์ ๋ฌ๋๋ณด๋ค ์๋ฑํ ์ฑ๊ณผ๋ฅผ ๋ด๋ ๊ฒ์ ์ ์ ์์๋ค.
ํ์ง๋ง ์ด๋ฐ ๋ฅ๋ฌ๋์ ๋น์ ํ์ ์ฐจ์์ถ์๋ Cost๊ฐ ๋๊ณ ์ต์ ํ๊ฐ ์ด๋ ต๋ค.
์ด๋ฐ ์ ์์ word2vec์ ๋น์ ํ์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ง ์๊ณ ๋ ๋งค์ฐ ์ข์ ๋จ์ด์๋ฒ ๋ฉ๊ตฌํ์ด ๊ฐ๋ฅํ๋ฉฐ
GloVe๋ ๋ ๋น ๋ฅด๊ณ ์ ํํ ๋จ์ด์๋ฒ ๋ฉ๋ฐฉ๋ฒ์ ์ ์ํ์๋ค.
์์ ๋ฐฉ๋ฒ๋ค์ ์ฌ์ฉํ์ฌ ๋จ์ด๊ฐ ์ ์ฌ๋๋ฅผ data๊ธฐ๋ฐ์ผ๋ก ํจ๊ณผ์ ์ด๋ฉด์ ์ ํํ๊ฒ ๊ณ์ฐํ ์ ์๊ฒ ๋์๋ค.
ํ์ง๋ง ์์ผ๋ก ์๊ฐํ text classification, Language generation๊ณผ ๊ฐ์ ๊ธฐ๋ฒ์์๋
์ค๋ ์ค๋ช ํ word embedding algorithm๋ณด๋ค ๋จ์ํ embedding ๊ณ์ธต์ ์ฌ์ฉํ๋ ํธ์ด ๋ ์ ํํ๊ณ ํจ์จ์ ์ด๋ค.
์ด์ , ๋ฌธ์ฅ๋จ์๋ก ์์ฐ์ด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ๋ค์ ๋ํด ๋ณธ๊ฒฉ์ ์ผ๋ก ์์๋ณด์!!