์์์ญํ์ ๊ฐ๋จํ๊ฒ ๊ณต๋ถํ์์์ต๋๋ค. ์ด๋ฅผ ์ด๋์ ๋ ์ดํดํ ๋ค์ ์์์ปดํจํ , ์์AI์ ๋ํด์ ๊ด๋ จ๋ ์ฌ๋ฌ ๋ ผ๋ฌธ๋ค์ ์ฐพ์๋ณด๊ณ ๊ณต๋ถํ์๋๋ฐ, ์์ฐ์ด๋ฅผ ์์์ญํ๊ณผ ์ตํฉํ ๋ ผ๋ฌธ์ด๋ฉด์ ๋์์ NAACL์์ Award๋ฐ์ ๋ ผ๋ฌธ์ด๋ผ ์ฝ๊ฒ ๋์์ต๋๋ค.
Paper Description
- ์ ๋ชฉ : CNM: An Interpretable Complex-valued Network for Matching
- ์ ์ : Li et al.
- Date : 2021.06
- ์ธ์ฉ์ : 53
- Publisher : Association for Computational Linguistics
- Venue : NAACL(North American Chapter of the Association for Computational Linguistics)
- Award : Best Explainable NLP Paper
Abstract
- ์์์ญํ์ ์ํ์ ํ๋ก ์์ฐ์ด ๋ชจ๋ธ๋ง ํด๋ณด์!
- ์์์ญํ์์ ์ ์ค๊ณ๋ ์ํ์ ๊ณต์ ์ฌ์ฉํด์ single complex-valued vector space ์์ ๋ค์ํ ์ธ์ด ๋จ์ ํตํฉ
- ์ด ๋ชจ๋ธ๋ง์ด ํจ๊ณผ์๋์ง ๊ฒ์ฆ ํ๊ธฐ ์ํ CNM(Complex-valued Network for Matching)๊ตฌ์ถ
- ๋ณธ ๋ฐฉ์์ QA Task์์ CNN๊ณผ RNN ์ด๊ธฐ๋ ์ฑ๋ฅ ๋ฌ์ฑํจ
Introduction
Cognition(์ธ์,์ธ์ง)์ ์๋ก์ด ์ฐ๊ตฌ ๋ถ์ผ๋ ์ธ๊ฐ์ ์ธ์ง, ํนํ "์ธ์ด ์ดํด์ ์์ ์ ์ฌ ํ์์ด ์กด์ฌํจ"์ ์์ฌํจ.
๋ฌธ์ฅ์ ์ฌ๋ฌ ๋จ์ด(particles ์
์์ ๊ฐ์)๋ฅผ ๊ฐ์ง ๋ฌผ๋ฆฌ์ ์ธ ์์คํ
์ผ๋ก ์ทจ๊ธ๋ ์ ์์ผ๋ฉฐ, ์ด๋ฌํ ๋จ์ด๋ค์ ์ผ๋ฐ์ ์ผ๋ก ๋ค์์ด(์ค์ฒฉ)์ด๋ฉฐ ์๋ก ์๊ด๊ด๊ณ(์ฝํ)๊ฐ ์์.
<๋ ผ๋ฌธ์์ ์ ์ํ๋ ์ฃผ์ ์ง๋ฌธ 2๊ฐ์ง>
1. ์์ ๋ฌผ๋ฆฌํ์ ์ํ์ ํ๋ก ์์ฐ์ด ๋ชจ๋ธ๋ง์ด ๊ฐ๋ฅํ ๊น?
2. ํ์ค ์ธ๊ณ์ ์์ฐ์ด ์ฒ๋ฆฌ ์๋๋ฆฌ์ค์์ ์์ฐ์ด๋ฅผ complex-valued๋ก Representationํ๋ ๊ฒ benefit ์์๊น?
1๋ฒ ์ง๋ฌธ์ ํ๊ธฐ์ํด์ ์ธ์ด๋ฅผ ๋ชจ๋ธ๋งํ๋ ์๋ก์ด ์์ ์ด๋ก ์ ํ๋ ์์ํฌ๋ฅผ ๊ตฌ์ถํ์๊ณ , ์ด๋ฅผํตํด ์์ฐ์ด์ ์ธ์ง์ ์ธก๋ฉด์์ ์์์ฑ์ ํฌ์ฐฉํ์๋ค๊ณ ํ๋ค.
๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ ์๋ก์ด ์์ ์ด๋ก ์ ํ๋ ์์ํฌ๋ ๊ท ์ผํ ์๋ฏธ๋ก ์ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์์ ์์ ํ๋ฅ ์ ์ฑํํด ์๋ก ๋ค๋ฅธ ์ธ์ด ๋จ์๋ฅผ ์์ ์ํ๋ก ๋ชจ๋ธ๋ง ํ๋ ๊ฒ์ด๋ค.
๋๋ฒ์งธ ์ง๋ฌธ์ ํด๊ฒฐํ๊ธฐ ์ํด ์ธ์ด ๋จ์๋ฅผ ๋ณต์์ ๋ฒกํฐ๋ก ๊ณต์ํํ์๊ณ , ๊ธธ์ด๋ฅผ ๊ฐ ๋จ์ด๊ฐ์ weight, ๋ฐฉํฅ์ ์ค์ฒฉ์ํ๋ก ์ฐ๊ฒฐํ์๋ค๊ณ ํจ.
์ถ๊ฐ์ ์ผ๋ก ์ค์ฒฉ ์ํ๋ ์งํญ ์์ ๋ฐฉ์์ผ๋ก ํํ ๊ฐ๋ฅํ๋ค๊ณ ํ๋๋ฐ, ์ด๋ ์ฃผํ์ ๊ฐ๋ ๊ณผ ํ๋ ๊ฐ๋ ์ ์์์ผ ํ ๋ฏ ํจ.
์ธ์ด์ ์๋ฏธ์ ํด๋นํ๋ ์งํญ๊ณผ, ๊ฐ์ ๊ณผ ๊ฐ์ ๋ ๋์ ์์ค์ ์๋ฏธ์ ์ธก๋ฉด์ ์์์ ์ผ๋ก ๋ฐ์ํ๋ ์์์ผ๋ก ํํ ๊ฐ๋ฅํ๋ค๊ณ ํจ.
๊ทธ๋ฌ๋ฉด์ QA Task์์ ๋ณต์์ ์๋ฒ ๋ฉ์ด ์ผ๋ฐ์ ์ธ ๋จ์ด ์๋ฒ ๋ฉ ๋๋น ์ฐ์ํ ์ฑ๋ฅ์ ๋ฝ์๋ด๋ ๊ฒ์ ํ์ธํ๋ฉด์, ์์ฐ์ด๋ ๋ณต์์๋ก๋ถํฐ ์ด์ ์ ์ป๋๋ค๊ณ ์ฃผ์ฅํจ.
๊ฒฐ๋ก ์ ์ผ๋ก ์ด ๋ ์ง๋ฌธ์ ๋ํด ํจ๊ณผ๋ฅผ ๊ฒ์ฆํ๊ธฐ ์ํด CNM (Complex-valued Network for Matching)์ด๋ผ๋ ๋คํธ์ํฌ๋ฅผ ๊ตฌ์ถํ๊ณ QA Task์์ ๊ฒ์ฆ์ ์งํํจ.
์ถ๊ฐ์ ์ผ๋ก ๋ณธ ๋ ผ๋ฌธ์์๋ RNN๊ณผ CNN ๋ชจ๋ธ๋ค์ด ํ์ฌ QA Task์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๊ณ ํ์๋๋ฐ, ์๋ ๊ธฐ์ค์. ์์ฆ์ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ์ ๋ชจ๋ธ๋ค์ด ๋ง์ด ์ฌ๋ผ์ด. ์ด์จ๋ ์ด๋ฐ RNN๊ณผ CNN ๊ธฐ๋ฐ์ ๋ชจ๋ธ๋ค์ ๋ถํฌ๋ช ํ ๊ตฌ์กฐ์ฌ์ ์ฌ๋๋ค์ด ์ด๋ฅผ ๋ถ์ํ๊ณ ํด์ํ๊ธฐ ์ด๋ ค์. ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ CNM์ ์์์ญํ์์ ์๊ฐ๋ฐ์์ ์์ฐ์ด ๋ชจ๋ธ๋ง์ ํ์๊ณ , ํด์๊ฐ๋ฅ์ฑ๊ณผ ํฌ๋ช ์ฑ์๋ ๋คํธ์ํฌ๋ผ๊ณ ์ฃผ์ฅํ์์. ์ฌํ ํด์ ๊ฐ๋ฅ์ฑ์ ๋ชจ๋ธ์ด ์คํ๋ ํ์ ์ค๋ช ๊ฐ๋ฅํ ๊ฒ์ด๊ณ , ํฌ๋ช ์ฑ์ ๋ชจ๋ธ์ด ์ค๊ณ๋จ๊ณ์์ ์ค๋ช ๊ฐ๋ฅํ ๊ฒ์. ๋๋ค ํตํฉํด์ ๊ทธ๋ฅ ์ค๋ช ๊ฐ๋ฅํ ์ธ๊ณต์ง๋ฅ(XAI)๋ผ๊ณ ๋งํ๋ ๋ฏํจ. ๊ทธ๋์ ์ด ๋ ผ๋ฌธ์ด Explainable award ๋ฐ์ ๋ฏ.
์์์ญํ ๊ธฐ๋ฐ ์์ฐ์ด ๋ชจ๋ธ๋ง
์ผ๋จ ์์์ญํ์ ์๊ธฐ ์ํด์๋ ์ฝํ, ์ค์ฒฉ, ๊ด์ธก ์ด 3๊ฐ์ง๊ฐ ๊ฐ์ฅ ์ค์ํจ.
๋ช ์ฃผ๊ฐ ์ด์ ๊ด๋ จ๋์ ์ฌ๋ฌ ์ ํ๋ธ ์์๊ณผ ๋ ผ๋ฌธ๋ค, ๊ต์ก ๋ธ๋ก๊ทธ ๋ณด๋ฉด์ ์ด๋์ ๋ ๊ณต๋ถํ์.
์ด์ฐ๋๋ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์ ์ด๋ ๊ฒ ํ๋ฉด์์ผ๋ก ๋ณธ๋ค๊ณ ํ์์ ๋, ์๋ฐฉํฅ๊ณผ ์ค๋ฅธ์ชฝ๋ฐฉํฅ์ ํ๋น์ด ์๋ฒฝํ๊ฒ 1์ผ ํ๋ฅ , 0์ผ ํ๋ฅ ์ ๋ํ๋ด๋ Basis State์. ๊ทธ๋ฌ๋ฉด ์ด ์ฌ์ด์ ์๋ ํ๋น์ ์ค์ฒฉ ์ํ์ธ ๊ฒ์.
์ด์ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Mixed State๋ฅผ ์์์ผํ๋๋ฐ, ์์ ์ํ๋ฅผ ์์ ํ ์๋ฉด Pure State๋ผ๊ณ ํ๊ณ , ์์ ์ํ๋ฅผ ์์ ํ ๋ชจ๋ฅด๋ฉด Mixed State๋ผ๊ณ ๋งํ๋ค๊ณ ํจ.
์ฌ๋ฌ ์์๋ค์ Ensembleํ๋ฉด ํ๋ฉด์ ์ผ๋ก๋ 0์ด๋ค 1์ด๋ค ์์ ์์ง๋ง, ๋ด๋ถ์ ์ผ๋ก ์์๋ค์ด ๋ฌด์จ ์ํ์ธ์ง๋ ์ ์ ์๋ค๊ณ ํจ.
๊ทธ๋์ ์ด๋ฐ Mixed State๋ Density matrix๋ผ๊ณ ๋ฐ๋ ํ๋ ฌ๋ก ํํํ๋ค๊ณ ํจ.
๋ฐ๋ ํ๋ ฌ์ ๋๊ฐํฉ์ด 1์ธ ์๋ฅด๋ฏธํธ ํ๋ ฌ์ด๋ฉฐ ๋ค๋ฅธ๋ง๋ก ๋ณต์์ ์ ์ฌ๊ฐ ํ๋ ฌ์ด๋ผ๊ณ ํจ.
์ํค๋ฐฑ๊ณผ๋ฅผ ๋ณด๋ฉด ์ด๋ฐ ๋ฐ๋ํ๋ ฌ์ ์์๋ธ์ ๊ณ ๋ คํ๊ฑฐ๋ ๊ณ์ ์ด์ ํ์ ์ด ๋ถํ์ ํด์ ๊ณ๊ฐ ์ด๋ค ์์ํ ์์์ํ์ ๋์ฌ์๋์ง ํ์คํ๊ฒ ๋ชจ๋ฅผ ๋ ์ฐ๋ ํต๊ณ์ ์ธ ํํ์ด๋ผ๊ณ ํจ.
์ ์ด์ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์์ ์๋งจํฑ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์ผ๋ก ๋์ด์ต๋๋ค. ์๋ฏธ๋ก ์ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์ Sememes์ orthogonal basis ์ํ์ ์ํด ํ์ฅ๋๋ค๊ณ ๊ฐ์ ํ๋ค ํฉ๋๋ค. ์ด๊ฒ ๋ฌด์จ๋ง์ด๋๋ฉด, ์๋ฅผ ๋ค์ด์ husband๋ผ๋ ๋จ์ด๊ฐ ์์ ๋, ์ผ์ชฝ์ฒ๋ผ ๋ช ์ฌ๋ก๋ ๋จํธ, ๋์ฌ๋ก๋ ์ ์ฝํ๋ค ๋ผ๋ ๋ป์ด ์์ต๋๋ค. ์ด ๋จ์ด๋ ๋๊ฐ์ sense๋ก ๋๋ฉ๋๋ค. ํ๋๋ ๊ฒฐํผํ ๋จ์, ๋ฐ๋ํธ์ ์กฐ์ฌํ ์ฌ์ฉํ๋ค ์ฆ ์ ์ฝํ๋ค. ์ด๋ค์ ๋ ๋๋๋ฉด ๊ฒฐํผํ ๋จ์๋ ์ฌ๋์ด์, ๊ฐ์กฑ, ๋จ์, ๋ฐฐ์ฐ์์ด๋ฉฐ, ๋ฐ๋ํธ์ ์ ์ฝํ๋ค๋ฅผ ๋ปํ๋ economize ์.
์ฆ, Sememe๋ผ๋ ๊ฒ์ ์๋ฏธ์ ์ต์ ๋จ์๋ฅผ ๋ปํ๋ ๊ฒ์ด๋ฉฐ, Word๋ Sememe์ ์ค์ฒฉ ์ํ๋ก ๊ตฌ์ฑ๋๋ ๊ฒ์.
๊ทธ๋ฆผ์ ๋ณด๋ฉด Words๊ฐ ์์ฃ . ๋จ์ด๋ค. ์ฆ ๋ฌธ์ฅ์ ๋ปํ๋ ๊ฒ๋๋ค. ๋ฌธ์ฅ์์ ์๋ ํ๋ํ๋์ ๋จ์ด๋ค์ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์ ๋งค์นญ์ํค๋ฉด ๊ฐ๊ฐ์ ๋จ์ด ๋ฐฑํฐ๊ฐ ์์ ๊ฑฐ๊ณ , ์ด๋ค์ ์๊น ๋งํ ํ์คํ ์ ์ ์๋ Pure States์ ์กด์ฌํฉ๋๋ค.
์ด๋ฐ ๋จ์ด ๋ฐฑํฐ๋ค์ ์๋ฏธ๋ก ์ ์ผ๋ก ํ๋๋ก ํฉ์ณ๋ฒ๋ฆฌ๋ฉด ์ด๋ค์ ์ค์ฒฉ์ํ๊ฐ ๋ ๊ฒ์ด๊ณ , ์ด๋ ๊ณณ Mixed State์ ์กด์ฌํฉ๋๋ค.
์ด๋ฐ Mixed State๋ ๋ฐ๋ํ๋ ฌ p๋ก ํํ์ด ๊ฐ๋ฅํ๋ฐ ์์ ์์์ m์ ๋ฌธ์ฅ์์์ ๋จ์ด ๊ฐ์์ด๊ณ , ์ค๋ฅธ์ชฝ์ ์ค์ฒฉ์ํ๋ฅผ ์๋ฏธํฉ๋๋ค.
์ด๋ฐ ์ค์ฒฉ ์ํ์ mixed state์์๋ high level semantic features๋ฅผ ๊ด์ธกํ ์ ์๋ค๊ณ ํ๋๋ฐ, ์ด๋ฅผ Semantic Measurements๋ผ๊ณ ํฉ๋๋ค.
์๋ฒฝํ๊ฒ ์ด ์์์ ์ดํดํ์ง ๋ชปํ๋๋ฐ ์ ๊ฐ ํด์ํ๊ธฐ๋ก , ์ด๋ฐ ์ค์ฒฉ์ํ์ ์๋ ๊ฐ์ ๊ด์ธก ํ ๋๋ง๋ค ์ด๋ ํ ๊ฐ์ผ๋ก ์๋ ด๋ ๊ฒ์ด๊ณ , ์ด ์๋ ด๋ ๊ฐ์ Pure States์ ์กด์ฌํ๋ฉฐ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์์์ word ํ๋์ ๊ตญํ๋์ง ์๋๋ค๋ ์๋ฏธ๋ก ํด์ํ์์ต๋๋ค.
๊ทธ๋ฌ๊ณ ์๋ค๋ค์ ์ฌ์ฉํด์ ํ๋ฅ ๊ฐ์ ์ป๋๋ฐ ์ด๋ ์ค๋ฅธ์ชฝ์ Gleason์ ์ด๋ก ๋ฐฉ์ ์์ ์ฌ์ฉํด์ ๊ตฌํ๋ค๊ณ ํฉ๋๋ค.
์ด๊ฒ ๋ ผ๋ฌธ์์ ์ ์ํ๋ CNM ๋คํธ์ํฌ์ ์ ์ฒด์ ์ธ ๊ตฌ์กฐ์ ๋๋ค.
์ฒ์ ๋ดค์๋ ์ง์ง ์ดํด์๊ฐ๊ณ ๋์ ์ฒ์๋ณด๋ ์ค๊ณ๋ ๊ฐ์์ต๋๋ค. ์ด๊ฒ ์ ์ ํ๋ก์ชฝ์ด ํฉ์ณ์ง๋ค ๋ณด๋ ๊ทธ๋ฆผ์ ์ด๋ ๊ฒ ํํํ๋ ๊ฒ ๊ฐ์ต๋๋ค.
๊ทธ๋์ ์ดํดํ๊ธฐ ์ฝ๊ฒ ๋ฐฉ๊ธ ์ ์ ์ค๋ช ํ๋ ๊ทธ๋ฆผ์ผ๋ก ๋งค์นญ์ ํด๋ณด์๋ฉด, ์๋ฒ ๋ฉ ๊ฐ์ ๊ฒฝ์ฐ์๋ ๋ฌธ์ฅ์์์ ๋จ์ด๋ค์ ๊ฐ๊ฐ์ ๋ฒกํฐ๋ก ๋งค์นญํ์ฌ Pure States์ ์กด์ฌํ๊ฒ ์๋ฒ ๋ฉํ๋ ๊ฒ์ด๊ณ ,
Mixture๊ฐ์ ๊ฒฝ์ฐ๋ ์ด Pure States์ ์กด์ฌํ๋ ๋จ์ด๋ค์ ๊ฐ๊ฐ ๋ฌถ์ด์ ์ค์ฒฉ์ํ๋ก ๋ง๋ค์ด Mixed State๋ก ๋งค์นญ์ํค๊ณ ์ด๋ฅผ ๋ฐ๋ํ๋ ฌ๋ก ํํํ๋ ๊ฒ ๊ฐ์ต๋๋ค.
Measurement๋ ์ด Mixture์์์ Mixed State์ ์๋ ๊ฐ๊ฐ์ ๋ฒกํฐ๊ฐ๋ค์ ๊ด์ธกํด์ ํ์ด๋ ๋ฒจ ์๋ฏธ๋ก ์ ํผ์ณ๊ฐ๋ค์ ๋ฝ์๋ธ ๋ค์, ๊ฐ๊ฐ์ ๋ฐ๋ํ๋ ฌ๋ค๊ณผ Gleason ๋ฐฉ์ ์์ ํตํด ํ๋ฅ ์ ๋ฝ์๋ด๊ณ , ์ด๋ค์ ์ ์ถ๋ ฅ ์ฐจ์์ ๋ง์ถฐ์ฃผ๊ณ poolingํ๊ณ ๊ณ์ฐํด์ output๊ฐ์ด ๋์ค๋๋ก ํ๋ ๋คํธ์ํฌ์ธ ๋ฏ ํฉ๋๋ค.
์์์ด ์์ฒญ ๋ง์๋ฐ, ์ดํดํ๊ธฐ ์ฝ๊ฒ ๊ฑฐ์ ์ฌ์ฉํ์ง ์๊ณ ์ค๋ช ํ์์ต๋๋ค. ๋ฌผ๋ฆฌํ ์ ๊ณต์ด ์๋์ฌ์ ํฌ์๊ฐ์ ๊ฐ๋ ์ด ๋จ๊ธฐ๊ฐ ๋ด์ ํ์ตํ ์ ์์ด๋ณด์ด์ง ์์ต๋๋ค..
์ด์ฐ๋๋ ์ด๋ฐ ๋ฉ์ปค๋์ฆ์ ํตํด์ QA Task๋ฅผ ํ์ด๋ณด๋ CNN๊ณผ RNN ๊ธฐ๋ฐ์ ๋ชจ๋ธ๋ค์ ๋นํด ์์ฃผ ์ด์ง ๋์ ์ฑ๋ฅ์ ์ป์ ๊ฒ์ ํ์ธํ ์ ์์์ต๋๋ค.
์ฌ๊ธฐ์ MAP์ MRR ์ฑ๋ฅ์งํ๋, ์ฐ์ ์์์ ๋ํ ์ ํ์ฑ์ ํ๋จํ๋ ์ฑ๋ฅ์งํ๋ผ๊ณ ํฉ๋๋ค. ์ด๋ ์ถ์ฒ์์คํ ์์ ๋ง์ด ์ฐ๋ ์ฑ๋ฅ์งํ๋ผ๊ณ ํ๋๋ฐ ์ ํ๋, ์ ๋ฐ๋, ์ฌํ์จ์ ์ ๋ฐ์ ์ธ ์ ๋ณด๊ฒ์(Information Retrieval) ์ฑ๋ฅ ํ๊ฐ๊ฐ ๊ฐ๋ฅํ์ง๋ง Rank์ ๋ํด์๋ ๊ณ ๋ คํ์ง ์๊ธฐ์ ์ด๋ฅผ ์ด๋ค๊ณ ํฉ๋๋ค.
๋ฐ์ดํฐ์ ์ ๋ณด์๋ฉด ์ด๋ฐ์์ผ๋ก ๋์ด์์ต๋๋ค. ์ฐธ๊ณ ํ๋ฉด ๋ ๋ฏํฉ๋๋ค.
๊ทผ๋ฐ ์ด๊ฒ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด ์๊ฒ ์ง๋ง ์ ์๋ฏธํ๊ฒ ๋์ ์ฑ๋ฅ์ ์๋๋๋ค. ์ฌ๊ธฐ์๋ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๋ ๊ธฐ์ ์ด๋ค๊ฐ ์ค์ ์ด ์๋๋ผ, ์์๋ฅผ ์ค์์ ํฉ๋๋ค. ๋ ผ์๋ฅผ ๋ณด์๋ฉด ์ฒซ๋ฒ์งธ๋ก ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ ํ๋ ์์ํฌ๋ ํฌ๋ช ์ฑ์๋ค๊ณ ํฉ๋๋ค. ๋จ์ผ ๋ณต์์ ๋ฒกํฐ ๊ณต๊ฐ์์ ๋ง์ ์๋ฏธ ๋จ์๋ฅผ ํตํฉํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ํ๋ จ ๊ฐ๋ฅํ ํฌ์ ์ธก์ ์ด ๋จ์ด, ๋ฌธ์ฅ์ ๋ํ ๋์ ์์ค์ ํํ์ ์ถ์ถํ๋ค๊ณ ํฉ๋๋ค.
์์ ํ๋ฅผ ๋ณด๋ฉด, ํ์ค์ธ๊ณ์์์ Sememe์ word, Abstraction ๋ฅผ ์์์ญํ ์ธ๊ณ์ ๋งค์นญํ๋ค๋ ๊ฒ์ด ์ฒซ๋ฒ์งธ ์์์ ๋๋ค.
๋๋ฒ์งธ๋ ํด์๊ฐ๋ฅ์ฑ์ ๋๋ค. ๋จ์ด ๊ฐ์ค์น ์ฒด๊ณ ๋ฉด์์ ๋ณด์๋ฉด, ๊ฐ์ฅ ์ค์ํ ์์ 50๊ฐ ๋จ์ด, ํ์ 50๊ฐ ๋จ์ด์ ๊ฐ์ค์น๋ฅผ ๋ฝ์๋ณด์์ ๋, ์ค์ํ ๋จ์ด๋ ํน์ ์ฃผ์ ์ ๋ํ ๊ฒ๋ค, ํน์ ๊ณ ์ ๋ช ์ฌ๋ฅผ ์ค์ํ๋ค ํ๋จํ์๊ณ , ์ค์ํ์ง ์์ ๋จ์ด๋ ์๋ฏธ์๋ ์ซ์๋ ๋๋ฌด ๋ง์ด ์ฐ์ด๋ ๋จ์ด๋ค์ ์ ํํ์๋ค๊ณ ํฉ๋๋ค.
ํด์ ๊ฐ๋ฅ์ฑ์ ๋๋ฒ์งธ๋ก๋ ๋งค์นญ ํจํด์ธ๋ฐ, ๊ฐ ๋จ์ด์ ๋ํด ์๋์ ์ธ ๊ฐ์ค์น๋ฅผ ์๊ฐํ ํ์ ๋ ์๋ฏธ๋ก ์ ํ๋ฒ ๋ฅดํธ ๊ณต๊ฐ์์ ๋จ์ด๋ฅผ ์ ์ฌํ ๋จ์ด๋ก ๋์ฒดํ๋ ๊ฒ์ด ๊ฐ๋ ฅํ๋ค๊ณ ํ๋ฉฐ, ๊ฒฝํ์ ์ธ ๊ด์ ์์ ํน์ ์ผ์น ํจํด์ด ๋ฌธ์ฅ ์๋ฏธ์ ์ค์ํ ์ํฉ์์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค (RNN, CNN) ์ ๋ฅ๊ฐํ๋ค๊ณ ํฉ๋๋ค. [ ]๋ N๊ทธ๋จ ์๋์ฐ ๊ฒฝ๊ฒ์ด๋ฉฐ, ์์ด ์งํ ์๋ก weight๊ฐ ํฐ ๊ฒ ์ ๋๋ค. Local ๋ฉด์์ ๋ณด์๋ฉด Qustion๊ณผ Answer์ ์ ๋งค์นญํ๋ค๊ณ ํ๋ ๊ฒ ๊ฐ์ต๋๋ค.
์ฌํ ํด์ ๊ฐ๋ฅ์ฑ์ ์ธ๋ฒ์งธ๋ ์ฐจ๋ณ์ ์ธ Semantic Measurements ๋ผ๊ณ ํฉ๋๋ค.
TREC QA ๋ฐ์ดํฐ์ ์์ 10๊ฐ์ Measurements๋ฅผ ๋ฝ๊ณ ์ด ์ค์์ ๋๋ค์ผ๋ก 5๊ฐ๋ฅผ ์ ํํด์ ์์ ๋ก ๋ณด์ฌ์ฃผ๋๋ฐ,
๋๋ค์ผ๋ก ์ ํ๋ 5๊ฐ์ Measurements์์ ๊ฐ์ฅ ์ ์ฌํ ๋จ์ด์ ์ผ๋ถ๋ค์ ๋ณด์ฌ์ค ํ๋ผ๊ณ ํฉ๋๋ค.
์์ชฝ์ ์์น, ์ด๋ ๋์ฌ, ์ฌ๋์ด๋ฆ์ ๊ดํ ๋จ์ด๋ค์ด๊ณ
์๋์ชฝ์ ์ญ์ฌ์ rebellion์ ๊ดํ ๋ด์ฉ์ด์๋ค๊ณ ํฉ๋๋ค.
์ด๋ฅผ ๋ณด์์, ์ธก์ ๊ฐ์ ๋ํ ๋ช ํํ ์ค๋ช ์ ์๋์ง๋ง, ์ธก์ ๊ฐ์ ๋ํด ๋๋ต์ ์ธ ์๋ฏธ๋ฅผ ์ดํดํ ์ ์๋ค๊ณ ํฉ๋๋ค.
์ ๊ฐ ์ดํดํ ๊ฒ์ ์ฝ๊ฒ ๋งํ์๋ฉด, ์์์ญํ์ ํ๋ ์์ํฌ์์ ๋ญ๊ฐ ์๋๋ฐ ์ด๋ฅผ ๋ฝ์์ ๋ ๊ทธ๊ฒ ๋ญ์ง ์ ํํ ์ค๋ช ์ ์๋๋ค๋ง, ์ ์ฌํ ๋จ์ด๋ค์ ์ถ๋ ฅํด๋ณผ ์ ์๊ณ , ์ด๋ฅผ ํตํด Measurement ๊ฐ์ ์ถ์ ๊ฐ๋ฅํ๋ค๊ณ ํ๋ ๋ฏ ํฉ๋๋ค.
๊ฒฐ๋ก ์ผ๋ก ๊ฐ์, ์ฒ์์ ์ ์ํ ๋๊ฐ์ง ์ง๋ฌธ์ ๋ํด ํด๋ต์ ์ป์ ์ ์์๊ณ , ์ถ๊ฐ์ ์ผ๋ก ๋๊ฐ์ง๋ฅผ ๋ ๋ณด์ฌ์ฃผ์์.
์ด ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๋ ์์AI, ์์์ปดํจํ ์์ ์์ฐ์ด์ฒ๋ผ ์๋ฏธ๋ก ์ ์ผ๋ก ์ค์ฒฉ ์ํ๊ฐ ๋ ์ ์๋ ๊ฐ๋ ์ ์ธ์ฝ๋ฉ, ์๋ฒ ๋ฉ ํ๋ ์์ด๋์ด ๊ด์ฐฎ์๋ณด์. ๊ทผ๋ฐ ์ด๊ฒ ๋ฌผ๋ฆฌํ ๊ฐ๋ ์ด ๋๋ฌด ๊ฐํด์ ์ด๋ฐ ์์์ ์ดํดํ๊ณ ๊ตฌํํ ์ ์๋ ๊ฒ์ด ๊ด๊ฑด์ธ ๋ฏ ํจ.