์–‘์ž์—ญํ•™์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ๊ณต๋ถ€ํ•˜์˜€์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์–ด๋Š์ •๋„ ์ดํ•ดํ•œ ๋‹ค์Œ ์–‘์ž์ปดํ“จํŒ…, ์–‘์žAI์— ๋Œ€ํ•ด์„œ ๊ด€๋ จ๋œ ์—ฌ๋Ÿฌ ๋…ผ๋ฌธ๋“ค์„ ์ฐพ์•„๋ณด๊ณ  ๊ณต๋ถ€ํ•˜์˜€๋Š”๋ฐ, ์ž์—ฐ์–ด๋ฅผ ์–‘์ž์—ญํ•™๊ณผ ์œตํ•ฉํ•œ ๋…ผ๋ฌธ์ด๋ฉด์„œ ๋™์‹œ์— NAACL์—์„œ Award๋ฐ›์€ ๋…ผ๋ฌธ์ด๋ผ ์ฝ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

Paper Description

  • ์ œ๋ชฉ : CNM: An Interpretable Complex-valued Network for Matching
  • ์ €์ž : Li et al.
  • Date : 2021.06
  • ์ธ์šฉ์ˆ˜ :  53
  • Publisher : Association for Computational Linguistics
  • Venue : NAACL(North American Chapter of the Association for Computational Linguistics)
  • Award : Best Explainable NLP Paper

 

Abstract

  • ์–‘์ž์—ญํ•™์˜ ์ˆ˜ํ•™์  ํ‹€๋กœ ์ž์—ฐ์–ด ๋ชจ๋ธ๋ง ํ•ด๋ณด์ž!
  • ์–‘์ž์—ญํ•™์—์„œ ์ž˜ ์„ค๊ณ„๋œ ์ˆ˜ํ•™์  ๊ณต์‹ ์‚ฌ์šฉํ•ด์„œ single complex-valued vector space ์—์„œ ๋‹ค์–‘ํ•œ ์–ธ์–ด ๋‹จ์œ„ ํ†ตํ•ฉ
  • ์ด ๋ชจ๋ธ๋ง์ด ํšจ๊ณผ์žˆ๋Š”์ง€ ๊ฒ€์ฆ ํ•˜๊ธฐ ์œ„ํ•œ CNM(Complex-valued Network for Matching)๊ตฌ์ถ•
  • ๋ณธ ๋ฐฉ์•ˆ์€  QA Task์—์„œ CNN๊ณผ RNN ์ด๊ธฐ๋Š” ์„ฑ๋Šฅ ๋‹ฌ์„ฑํ•จ

 

 

Introduction

Cognition(์ธ์‹,์ธ์ง€)์˜ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋ถ„์•ผ๋Š” ์ธ๊ฐ„์˜ ์ธ์ง€, ํŠนํžˆ "์–ธ์–ด ์ดํ•ด์— ์–‘์ž ์œ ์‚ฌ ํ˜„์ƒ์ด ์กด์žฌํ•จ"์„ ์‹œ์‚ฌํ•จ.
๋ฌธ์žฅ์€ ์—ฌ๋Ÿฌ ๋‹จ์–ด(particles ์ž…์ž์™€ ๊ฐ™์€)๋ฅผ ๊ฐ€์ง„ ๋ฌผ๋ฆฌ์ ์ธ ์‹œ์Šคํ…œ์œผ๋กœ ์ทจ๊ธ‰๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Ÿฌํ•œ ๋‹จ์–ด๋“ค์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋‹ค์˜์–ด(์ค‘์ฒฉ)์ด๋ฉฐ ์„œ๋กœ ์ƒ๊ด€๊ด€๊ณ„(์–ฝํž˜)๊ฐ€ ์žˆ์Œ.

 

<๋…ผ๋ฌธ์—์„œ ์ œ์‹œํ•˜๋Š” ์ฃผ์š” ์งˆ๋ฌธ 2๊ฐ€์ง€>

1. ์–‘์ž ๋ฌผ๋ฆฌํ•™์˜ ์ˆ˜ํ•™์  ํ‹€๋กœ ์ž์—ฐ์–ด ๋ชจ๋ธ๋ง์ด ๊ฐ€๋Šฅํ• ๊นŒ?

2. ํ˜„์‹ค ์„ธ๊ณ„์˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์ž์—ฐ์–ด๋ฅผ complex-valued๋กœ Representationํ•˜๋Š” ๊ฒŒ benefit ์žˆ์„๊นŒ?

1๋ฒˆ ์งˆ๋ฌธ์„ ํ’€๊ธฐ์œ„ํ•ด์„œ ์–ธ์–ด๋ฅผ ๋ชจ๋ธ๋งํ•˜๋Š” ์ƒˆ๋กœ์šด ์–‘์ž ์ด๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜์˜€๊ณ , ์ด๋ฅผํ†ตํ•ด ์ž์—ฐ์–ด์˜ ์ธ์ง€์  ์ธก๋ฉด์—์„œ ์–‘์ž์„ฑ์„ ํฌ์ฐฉํ•˜์˜€๋‹ค๊ณ  ํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์—์„œ ์ œ์‹œํ•˜๋Š” ์ƒˆ๋กœ์šด ์–‘์ž ์ด๋ก ์  ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๊ท ์ผํ•œ ์˜๋ฏธ๋ก ์  ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์—์„œ ์–‘์ž ํ™•๋ฅ ์„ ์ฑ„ํƒํ•ด ์„œ๋กœ ๋‹ค๋ฅธ ์–ธ์–ด ๋‹จ์œ„๋ฅผ ์–‘์ž ์ƒํƒœ๋กœ ๋ชจ๋ธ๋ง ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

๋‘๋ฒˆ์งธ ์งˆ๋ฌธ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์–ธ์–ด ๋‹จ์œ„๋ฅผ ๋ณต์†Œ์ˆ˜ ๋ฒกํ„ฐ๋กœ ๊ณต์‹ํ™”ํ•˜์˜€๊ณ , ๊ธธ์ด๋ฅผ ๊ฐ ๋‹จ์–ด๊ฐ„์˜ weight, ๋ฐฉํ–ฅ์„ ์ค‘์ฒฉ์ƒํƒœ๋กœ ์—ฐ๊ฒฐํ•˜์˜€๋‹ค๊ณ  ํ•จ.

์ถ”๊ฐ€์ ์œผ๋กœ ์ค‘์ฒฉ ์ƒํƒœ๋Š” ์ง„ํญ ์œ„์ƒ ๋ฐฉ์‹์œผ๋กœ ํ‘œํ˜„ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ํ•˜๋Š”๋ฐ, ์ด๋Š” ์ฃผํŒŒ์ˆ˜ ๊ฐœ๋…๊ณผ ํŒŒ๋™ ๊ฐœ๋…์„ ์•Œ์•„์•ผ ํ• ๋“ฏ ํ•จ.

์–ธ์–ด์  ์˜๋ฏธ์— ํ•ด๋‹นํ•˜๋Š” ์ง„ํญ๊ณผ, ๊ฐ์ •๊ณผ ๊ฐ™์€ ๋” ๋†’์€ ์ˆ˜์ค€์˜ ์˜๋ฏธ์  ์ธก๋ฉด์„ ์•”์‹œ์ ์œผ๋กœ ๋ฐ˜์˜ํ•˜๋Š” ์œ„์ƒ์œผ๋กœ ํ‘œํ˜„ ๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ํ•จ.

๊ทธ๋Ÿฌ๋ฉด์„œ QA Task์—์„œ ๋ณต์†Œ์ˆ˜ ์ž„๋ฒ ๋”ฉ์ด ์ผ๋ฐ˜์ ์ธ ๋‹จ์–ด ์ž„๋ฒ ๋”ฉ ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฝ‘์•„๋‚ด๋Š” ๊ฒƒ์„ ํ™•์ธํ•˜๋ฉด์„œ, ์ž์—ฐ์–ด๋Š” ๋ณต์†Œ์ˆ˜๋กœ๋ถ€ํ„ฐ ์ด์ ์„ ์–ป๋Š”๋‹ค๊ณ  ์ฃผ์žฅํ•จ.

๊ฒฐ๋ก ์ ์œผ๋กœ ์ด ๋‘ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด CNM (Complex-valued Network for Matching)์ด๋ผ๋Š” ๋„คํŠธ์›Œํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ  QA Task์—์„œ ๊ฒ€์ฆ์„ ์ง„ํ–‰ํ•จ.

์ถ”๊ฐ€์ ์œผ๋กœ ๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” RNN๊ณผ CNN ๋ชจ๋ธ๋“ค์ด ํ˜„์žฌ QA Task์—์„œ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค๊ณ  ํ•˜์˜€๋Š”๋ฐ, ์˜›๋‚  ๊ธฐ์ค€์ž„. ์š”์ฆ˜์€ ํŠธ๋žœ์Šคํฌ๋จธ ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ๋“ค์ด ๋งŽ์ด ์˜ฌ๋ผ์˜ด. ์–ด์จŒ๋“  ์ด๋Ÿฐ RNN๊ณผ CNN ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ๋“ค์€ ๋ถˆํˆฌ๋ช…ํ•œ ๊ตฌ์กฐ์—ฌ์„œ ์‚ฌ๋žŒ๋“ค์ด ์ด๋ฅผ ๋ถ„์„ํ•˜๊ณ  ํ•ด์„ํ•˜๊ธฐ ์–ด๋ ค์›€. ๋ณธ ๋…ผ๋ฌธ์—์„œ ์ œ์‹œํ•˜๋Š” CNM์€ ์–‘์ž์—ญํ•™์—์„œ ์˜๊ฐ๋ฐ›์•„์„œ ์ž์—ฐ์–ด ๋ชจ๋ธ๋ง์„ ํ•˜์˜€๊ณ , ํ•ด์„๊ฐ€๋Šฅ์„ฑ๊ณผ ํˆฌ๋ช…์„ฑ์žˆ๋Š” ๋„คํŠธ์›Œํฌ๋ผ๊ณ  ์ฃผ์žฅํ•˜์˜€์Œ. ์‚ฌํ›„ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์€ ๋ชจ๋ธ์ด ์‹คํ–‰๋œ ํ›„์— ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ๊ฒƒ์ด๊ณ , ํˆฌ๋ช…์„ฑ์€ ๋ชจ๋ธ์ด ์„ค๊ณ„๋‹จ๊ณ„์—์„œ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ๊ฒƒ์ž„. ๋‘˜๋‹ค ํ†ตํ•ฉํ•ด์„œ ๊ทธ๋ƒฅ ์„ค๋ช…๊ฐ€๋Šฅํ•œ ์ธ๊ณต์ง€๋Šฅ(XAI)๋ผ๊ณ  ๋งํ•˜๋Š” ๋“ฏํ•จ. ๊ทธ๋ž˜์„œ ์ด ๋…ผ๋ฌธ์ด Explainable award ๋ฐ›์€ ๋“ฏ.

 

์–‘์ž์—ญํ•™ ๊ธฐ๋ฐ˜ ์ž์—ฐ์–ด ๋ชจ๋ธ๋ง

์ผ๋‹จ ์–‘์ž์—ญํ•™์„ ์•Œ๊ธฐ ์œ„ํ•ด์„œ๋Š” ์–ฝํž˜, ์ค‘์ฒฉ, ๊ด€์ธก ์ด 3๊ฐ€์ง€๊ฐ€ ๊ฐ€์žฅ ์ค‘์š”ํ•จ.

๋ช‡ ์ฃผ๊ฐ„ ์ด์™€ ๊ด€๋ จ๋˜์„œ ์—ฌ๋Ÿฌ ์œ ํŠœ๋ธŒ ์˜์ƒ๊ณผ ๋…ผ๋ฌธ๋“ค, ๊ต์œก ๋ธ”๋กœ๊ทธ ๋ณด๋ฉด์„œ ์–ด๋Š์ •๋„ ๊ณต๋ถ€ํ–ˆ์Œ.

์–ด์ฐŒ๋๋“  ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์„ ์ด๋ ‡๊ฒŒ ํ‰๋ฉด์ƒ์œผ๋กœ ๋ณธ๋‹ค๊ณ  ํ•˜์˜€์„ ๋•Œ, ์œ—๋ฐฉํ–ฅ๊ณผ ์˜ค๋ฅธ์ชฝ๋ฐฉํ–ฅ์€ ํ๋น—์ด ์™„๋ฒฝํ•˜๊ฒŒ 1์ผ ํ™•๋ฅ , 0์ผ ํ™•๋ฅ ์„ ๋‚˜ํƒ€๋‚ด๋Š”  Basis State์ž„. ๊ทธ๋Ÿฌ๋ฉด ์ด ์‚ฌ์ด์— ์žˆ๋Š” ํ๋น—์€ ์ค‘์ฒฉ ์ƒํƒœ์ธ ๊ฒƒ์ž„.

์ด์ œ ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ Mixed State๋ฅผ ์•Œ์•„์•ผํ•˜๋Š”๋ฐ, ์–‘์ž ์ƒํƒœ๋ฅผ ์™„์ „ํžˆ ์•Œ๋ฉด Pure State๋ผ๊ณ  ํ•˜๊ณ , ์–‘์ž ์ƒํƒœ๋ฅผ ์™„์ „ํžˆ ๋ชจ๋ฅด๋ฉด Mixed State๋ผ๊ณ  ๋งํ•œ๋‹ค๊ณ  ํ•จ.

์—ฌ๋Ÿฌ ์–‘์ž๋“ค์„ Ensembleํ•˜๋ฉด ํ‘œ๋ฉด์ ์œผ๋กœ๋Š” 0์ด๋‹ค 1์ด๋‹ค ์•Œ์ˆ˜ ์žˆ์ง€๋งŒ, ๋‚ด๋ถ€์ ์œผ๋กœ ์–‘์ž๋“ค์ด ๋ฌด์Šจ ์ƒํƒœ์ธ์ง€๋Š” ์•Œ ์ˆ˜ ์—†๋‹ค๊ณ  ํ•จ.

๊ทธ๋ž˜์„œ ์ด๋Ÿฐ Mixed State๋Š” Density matrix๋ผ๊ณ  ๋ฐ€๋„ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„ํ•œ๋‹ค๊ณ  ํ•จ.

๋ฐ€๋„ ํ–‰๋ ฌ์€ ๋Œ€๊ฐํ•ฉ์ด 1์ธ ์—๋ฅด๋ฏธํŠธ ํ–‰๋ ฌ์ด๋ฉฐ ๋‹ค๋ฅธ๋ง๋กœ ๋ณต์†Œ์ˆ˜ ์ •์‚ฌ๊ฐ ํ–‰๋ ฌ์ด๋ผ๊ณ  ํ•จ.

์œ„ํ‚ค๋ฐฑ๊ณผ๋ฅผ ๋ณด๋ฉด ์ด๋Ÿฐ ๋ฐ€๋„ํ–‰๋ ฌ์€ ์•™์ƒ๋ธ”์„ ๊ณ ๋ คํ•˜๊ฑฐ๋‚˜ ๊ณ„์˜ ์ด์ „ ํ–‰์ ์ด ๋ถˆํ™•์ •ํ•ด์„œ ๊ณ„๊ฐ€ ์–ด๋–ค ์ˆœ์ˆ˜ํ•œ ์–‘์ž์ƒํƒœ์— ๋†“์—ฌ์žˆ๋Š”์ง€ ํ™•์‹คํ•˜๊ฒŒ ๋ชจ๋ฅผ ๋•Œ ์“ฐ๋Š” ํ†ต๊ณ„์ ์ธ ํ‘œํ˜„์ด๋ผ๊ณ  ํ•จ.

์ž ์ด์ œ ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์—์„œ ์‹œ๋งจํ‹ฑ ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์œผ๋กœ ๋„˜์–ด์˜ต๋‹ˆ๋‹ค. ์˜๋ฏธ๋ก ์  ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์€ Sememes์˜ orthogonal basis ์ƒํƒœ์— ์˜ํ•ด ํ™•์žฅ๋œ๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค ํ•ฉ๋‹ˆ๋‹ค. ์ด๊ฒŒ ๋ฌด์Šจ๋ง์ด๋ƒ๋ฉด, ์˜ˆ๋ฅผ ๋“ค์–ด์„œ husband๋ผ๋Š” ๋‹จ์–ด๊ฐ€ ์žˆ์„ ๋•Œ, ์™ผ์ชฝ์ฒ˜๋Ÿผ ๋ช…์‚ฌ๋กœ๋Š” ๋‚จํŽธ, ๋™์‚ฌ๋กœ๋Š” ์ ˆ์•ฝํ•˜๋‹ค ๋ผ๋Š” ๋œป์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋‹จ์–ด๋Š” ๋‘๊ฐœ์˜ sense๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค. ํ•˜๋‚˜๋Š” ๊ฒฐํ˜ผํ•œ ๋‚จ์ž, ๋ฐ˜๋Œ€ํŽธ์€ ์กฐ์‹ฌํžˆ ์‚ฌ์šฉํ•œ๋‹ค ์ฆ‰ ์ ˆ์•ฝํ•œ๋‹ค. ์ด๋“ค์„ ๋˜ ๋‚˜๋ˆ„๋ฉด ๊ฒฐํ˜ผํ•œ ๋‚จ์ž๋Š” ์‚ฌ๋žŒ์ด์ž, ๊ฐ€์กฑ, ๋‚จ์ž, ๋ฐฐ์šฐ์ž์ด๋ฉฐ, ๋ฐ˜๋Œ€ํŽธ์€ ์ ˆ์•ฝํ•˜๋‹ค๋ฅผ ๋œปํ•˜๋Š” economize ์ž„.

์ฆ‰, Sememe๋ผ๋Š” ๊ฒƒ์€ ์˜๋ฏธ์˜ ์ตœ์†Œ ๋‹จ์œ„๋ฅผ ๋œปํ•˜๋Š” ๊ฒƒ์ด๋ฉฐ, Word๋Š” Sememe์˜ ์ค‘์ฒฉ ์ƒํƒœ๋กœ ๊ตฌ์„ฑ๋˜๋Š” ๊ฒƒ์ž„.

 

๊ทธ๋ฆผ์„ ๋ณด๋ฉด Words๊ฐ€ ์žˆ์ฃ . ๋‹จ์–ด๋“ค. ์ฆ‰ ๋ฌธ์žฅ์„ ๋œปํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ๋ฌธ์žฅ์•ˆ์— ์žˆ๋Š” ํ•˜๋‚˜ํ•˜๋‚˜์˜ ๋‹จ์–ด๋“ค์„ ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์— ๋งค์นญ์‹œํ‚ค๋ฉด ๊ฐ๊ฐ์˜ ๋‹จ์–ด ๋ฐฑํ„ฐ๊ฐ€ ์žˆ์„ ๊ฑฐ๊ณ , ์ด๋“ค์€ ์•„๊นŒ ๋งํ•œ ํ™•์‹คํžˆ ์•Œ ์ˆ˜ ์žˆ๋Š” Pure States์— ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๋‹จ์–ด ๋ฐฑํ„ฐ๋“ค์„ ์˜๋ฏธ๋ก ์ ์œผ๋กœ ํ•˜๋‚˜๋กœ ํ•ฉ์ณ๋ฒ„๋ฆฌ๋ฉด ์ด๋“ค์€ ์ค‘์ฒฉ์ƒํƒœ๊ฐ€ ๋  ๊ฒƒ์ด๊ณ , ์ด๋Š” ๊ณณ Mixed State์— ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฐ Mixed State๋Š” ๋ฐ€๋„ํ–‰๋ ฌ p๋กœ ํ‘œํ˜„์ด ๊ฐ€๋Šฅํ•œ๋ฐ ์œ„์˜ ์‹์—์„œ m์€ ๋ฌธ์žฅ์—์„œ์˜ ๋‹จ์–ด ๊ฐœ์ˆ˜์ด๊ณ , ์˜ค๋ฅธ์ชฝ์€ ์ค‘์ฒฉ์ƒํƒœ๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฐ ์ค‘์ฒฉ ์ƒํƒœ์˜ mixed state์—์„œ๋Š” high level semantic features๋ฅผ ๊ด€์ธกํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•˜๋Š”๋ฐ, ์ด๋ฅผ Semantic Measurements๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์™„๋ฒฝํ•˜๊ฒŒ ์ด ์ˆ˜์‹์„ ์ดํ•ดํ•˜์ง„ ๋ชปํ–ˆ๋Š”๋ฐ ์ œ๊ฐ€ ํ•ด์„ํ•˜๊ธฐ๋ก , ์ด๋Ÿฐ ์ค‘์ฒฉ์ƒํƒœ์— ์žˆ๋Š” ๊ฐ’์„ ๊ด€์ธก ํ• ๋–„๋งˆ๋‹ค ์–ด๋– ํ•œ ๊ฐ’์œผ๋กœ ์ˆ˜๋ ด๋  ๊ฒƒ์ด๊ณ , ์ด ์ˆ˜๋ ด๋œ ๊ฐ’์€ Pure States์— ์กด์žฌํ•˜๋ฉฐ ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์•ˆ์—์„œ word ํ•˜๋‚˜์— ๊ตญํ•œ๋˜์ง€ ์•Š๋Š”๋‹ค๋Š” ์˜๋ฏธ๋กœ ํ•ด์„ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๊ณ  ์–˜๋„ค๋“ค์„ ์‚ฌ์šฉํ•ด์„œ ํ™•๋ฅ ๊ฐ’์„ ์–ป๋Š”๋ฐ ์ด๋Š” ์˜ค๋ฅธ์ชฝ์— Gleason์˜ ์ด๋ก  ๋ฐฉ์ •์‹์„ ์‚ฌ์šฉํ•ด์„œ ๊ตฌํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

์ด๊ฒŒ ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” CNM ๋„คํŠธ์›Œํฌ์˜ ์ „์ฒด์ ์ธ ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค.

์ฒ˜์Œ ๋ดค์„๋• ์ง„์งœ ์ดํ•ด์•ˆ๊ฐ€๊ณ  ๋‚œ์ƒ ์ฒ˜์Œ๋ณด๋Š” ์„ค๊ณ„๋„ ๊ฐ™์•˜์Šต๋‹ˆ๋‹ค. ์ด๊ฒŒ ์ „์ž ํšŒ๋กœ์ชฝ์ด ํ•ฉ์ณ์ง€๋‹ค ๋ณด๋‹ˆ ๊ทธ๋ฆผ์„ ์ด๋ ‡๊ฒŒ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๊ทธ๋ž˜์„œ ์ดํ•ดํ•˜๊ธฐ ์‰ฝ๊ฒŒ ๋ฐฉ๊ธˆ ์ „์— ์„ค๋ช…ํ–ˆ๋˜ ๊ทธ๋ฆผ์œผ๋กœ ๋งค์นญ์„ ํ•ด๋ณด์ž๋ฉด, ์ž„๋ฒ ๋”ฉ ๊ฐ™์€ ๊ฒฝ์šฐ์—๋Š” ๋ฌธ์žฅ์—์„œ์˜ ๋‹จ์–ด๋“ค์„ ๊ฐ๊ฐ์˜ ๋ฒกํ„ฐ๋กœ ๋งค์นญํ•˜์—ฌ Pure States์— ์กด์žฌํ•˜๊ฒŒ ์ž„๋ฒ ๋”ฉํ•˜๋Š” ๊ฒƒ์ด๊ณ ,

Mixture๊ฐ™์€ ๊ฒฝ์šฐ๋Š” ์ด Pure States์— ์กด์žฌํ•˜๋Š” ๋‹จ์–ด๋“ค์„ ๊ฐ๊ฐ ๋ฌถ์–ด์„œ ์ค‘์ฒฉ์ƒํƒœ๋กœ ๋งŒ๋“ค์–ด Mixed State๋กœ ๋งค์นญ์‹œํ‚ค๊ณ  ์ด๋ฅผ ๋ฐ€๋„ํ–‰๋ ฌ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

Measurement๋Š” ์ด Mixture์—์„œ์˜ Mixed State์— ์žˆ๋Š” ๊ฐ๊ฐ์˜ ๋ฒกํ„ฐ๊ฐ’๋“ค์„ ๊ด€์ธกํ•ด์„œ ํ•˜์ด๋ ˆ๋ฒจ ์˜๋ฏธ๋ก ์  ํ”ผ์ณ๊ฐ’๋“ค์„ ๋ฝ‘์•„๋‚ธ ๋‹ค์Œ, ๊ฐ๊ฐ์˜  ๋ฐ€๋„ํ–‰๋ ฌ๋“ค๊ณผ Gleason ๋ฐฉ์ •์‹์„ ํ†ตํ•ด ํ™•๋ฅ ์„ ๋ฝ‘์•„๋‚ด๊ณ , ์ด๋“ค์„ ์ž…์ถœ๋ ฅ ์ฐจ์›์„ ๋งž์ถฐ์ฃผ๊ณ  poolingํ•˜๊ณ  ๊ณ„์‚ฐํ•ด์„œ output๊ฐ’์ด ๋‚˜์˜ค๋„๋ก ํ•˜๋Š” ๋„คํŠธ์›Œํฌ์ธ ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜์‹์ด ์—„์ฒญ ๋งŽ์€๋ฐ, ์ดํ•ดํ•˜๊ธฐ ์‰ฝ๊ฒŒ ๊ฑฐ์˜ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ  ์„ค๋ช…ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ฆฌํ•™ ์ „๊ณต์ด ์•„๋‹ˆ์—ฌ์„œ ํˆฌ์˜๊ฐ™์€ ๊ฐœ๋…์ด ๋‹จ๊ธฐ๊ฐ„ ๋‚ด์— ํ•™์Šตํ•  ์ˆ˜ ์žˆ์–ด๋ณด์ด์ง„ ์•Š์Šต๋‹ˆ๋‹ค..

์–ด์ฐŒ๋๋“  ์ด๋Ÿฐ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด์„œ QA Task๋ฅผ ํ’€์–ด๋ณด๋‹ˆ CNN๊ณผ RNN ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ๋“ค์— ๋น„ํ•ด ์•„์ฃผ ์‚ด์ง ๋†’์€ ์„ฑ๋Šฅ์„ ์–ป์€ ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

์—ฌ๊ธฐ์„œ MAP์™€ MRR ์„ฑ๋Šฅ์ง€ํ‘œ๋Š”, ์šฐ์„ ์ˆœ์œ„์— ๋Œ€ํ•œ ์ •ํ™•์„ฑ์„ ํŒ๋‹จํ•˜๋Š” ์„ฑ๋Šฅ์ง€ํ‘œ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ถ”์ฒœ์‹œ์Šคํ…œ์—์„œ ๋งŽ์ด ์“ฐ๋Š” ์„ฑ๋Šฅ์ง€ํ‘œ๋ผ๊ณ  ํ•˜๋Š”๋ฐ ์ •ํ™•๋„, ์ •๋ฐ€๋„, ์žฌํ˜„์œจ์€ ์ „๋ฐ˜์ ์ธ ์ •๋ณด๊ฒ€์ƒ‰(Information Retrieval) ์„ฑ๋Šฅ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•˜์ง€๋งŒ Rank์— ๋Œ€ํ•ด์„œ๋Š” ๊ณ ๋ คํ•˜์ง€ ์•Š๊ธฐ์— ์ด๋ฅผ ์“ด๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ์…‹์„ ๋ณด์ž๋ฉด ์ด๋Ÿฐ์‹์œผ๋กœ ๋˜์–ด์žˆ์Šต๋‹ˆ๋‹ค. ์ฐธ๊ณ ํ•˜๋ฉด ๋ ๋“ฏํ•ฉ๋‹ˆ๋‹ค.

๊ทผ๋ฐ ์ด๊ฒŒ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด ์•Œ๊ฒ ์ง€๋งŒ ์œ ์˜๋ฏธํ•˜๊ฒŒ ๋†’์€ ์„ฑ๋Šฅ์€ ์•„๋‹™๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์„ฑ๋Šฅ์„ ์˜ฌ๋ฆฌ๋Š” ๊ธฐ์ˆ ์ด๋‹ค๊ฐ€ ์ค‘์ ์ด ์•„๋‹ˆ๋ผ, ์˜์˜๋ฅผ ์ค‘์š”์‹œ ํ•ฉ๋‹ˆ๋‹ค. ๋…ผ์˜๋ฅผ ๋ณด์ž๋ฉด ์ฒซ๋ฒˆ์งธ๋กœ ๋ณธ ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํˆฌ๋ช…์„ฑ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ ๋ณต์†Œ์ˆ˜ ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ๋งŽ์€ ์˜๋ฏธ ๋‹จ์œ„๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ํ›ˆ๋ จ ๊ฐ€๋Šฅํ•œ ํˆฌ์˜ ์ธก์ •์ด ๋‹จ์–ด, ๋ฌธ์žฅ์— ๋Œ€ํ•œ ๋†’์€ ์ˆ˜์ค€์˜ ํ‘œํ˜„์„ ์ถ”์ถœํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์œ„์˜ ํ‘œ๋ฅผ ๋ณด๋ฉด, ํ˜„์‹ค์„ธ๊ณ„์—์„œ์˜ Sememe์™€ word, Abstraction ๋ฅผ ์–‘์ž์—ญํ•™ ์„ธ๊ณ„์— ๋งค์นญํ–ˆ๋‹ค๋Š” ๊ฒƒ์ด ์ฒซ๋ฒˆ์งธ ์˜์˜์ž…๋‹ˆ๋‹ค.

๋‘๋ฒˆ์งธ๋Š” ํ•ด์„๊ฐ€๋Šฅ์„ฑ์ž…๋‹ˆ๋‹ค. ๋‹จ์–ด ๊ฐ€์ค‘์น˜ ์ฒด๊ณ„ ๋ฉด์—์„œ ๋ณด์ž๋ฉด, ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ƒ์œ„ 50๊ฐœ ๋‹จ์–ด, ํ•˜์œ„ 50๊ฐœ ๋‹จ์–ด์˜ ๊ฐ€์ค‘์น˜๋ฅผ ๋ฝ‘์•„๋ณด์•˜์„ ๋•Œ, ์ค‘์š”ํ•œ ๋‹จ์–ด๋Š” ํŠน์ • ์ฃผ์ œ์— ๋Œ€ํ•œ ๊ฒƒ๋“ค, ํ˜น์€ ๊ณ ์œ ๋ช…์‚ฌ๋ฅผ ์ค‘์š”ํ•˜๋‹ค ํŒ๋‹จํ•˜์˜€๊ณ , ์ค‘์š”ํ•˜์ง€ ์•Š์€ ๋‹จ์–ด๋Š” ์˜๋ฏธ์—†๋Š” ์ˆซ์ž๋‚˜ ๋„ˆ๋ฌด ๋งŽ์ด ์“ฐ์ด๋Š” ๋‹จ์–ด๋“ค์„ ์„ ํƒํ•˜์˜€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์˜ ๋‘๋ฒˆ์งธ๋กœ๋Š” ๋งค์นญ ํŒจํ„ด์ธ๋ฐ, ๊ฐ ๋‹จ์–ด์— ๋Œ€ํ•ด ์ƒ๋Œ€์ ์ธ ๊ฐ€์ค‘์น˜๋ฅผ ์‹œ๊ฐํ™” ํ–ˆ์„ ๋•Œ ์˜๋ฏธ๋ก ์  ํž๋ฒ ๋ฅดํŠธ ๊ณต๊ฐ„์—์„œ ๋‹จ์–ด๋ฅผ ์œ ์‚ฌํ•œ ๋‹จ์–ด๋กœ ๋Œ€์ฒดํ•˜๋Š” ๊ฒƒ์ด ๊ฐ•๋ ฅํ•˜๋‹ค๊ณ  ํ•˜๋ฉฐ, ๊ฒฝํ—˜์ ์ธ ๊ด€์ ์—์„œ ํŠน์ • ์ผ์น˜ ํŒจํ„ด์ด ๋ฌธ์žฅ ์˜๋ฏธ์— ์ค‘์š”ํ•œ ์ƒํ™ฉ์—์„œ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค (RNN, CNN) ์„ ๋Šฅ๊ฐ€ํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. [ ]๋Š” N๊ทธ๋žจ ์œˆ๋„์šฐ ๊ฒฝ๊ฒŒ์ด๋ฉฐ, ์ƒ‰์ด ์ง„ํ• ์ˆ˜๋ก weight๊ฐ€ ํฐ ๊ฒƒ ์ž…๋‹ˆ๋‹ค. Local ๋ฉด์—์„œ ๋ณด์ž๋ฉด Qustion๊ณผ Answer์„ ์ž˜ ๋งค์นญํ•œ๋‹ค๊ณ  ํ•˜๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์‚ฌํ›„ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์˜ ์„ธ๋ฒˆ์งธ๋Š” ์ฐจ๋ณ„์ ์ธ Semantic Measurements ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

TREC QA ๋ฐ์ดํ„ฐ์…‹์—์„œ 10๊ฐœ์˜ Measurements๋ฅผ ๋ฝ‘๊ณ  ์ด ์ค‘์—์„œ ๋žœ๋ค์œผ๋กœ 5๊ฐœ๋ฅผ ์„ ํƒํ•ด์„œ ์˜ˆ์ œ๋กœ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ,

๋žœ๋ค์œผ๋กœ ์„ ํƒ๋œ 5๊ฐœ์˜ Measurements์—์„œ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ ๋‹จ์–ด์˜ ์ผ๋ถ€๋“ค์„ ๋ณด์—ฌ์ค€ ํ‘œ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์œ„์ชฝ์€ ์œ„์น˜, ์ด๋™ ๋™์‚ฌ, ์‚ฌ๋žŒ์ด๋ฆ„์— ๊ด€ํ•œ ๋‹จ์–ด๋“ค์ด๊ณ 

์•„๋ž˜์ชฝ์€ ์—ญ์‚ฌ์™€ rebellion์— ๊ด€ํ•œ ๋‚ด์šฉ์ด์˜€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ด๋ฅผ ๋ณด์•„์„œ, ์ธก์ •๊ฐ’์— ๋Œ€ํ•œ ๋ช…ํ™•ํ•œ ์„ค๋ช…์€ ์•ˆ๋˜์ง€๋งŒ, ์ธก์ •๊ฐ’์— ๋Œ€ํ•ด ๋Œ€๋žต์ ์ธ ์˜๋ฏธ๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

์ œ๊ฐ€ ์ดํ•ดํ•œ ๊ฒƒ์„ ์‰ฝ๊ฒŒ ๋งํ•˜์ž๋ฉด, ์–‘์ž์—ญํ•™์˜ ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ  ๋ญ”๊ฐ€ ์žˆ๋Š”๋ฐ ์ด๋ฅผ ๋ฝ‘์•˜์„ ๋•Œ ๊ทธ๊ฒŒ  ๋ญ”์ง€ ์ •ํ™•ํžˆ ์„ค๋ช…์€ ์•ˆ๋œ๋‹ค๋งŒ, ์œ ์‚ฌํ•œ ๋‹จ์–ด๋“ค์„ ์ถœ๋ ฅํ•ด๋ณผ ์ˆ˜ ์žˆ๊ณ , ์ด๋ฅผ ํ†ตํ•ด Measurement ๊ฐ’์„ ์ถ”์ •๊ฐ€๋Šฅํ•˜๋‹ค๊ณ  ํ•˜๋Š” ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก ์œผ๋กœ ๊ฐ€์„œ, ์ฒ˜์Œ์— ์ œ์‹œํ•œ ๋‘๊ฐ€์ง€ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ํ•ด๋‹ต์„ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ๊ณ , ์ถ”๊ฐ€์ ์œผ๋กœ ๋‘๊ฐ€์ง€๋ฅผ ๋” ๋ณด์—ฌ์ฃผ์—ˆ์Œ.

 

์ด ๋…ผ๋ฌธ์„ ์ฝ์–ด๋ณด๋‹ˆ ์–‘์žAI, ์–‘์ž์ปดํ“จํŒ…์—์„œ ์ž์—ฐ์–ด์ฒ˜๋Ÿผ ์˜๋ฏธ๋ก ์ ์œผ๋กœ ์ค‘์ฒฉ ์ƒํƒœ๊ฐ€ ๋  ์ˆ˜ ์žˆ๋Š” ๊ฐœ๋…์„ ์ธ์ฝ”๋”ฉ, ์ž„๋ฒ ๋”ฉ ํ•˜๋Š” ์•„์ด๋””์–ด ๊ดœ์ฐฎ์•„๋ณด์ž„. ๊ทผ๋ฐ ์ด๊ฒŒ ๋ฌผ๋ฆฌํ•™ ๊ฐœ๋…์ด ๋„ˆ๋ฌด ๊ฐ•ํ•ด์„œ ์ด๋Ÿฐ ์ˆ˜์‹์„ ์ดํ•ดํ•˜๊ณ  ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด ๊ด€๊ฑด์ธ ๋“ฏ ํ•จ.

728x90
๋ฐ˜์‘ํ˜•
Liky