Generative Question Refinement with Deep Reinforcement
Liu, Ye, et al. "Generative question refinement with deep reinforcement learning in retrieval-based QA system." Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2019.
Abstract
์ค์ QA ์์คํ ์์ ์๋ชป๋ ๋จ์ด, ์๋ชป๋ ๋จ์ด ์์, ๋ ธ์ด์ฆ ๊ฐ์ ์๋ชป๋ ํ์์ ์ง๋ฌธ๋ค์ด ์ผ๋ฐ์ ์ด์ฌ์ QA ์์คํ ์ด ์ด๋ฅผ ์ ํํ๊ฒ ์ดํดํ๊ณ ๋ต๋ณ์ ๋์ง์ง ๋ชปํ๊ฒ ๋ง๋ฌ.
์ด๋ฌํ ์๋ชป๋ ํ์์ ์ง๋ฌธ์ ํจ๊ณผ์ ์ผ๋ก ์ ๊ฑฐํ๊ธฐ ์ํด์ ์ง๋ฌธ ์ ์ ์์ ์ ์ ๊ทผํ๊ณ , ์๋ชป๋ ํ์์ ์ง๋ฌธ์ ์ ๊ตฌ์ฑ๋ ํ์์ ์ง๋ฌธ์ผ๋ก ์ธ๋ถํํ๋ ๋ชจ๋ ๊ณผ์ ์ ํตํฉํ๋ QREFINE์ด๋ผ๋ ๋ชจ๋ธ์ ์ ์ํ์.
๊ธฐ๋ณธ ๋ชจ๋ธ์ Seq2Seq ๋ชจ๋ธ์.
์์ฑ๋ ์ง๋ฌธ์ ํ์ง ๋ฐ ๊ฒ์ ์ฑ๋ฅ์ ํฅ์ํ๊ธฐ ์ํด ๋๊ฐ์ง๋ฅผ ๋ด๋์๋๋ฐ
์๋ชป๋ ํ์์ ์ง๋ฌธ์ ์๋ฏธ๋ฅผ ๋ ์ ์ธ์ฝ๋ฉํ๊ธฐ์ํด ๋จ์ด ์๋ฒ ๋ฉ ์ธ์ ๋ฌธ์ ์๋ฒ ๋ฉ ๋ฑ BERT์ ๊ฐ์ด ์ํฉ๋ณ ๋จ์ด ์๋ฒ ๋ฉ์ผ๋ก ์ง๋ฌธ์ ํํ์ ํ๋ถํ๊ฒ ํ๋ค๊ณ ํจ.
๋ํ ์ํ๋ ์ง๋ฌธ์ ์์ฑํ ์ ์๋๋ก ์์ฑํ๋ฉด์ ์ ์ ํ ํํํ๋ฉด ์ฆ๊ฐ์ ์ธ ๋ณด์์ผ๋ก ๊ฐ์ฃผํ๊ณ , ์์ฑ๋ ์ง๋ฌธ๊ณผ ๋ต๋ณ ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ์๊ฐ๋๋น ์ฅ๊ธฐ ๋ณด์์ผ๋ก ๊ฐ์ฃผํ๋ ์ฌ์ธต ๊ฐํ ํ์ต์ผ๋ก ๋ชจ๋ธ์ ํ๋ จํ๋ค๊ณ ํจ.
์ด๋ ๊ฒ ๋ง๋ค์ด๋ธ ๋ฐฉ๋ฒ์ด ๊ธฐ์กด๋ณด๋ค ์ ๊ตํ ๋ต๋ณ ๋ฐ ๊ฒ์์ ์ ํ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค๊ณ ํจ.
๋ ผ๋ฌธ ๋ด์ฉ
๊ธฐ์กด QA ์์คํ
-> ์๋ชป๋ ๋จ์ด ์์ ๋ฐ ๋
ธ์ด์ฆ ํํ ๋ฑ ์๋ชป๋ ์ง๋ฌธ์ด ๋ง์์ ์ฑ๋ฅ ์์ข์
๊ธฐ๋ณธ์์ด๋์ด -> Seq2Seq ๋ชจ๋ธ ํ์ตํด์ ์๋ ์ง๋ฌธ์์ ์๋ก์ด ์ง๋ฌธ ์์ฑ
1. ์ง๋ฌธ์ ์๋ฏธ๋ฅผ ๋ ์ ์ธ์ฝ๋ฉํ๊ธฐ์ํด Bert๊ฐ์ ๋ฌธ์์๋ฒ ๋ฉ๊ณผ ์ปจํ
์คํธ ๋จ์ด ์๋ฒ ๋ฉ์ผ๋ก ์ง๋ฌธ ํํ์ ํ๋ถํ๊ฒ ๋ง๋ฌ
2. ์์ฑ๋ ์ง๋ฌธ๊ณผ ๋ต๋ณ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ์๊ฐ ๋๋น ์ฅ๊ธฐ ๋ณด์์ ๊ณ ๋ คํ DQL ๋ชจ๋ธ ํ๋ จ
๊ธฐ์กด์ ์ฌ์ฉํ๋ WikiAnswer Dataset์ ํ์ธํด๋ณด๋ฉด ์ ์ฒด ๋ฐ์ดํฐ์ค ์ฝ 68%๊ฐ ์ง๋ฌธ ํ์์ด ์๋ชป๋์ด์๋ค๊ณ ํจ.
์ด ๋ ผ๋ฌธ๋ค์ ๋ณด๋ฉด, ์ฒซ๋ฒ์งธ ๋ ผ๋ฌธ์ ์๋ชป๋ ๋จ์ด ๊ตฌ๋ฌธ ์์ ํ๊ธฐ ์ํ ๋ฌธ๋ฒ ์ค๋ฅ ์์ ์๋ง ์ค์ ์ ๋์๊ณ ,
๋๋ฒ์งธ ๋ ผ๋ฌธ์ ๋ณต์กํ๊ณ ์ด๋ ค์ด ์ง๋ฌธ๋ค์ ๋ถํ ํ๊ณ ์ผ๋ฐํ ๋จ์ํํด์ DQL ์ผ๋๋ฐ ๋ณ๋ก๋ผ๊ณ ํจ.
๋ฐ๋๋ผ Seq2Seq ๋ชจ๋ธ๋ ๋ณธ ๋
ผ๋ฌธ์์ ์จ๋ดค๋๋ฐ ์ด ๋ชจ๋ธ์ ์ ์๋์๊ฐ๋ค๊ณ ํจ.
1. ์๋ชป๋๊ฑฐ๋ ๋
ธ์ด์ฆ ๋ง์ ๋จ์ด๊ฐ ๋ง์ด ํฌํจ๋์ด ์๋ชป๋ ํ์์ ์ง๋ฌธ์ ๋ํ ์ข์ ํํ ํ์ต๋ถ๊ฐ๋ฅ
2. ์ต๋ ๊ฐ๋ฅ์ฑ ๋ชฉํ๊ฐ ๋ชฉํ์ ์ผ์นํ์ง ์์
์ด๋ ๊ฒ ๋๊ฐ์ง๋ก ์ด ๋ชจ๋ธ์ ์์ฐ๊ณ , ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด QREFINE์ด๋ผ๋ Seq2Seq2 ๊ธฐ๋ฐ ์ง๋ฌธ ์ฌ๊ตฌ์ถ ๋ชจ๋ธ์ ๊ฐ๋ฐํจ.
์๋ค๊ฐ์ ์ปจํ
์คํธ ํ๋ฆฌ ๋ชจ๋ธ์ ๋จ์ด ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ๊ณ ๋ คํ ์ ์์.
์ดํ์ ๊ฐ ๋จ์ด์ ๋ํด ๋จ์ผ ๋จ์ด ์๋ฒ ๋ฉ ํํ์ ์์ฑํ๊ธฐ์ ๊ฐ์ ๋จ์ด๋ผ๋ ๋ค๋ฅธ ์๋ฏธ์ ๋จ์ด๋ฅผ ๋์ผํ๊ฒ ๋ณด๊ณ ํ์ตํจ.
๋ฐ๋ผ์ BERT๊ฐ์ ์ปจํ
์คํธ ๋ชจ๋ธ๋ก ๋๋ฆผ
์ ์ํ QREFINE ๋ชจ๋ธ์ ์ํคํ ์ฒ์ ๋ณด์ฌ์คฌ๋๋ฐ,
์์ด์ ํธ ์ชฝ์์๋ ์ธ์ฝ๋๊ฐ ์๋ชป๋ ํ์์ ์ง๋ฌธ์ ์ฝ๊ณ , ๋์ฝ๋๋ ํ ๋ฒ์ ํ๋์ ๋จ์ด/๊ตฌ๋ฌธ ์ผ๋ก ๊ตฌ์ฑ๋ ์ฌ๋ฐ๋ฅธ ํ์์ ์ง๋ฌธ์ ์์ฑํจ.
์ ํ์ฑ์ด ๋ ์ง๋ฌธ๋ค์ ๋ง๋ค์ด ๋ด๋ฉด ์ด๋ฅผ ์ฌ์ ํ๋ จ๋ Reward ์ชฝ์ผ๋ก ์ ์กํด์, ๋จ์ด ์์ค LM๊ณผ BERT ๋ณด์์์ ๋จ์ด ์์ค ๋จ์ด ๋ณด์๊ณผ QA ์ ์ฌ์ฑ์์ ์ง๋ฌธ/๋ต๋ณ ์๊ด ๊ด๊ณ ๋ณด์์ ๊ณ์ฐํ๋ค๊ณ ํจ.
์ธ๋ฒ์งธ PPO์์๋ ๋ณด์์ ์ต๋ํํ๋ ๋ชฉํ๋ก ์์ด์ ํธ ์์ฑ ์ ์ฑ ์ ์ ๋ฐ์ดํธํจ.
Yahoo์ CSU ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ์ฑ๋ฅ ์งํ๋ฅผ ์์ฑํจ.
๋ง์ถค๋ฒ ์ค๋ฅ, ๋จ์ด ์์ ๋ฑ ํ์ ์์
์ ํฌํจํ ์๋ชป๋ ํ์์ ์ง๋ฌธ์ ์์ ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ์ฌ, ์ด๋ฌํ ํ์ ์์
์ ๋ณ๋๋ก ์ฒ๋ฆฌํ์ง ์๊ณ Seq2Seq2 ๊ธฐ๋ฐ ํตํฉ ๋ชจ๋ธ ๊ฐ๋ฐํด์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ฐฉ์์ผ๋ก ์ฒ๋ฆฌํจ.
BERT์ ๋ฌธ์ ์๋ฒ ๋ฉ ๋ฐ ์ปจํ
์คํธ ๋จ์ด ์๋ฒ ๋ฉ์ ํตํฉํด ์ง๋ฌธ ํํ์ ๊ฐ์ ํ๊ณ ์ด๋ฅผ DQL๊ณผ ๊ฒฐํฉํจ.
์ญ ๊ฐํํ์ต์ ์ฌ์ฉํ์ฌ ์๋ชป๋ ํ์์ ์ง๋ฌธ์ด ์ฃผ์ด์ง๋ฉด ์ด๋ฅผ ๋ค์ ์์ ํ ์ ์๊ฒ ํ๋ฉด ์ข์ ๋ฏ ํจ.
์ง๋ฌธ ์ฌ๊ฒํ ๊ฒฐ๊ณผ๋ฅผ ํ์ฉํด ์ง๋ฌธ ์ดํด, ์ง๋ฌธ ๋ต๋ณ ์ถ์ฒ ๋ฑ์ ๋ง๋ค๋ฉด ์ด๋จ๊น ํจ.