- Greedy Search
- ํ์ฌ ๋จ์ด ๋ค์์ ๋์ฌ ๋จ์ด ํ๋ณด ์ค ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ ๊ฒ ์ ํ
- (์ฅ์ ) ๋น๊ต์ ๊ฐ๋จํ ์๊ณ ๋ฆฌ์ฆ
- (๋จ์ ) ๋์ด ๋ฐ๋ณต ํ์ ๋ฐ์
- (๋จ์ ) ํ์ฌ ์์ ๋ฐ๋ก ๋ค์ ๋จ์ด๋ง ๊ณ ๋ ค.
- Beam Search
- ํ์ฌ์์ ์ดํ ์ฌ๋ฌ step์ ๋จ์ด ์กฐํฉ์ keep ํด๋๊ณ ํด๋น ํ๋ฅ ์ ๊ณฑํ์ฌ ์ ์๋ฅผ ๋ด๊ณ ๋ค๋ฅธ ์กฐํฉ๊ณผ ๋น๊ตํ์ฌ ๊ฐ์ฅ ๋์ ๊ฒ ์ ํ
- (์ฅ์ ) ๋ค์ ๋์ฌ ํ๋ฅ ์ด ๋์ ๋จ์ด๋ฅผ ์ ํํ์ฌ ์ข ๋ ์ข์ ๋ฌธ์ฅ ์์ฑ
- (๋จ์ ) ์ฐ์ฐ์๋ ์ฆ๊ฐ
- (๋จ์ ) ๋ฐ๋ณต๋ฌธ์ ์ฌ์ ํ ์กด์ฌ → n-gram(์ฐ์๋ ๋จ์ด ๊ฐ์ ํ์ฉ๋ฒ์) ์ฌ์ฉ
- num_beams → Beam Search์ ์ฐ์ด๋ beam์ ๊ฐ์
- no_repeat_ngram_size → ํน์ n-gram์ด ์์ฑ๋ฌธ์ฅ ๋ด์์ ๋ฐ๋ณต๋์ง ์๋๋ก ํจ
- num_return_sequences → ์์ํ ๋ช ๊ฐ ๋ฐ์์ง
- Sampling
- ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ์ ๋ฐ๋ผ ๋ค์ ๋จ์ด๋ฅผ ๋๋ค์ผ๋ก ์ ํ
- (์ฅ์ ) ํํ๋ ฅ ํ๋ถ ๋ฐ ๋ค์ํ ๋จ์ด ์ฌ์ฉ
- (๋จ์ ) ๋ง์ด์๋๊ฑฐ๋ ์ด์ํ ๋ฌธ์ฅ ๋์ฌ ์ ์์
- do_sample → sampling ์ธ์ง ๋ง์ง boolean
- temperature → ๋ฌด์์์ฑ ์กฐ์ (0์ ๊ฐ๊น์ธ ์๋ก Greedy์ ์ ์ฌ)
- Top-K Sampling
- K๊ฐ์ ํ๋ณด ๋จ์ด๋ฅผ ๋จผ์ ํํฐ๋ง ํ ํ๋ฅ ๋ถํฌ ๊ณ์ฐ ํ ์ํ๋ง ์งํ
- (์ฅ์ ) ๋์ ๋จ์ด๋ฅผ ์ ์ ํ๊ธฐ ๋๋ฌธ์ ์ด์ํ ๋จ์ด ๊ฑฐ๋ฅผ ์ ์์
- (๋จ์ ) ํ๋ณด์ ์ค๋ฅผ๋งํ ๋จ์ด์ฌ๋ top-k์์ ๋ชป๋ค์ด์ ๊ฑธ๋ฌ์ง ์ ์๊ณ , ํ๋ฅ ์ด ๋ฎ์ ๋จ์ด์ฌ๋ ์์ ํ๋ฅ ๋จ์ด๊ฐ ๋ช๊ฐ ์์ผ๋ฉด top-k์์ ๋ค์ด๊ฐ ์ ์์
- Top-P Sampling (Nucleus Sampling)
- Top-K๋ ์์ K๊ฐ์ ๋จ์ด๋ฅผ ์ ์ ํ๋ค๋ฉด, Top-P๋ ๋์ ํ๋ฅ ์ ๊ธฐ์ค์ผ๋ก ๋จ์ด๋ฅผ ์ ์ ํจ. ์๋ฅผ๋ค์ด p=0.92๋ก ์ค์ ํ๋ฉด ๋์ ํ๋ฅ ์ด 92% ๋์ผ๋ฉด์, ํ ํฐ์ ์๊ฐ ๊ฐ์ฅ ์ ์ ๋ฌธ์ฅ์ ๋ด๋ฑ๋ ๊ฒ.
๊ฒฝํ์ ๊ด์ ์์ top-p์ top-k๋ฅผ ๊ฐ์ด์ฐ๊ฑฐ๋, Beam search๊ฐ ๊ฐ์ฅ ์ข์ ์์ํ์ ๋์์.