์—ฌ๋Ÿฌ๋ถ„, Merge Model ์ด๋ผ๊ณ  ์•„์‹œ๋‚˜์š”?

์ €๋Š” ์ž‘๋…„ ๊ฒจ์šธ์— ํ—ˆ๊น…ํŽ˜์ด์Šค Open LLM Leaderboard๋ฅผ ๋ณด๋‹ค๊ฐ€ ์•Œ๊ฒŒ๋œ ๊ธฐ์ˆ ์ด์—์š”.

๊ทธ ๋‹น์‹œ, ์นด์นด์˜ค๋ฑ…ํฌ์‚ฌ์˜ ์นด๋ณธ๋นŒ๋Ÿฐ ๋ชจ๋ธ์ด SLERP ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด์„œ 1,2,3 ๋“ฑ์„ ๋‹ฌ์„ฑํ•œ ์ ์ด ์žˆ์—ˆ์–ด์š”.

ํ•™์Šต์—†์ด ๋ฆฌ๋”๋ณด๋“œ 1๋“ฑ์ด๋ผ๊ณ โ€ฆ? ํ•˜๋ฉฐ ๋†€๋ž๋˜ ๊ธฐ์–ต์ด ์žˆ๋„ค์š”.

 

Model Merging์ด๋ž€ ๋‘ ๊ฐœ ์ด์ƒ์˜ LLM๋“ค์„ ๋‹จ์ผ ๋ชจ๋ธ๋กœ ๊ฒฐํ•ฉํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”.

๊ฐ„๋‹จํ•œ ์˜ˆ์‹œ๋ฅผ ๋“ค์–ด๋ณผ๊นŒ์š”?

์š”๋ฆฌ๋ฅผ ํ•  ๋•Œ, ๊ฐ ์š”๋ฆฌ์‚ฌ๊ฐ€ ์ž์‹ ๋งŒ์˜ ํŠน๊ธฐ ์š”๋ฆฌ๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ํ•œ ์š”๋ฆฌ์‚ฌ๋Š” ํŒŒ์Šคํƒ€์— ๋›ฐ์–ด๋‚˜๊ณ , ๋‹ค๋ฅธ ์š”๋ฆฌ์‚ฌ๋Š” ์Šคํ…Œ์ดํฌ์— ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค. Merge Model์€ ์ด ์š”๋ฆฌ์‚ฌ๋“ค์ด ํ•จ๊ป˜ ๋ชจ์—ฌ ํŒŒ์Šคํƒ€์™€ ์Šคํ…Œ์ดํฌ๋ฅผ ๋ชจ๋‘ ํฌํ•จํ•˜๋Š” ์ตœ๊ณ ์˜ ์ฝ”์Šค๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ฐ๊ฐ์˜ ์š”๋ฆฌ์‚ฌ์˜ ์žฅ์ ์„ ์‚ด๋ฆฌ๋ฉด์„œ, ์ตœ์ข…์ ์œผ๋กœ ํ›จ์”ฌ ๋” ๋ง›์žˆ๋Š” ์‹์‚ฌ๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ฆ‰, Merge Model์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋›ฐ์–ด๋‚œ ๋ชจ๋ธ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋” ๊ฐ•๋ ฅํ•˜๊ณ  ์œ ์—ฐํ•œ ์–ธ์–ด ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— GPU๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋‚ฎ์€ ๋น„์šฉ์œผ๋กœ ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ์•ˆ์ด์—์š”.

 

๊ธฐ์กด์˜ LLM์€ ๋ชจ๋ธ ํ•™์Šต ์‹œ ๋ฐœ์ƒํ•˜๋Š” ํƒ„์†Œ์˜ ์–‘์ด ์–ด๋งˆ์–ด๋งˆ ํ•˜์˜€์ง€๋งŒ (๋ถ๊ทน๊ณฐ์•„ ๋ฏธ์•ˆํ•ด), ์ด ๋ฐฉ๋ฒ•์€ ํ•™์Šต๋œ LLM๋“ค์„ ๋‹จ์ˆœํžˆ โ€œ๊ฒฐํ•ฉโ€ํ•˜๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ํƒ„์†Œ ๋ฐฐ์ถœ์„ ์ตœ์†Œํ™”ํ•˜๋ฉฐ ์ €์ €์ €์ €๋น„์šฉ์œผ๋กœ ๋ชจ๋ธ๋ง์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

 

์ข€ ๋” ์ž์„ธํžˆ ์„ค๋ช…ํ•ด๋ณด์ž๋ฉด,

Merge Model์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋…๋ฆฝ์ ์ธ ์–ธ์–ด ๋ชจ๋ธ์„ ํ†ตํ•ฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฐ๊ฐ์˜ ๋ชจ๋ธ์€ ํŠน์ •ํ•œ ์–ธ์–ด ๋˜๋Š” ํŠน์ •ํ•œ ์ž‘์—…์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์ง€๋งŒ, ์ด๋“ค์„ ๊ฒฐํ•ฉํ•˜๋ฉด ๊ฐ ๋ชจ๋ธ์˜ ์žฅ์ ์„ ๋ชจ์•„ ๋” ๋„“์€ ๋ฒ”์œ„์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

Merge Model์˜ ์ž‘๋™ ์›๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  1. ๋…๋ฆฝ์ ์ธ ๋ชจ๋ธ ํ›ˆ๋ จ: ๋จผ์ €, ๊ฐ๊ฐ์˜ ์–ธ์–ด ๋ชจ๋ธ์„ ๋ณ„๋„๋กœ ํ›ˆ๋ จ์‹œํ‚ต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, A ๋ชจ๋ธ์€ ์˜์–ด์— ํŠนํ™”๋˜๊ณ , B ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด์— ํŠนํ™”๋œ ๋ชจ๋ธ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜น์€ A ๋ชจ๋ธ์€ ์ˆ˜ํ•™๋ฌธ์ œ์— ๊ฐ•ํ•˜๊ณ , B ๋ชจ๋ธ์€ ๊ณผํ•™๋ฌธ์ œ์— ๊ฐ•ํ•œ ๋ชจ๋ธ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ๋ชจ๋ธ ๊ฒฐํ•ฉ: ํ›ˆ๋ จ๋œ ๋ชจ๋ธ๋“ค์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฒฐํ•ฉ ๋ฐฉ๋ฒ•์—๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€๊ฐ€ ์žˆ๋Š”๋ฐ, ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ ๋˜๋Š” ์ค‘๊ฐ„ ํ‘œํ˜„(embedding)์„ ํ•ฉ์น˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  3. ํ†ตํ•ฉ ๋ชจ๋ธ ์ตœ์ ํ™”: ๊ฒฐํ•ฉ๋œ ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•˜์—ฌ ๊ฐ ๋ชจ๋ธ์˜ ์žฅ์ ์„ ๊ทน๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„์—์„œ๋Š” ๋‘ ๋ชจ๋ธ์ด ์„œ๋กœ ๋ณด์™„ํ•  ์ˆ˜ ์žˆ๋„๋ก ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

 

์™„์ „ ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ์ด์•ผ?

Merge ๊ธฐ๋ฒ•์€ ์ตœ๊ทผ์— ๋” ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ์ง€๋งŒ, ์‹ค์ œ๋กœ ๊ทธ ๊ฐœ๋…์€ ์˜ˆ์ „๋ถ€ํ„ฐ ์กด์žฌํ•ด ์™”์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ ๊ฒฐํ•ฉ์˜ ์ดˆ๊ธฐ ํ˜•ํƒœ๋Š” ์•™์ƒ๋ธ” ํ•™์Šต(ensemble learning)์ž…๋‹ˆ๋‹ค. ์•™์ƒ๋ธ” ํ•™์Šต์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์•ฝํ•œ ๋ชจ๋ธ(weak models)์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ ๋ฐฉ์‹์€ 1990๋…„๋Œ€๋ถ€ํ„ฐ ์ฃผ๋ชฉ๋ฐ›๊ธฐ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค.

 

Question Answering Task๋กœ ์˜ˆ์‹œ๋ฅผ ํ•˜๋‚˜ ๋“ค์–ด๋ณผ๊นŒ์š”?

๊ธฐ์กด์—๋Š” ์‚ฌ์ „ํ•™์Šต๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์ด ์—†๋˜ ์‹œ์ ˆ์ด๋ผ, QA Task๊ฐ™์ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์–ธ์–ด๋ชจ๋ธ ํ•œ๊ฐœ, ๋น„์ „๋ชจ๋ธ ํ•œ๊ฐœ๋ฅผ ๋™์‹œ์— ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ์‹์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

 

์ด๋Ÿฐ์‹์œผ๋กœ์š”!

 

์˜›๋‚ ์˜ Merge Model๊ณผ ํ˜„์žฌ์˜ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM) ๋ณ‘ํ•ฉ์˜ ์ฐจ์ด์ ์„ ์ดํ•ดํ•˜๋ ค๋ฉด, ๋‘ ๊ฐ€์ง€ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ๊ธฐ๋ณธ ์›๋ฆฌ์™€ ์ ์šฉ ๋ฐฉ๋ฒ•์„ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ๊ทธ ์ฐจ์ด์ ์„ ์„ค๋ช…ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ณผ๊ฑฐ์˜ Merge Model์€ ์ฃผ๋กœ ์•™์ƒ๋ธ” ํ•™์Šต๊ณผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต์—์„œ ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ฃผ์š” ํŠน์ง•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  1. ์•™์ƒ๋ธ” ํ•™์Šต:
    • ๊ฐœ๋ณ„ ๋ชจ๋ธ์˜ ๋…๋ฆฝ์„ฑ: ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋…๋ฆฝ์ ์ธ ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๊ณ , ์ด๋“ค์˜ ์ถœ๋ ฅ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ตœ์ข… ์˜ˆ์ธก์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
    • ๊ฒฐํ•ฉ ๋ฐฉ์‹: ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฐฐ๊น…(Bagging), ๋ถ€์ŠคํŒ…(Boosting) ๋“ฑ์˜ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ํ‰๊ท ๋‚ด๊ฑฐ๋‚˜ ๋‹ค์ˆ˜๊ฒฐ ํˆฌํ‘œ๋ฅผ ํ†ตํ•ด ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค.
    • ์ ์šฉ ๋ถ„์•ผ: ์ฃผ๋กœ ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋‚˜ ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ๋‚˜ ๊ทธ๋ž˜๋””์–ธํŠธ ๋ถ€์ŠคํŒ… ๋จธ์‹ ์ด ๋Œ€ํ‘œ์ ์ž…๋‹ˆ๋‹ค.
  2. ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต:
    • ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์œ ํ˜• ๊ฒฐํ•ฉ: ํ…์ŠคํŠธ, ์ด๋ฏธ์ง€, ์˜ค๋””์˜ค ๋“ฑ ์„œ๋กœ ๋‹ค๋ฅธ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค.
    • ๋ฒกํ„ฐ ๊ฒฐํ•ฉ: ๊ฐ ๋ฐ์ดํ„ฐ์˜ ํŠน์ง• ๋ฒกํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ํ†ตํ•ฉ๋œ ๋ฒกํ„ฐ๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ๋ฒกํ„ฐ์˜ ๋ง์…ˆ, ์—ฐ๊ฒฐ, ํ‰๊ท  ๋“ฑ์˜ ๊ธฐ๋ฒ•์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
    • ์ ์šฉ ๋ถ„์•ผ: ์ด๋ฏธ์ง€ ์บก์…”๋‹, ๋น„๋””์˜ค ์„ค๋ช…, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ถ„๋ฅ˜ ๋“ฑ ๋‹ค์–‘ํ•œ ์‘์šฉ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

ํ˜„๋Œ€์˜ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM) ๋ณ‘ํ•ฉ์€ ํ›จ์”ฌ ๋” ๋ณต์žกํ•˜๊ณ  ์ •๊ตํ•œ ๋ฐฉ์‹์œผ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ์ฃผ์š” ํŠน์ง•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  1. ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๊ฒฐํ•ฉ:
    • ์‚ฌ์ „ ํ›ˆ๋ จ๊ณผ ๋ฏธ์„ธ ์กฐ์ •: LLM์€ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ์‚ฌ์ „ ํ›ˆ๋ จ(pre-training)์„ ๊ฑฐ์น˜๊ณ , ํŠน์ • ์ž‘์—…์— ๋งž์ถฐ ๋ฏธ์„ธ ์กฐ์ •(fine-tuning)๋ฉ๋‹ˆ๋‹ค.
    • ์ง€์‹ ํ†ตํ•ฉ: ์—ฌ๋Ÿฌ ์–ธ์–ด ๋ชจ๋ธ์˜ ์ง€์‹๊ณผ ๋Šฅ๋ ฅ์„ ํ†ตํ•ฉํ•˜์—ฌ ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, GPT-3์™€ ๊ฐ™์€ ๋ชจ๋ธ์€ ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ํ•™์Šต๋˜์–ด ๋‹ค์–‘ํ•œ ์–ธ์–ด์™€ ์ฃผ์ œ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ๊ฒฐํ•ฉ ๋ฐฉ์‹:
    • ๋ชจ๋ธ ์œตํ•ฉ: ๋‹จ์ˆœํžˆ ์ถœ๋ ฅ์„ ๊ฒฐํ•ฉํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜์™€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ๋ชจ๋ธ๋กœ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด๋Š” ๋” ๊นŠ์€ ์ˆ˜์ค€์˜ ํ†ตํ•ฉ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
    • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ํ•ฉ๋ณ‘: ์—ฌ๋Ÿฌ ๋ชจ๋ธ์ด ๊ฐ๊ธฐ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ๋œ ๊ฒฝ์šฐ, ์ด ๋ฐ์ดํ„ฐ์…‹์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.
  3. ์ ์šฉ ๋ถ„์•ผ:
    • ๋‹ค์–‘ํ•œ NLP ์ž‘์—…: ๋ฒˆ์—ญ, ์š”์•ฝ, ์งˆ๋ฌธ ๋‹ต๋ณ€, ํ…์ŠคํŠธ ์ƒ์„ฑ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž‘์—…์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
    • ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ: ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€๋ฅผ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๊ฑฐ๋‚˜, ํ…์ŠคํŠธ์™€ ์˜ค๋””์˜ค๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

์ฃผ์š” ์ฐจ์ด์ 

  1. ๊ฒฐํ•ฉ ์ˆ˜์ค€:
    • ์˜›๋‚ : ๊ฐœ๋ณ„ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ๊ฒฐํ•ฉํ•˜๊ฑฐ๋‚˜, ๋ฒกํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” ๋ฐฉ์‹.
    • ํ˜„์žฌ: ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ์™€ ๊ฐ€์ค‘์น˜๋ฅผ ํ†ตํ•ฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ๋ชจ๋ธ๋กœ ๋งŒ๋“œ๋Š” ๋ฐฉ์‹.
  2. ๋ณต์žก์„ฑ:
    • ์˜›๋‚ : ๋น„๊ต์  ๋‹จ์ˆœํ•œ ๊ฒฐํ•ฉ ๋ฐฉ์‹, ๋…๋ฆฝ์ ์ธ ๋ชจ๋ธ์˜ ์กฐํ•ฉ.
    • ํ˜„์žฌ: ๋ณต์žกํ•œ ๋ชจ๋ธ ์œตํ•ฉ, ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์™€ ๋ณต์žกํ•œ ํ›ˆ๋ จ ๊ณผ์ •.
  3. ์ ์šฉ ๋ฒ”์œ„:
    • ์˜›๋‚ : ์ฃผ๋กœ ๋ถ„๋ฅ˜, ํšŒ๊ท€, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต.
    • ํ˜„์žฌ: ๋‹ค์–‘ํ•œ NLP ์ž‘์—…๊ณผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ, ๋”์šฑ ๋„“์€ ์ ์šฉ ๋ฒ”์œ„.

์ด๋ ‡๊ฒŒ ๊ณผ๊ฑฐ์™€ ํ˜„์žฌ์˜ ๋ชจ๋ธ ๊ฒฐํ•ฉ ๋ฐฉ์‹์„ ๋น„๊ตํ•ด ๋ณด๋ฉด, ๊ธฐ์ˆ ์˜ ๋ฐœ์ „๊ณผ ํ•จ๊ป˜ ๊ฒฐํ•ฉ ๋ฐฉ์‹๋„ ๋” ์ •๊ตํ•˜๊ณ  ๊ฐ•๋ ฅํ•ด์กŒ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์–ด๋–ป๊ฒŒ ์“ฐ๋Š”๊ฑด๋ฐ?

๋ˆ„๊ตฌ๋‚˜ ์†์‰ฝ๊ฒŒ ๋ชจ๋ธ๋“ค์„ ๋ณ‘ํ•ฉํ•  ์ˆ˜ ์žˆ๋„๋ก mergekit ์ด๋ผ๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๊ฐ€ ์žˆ์–ด์š”.

์‚ฌ์šฉ๋ฒ•๋„ ๊ฐ„๋‹จํ•ด์š”.

ํ•ด๋‹น ๊นƒํ—ˆ๋ธŒ์— ๋“ค์–ด๊ฐ€์„œ ์ž‘์„ฑ๋˜์žˆ๋Š” readme ์ฒ˜๋Ÿผ ์ง„ํ–‰ํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

์ €๋Š” Model Stock Method๋ฅผ ์„ ํƒํ•˜์—ฌ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ์€ Ko-LLM Leaderboard์— ์ƒ์œ„๊ถŒ์— ์žˆ๋˜ Solar 10B ๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ ๋ชจ๋ธ์„ 4๊ฐœ ์„ ํƒํ–ˆ์–ด์š”.

yaml ๋ชจ๋ธ์„ ์ƒˆ๋กœ ์ž‘์„ฑํ•˜์—ฌ ๋‹ค์Œ์˜ ์ฝ”๋“œ๋ฅผ ๋Œ๋ฆฌ๋ฉด ๋์ž…๋‹ˆ๋‹ค!

import torch
import yaml

from mergekit.config import MergeConfiguration
from mergekit.merge import MergeOptions, run_merge

OUTPUT_PATH = "./merged"  # folder to store the result in
LORA_MERGE_CACHE = "./tmp"  # change if you want to keep these for some reason
CONFIG_YML = "./examples/stock.yml"  # merge configuration file
COPY_TOKENIZER = True  # you want a tokenizer? yeah, that's what i thought
LAZY_UNPICKLE = False  # experimental low-memory model loader
LOW_CPU_MEMORY = False  # enable if you somehow have more VRAM than RAM+swap

with open(CONFIG_YML, "r", encoding="utf-8") as fp:
    merge_config = MergeConfiguration.model_validate(yaml.safe_load(fp))

run_merge(
    merge_config,
    out_path=OUTPUT_PATH,
    options=MergeOptions(
        lora_merge_cache=LORA_MERGE_CACHE,
        cuda=torch.cuda.is_available(),
        copy_tokenizer=COPY_TOKENIZER,
        lazy_unpickle=LAZY_UNPICKLE,
        low_cpu_memory=LOW_CPU_MEMORY,
    ),
)
print("Done!")

์ •๋ง ๊ฐ„๋‹จํ•œ ์ฝ”๋“œ๋กœ ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค!

 

์ด์ œ ์ด ๋ชจ๋ธ์„ ๋ฆฌ๋”๋ณด๋“œ์— ์ œ์ถœ์„ ํ•˜๊ณ  ๊ธฐ๋‹ค๋ฆฌ๋ฉด...

 

์ง , ๋ฆฌ๋”๋ณด๋“œ ์ˆœ์œ„๊ถŒ์— ์˜ฌ๋ผ๊ฐ”์Šต๋‹ˆ๋‹ค!

์‚ฌ์‹ค Model Stock ๋…ผ๋ฌธ์„ ๋ณด๋ฉด vision model, vision task์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์‹คํ—˜์„ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ ์–ธ์–ด๋ชจ๋ธ(LLM)์—๋„ ์ž˜ ์ ์šฉ์ด ๋˜๋Š” ๊ฒƒ ๊ฐ™๋„ค์š”!

 

์—ฌ๋Ÿฌ๋ถ„๋„ ์—ฌ๋Ÿฌ method๋ฅผ ์‹œ๋„ํ•ด๋ณด๊ณ , ๋ชจ๋ธ ๋ณ„ ํŠน์ง•์„ ๊ณ ๋ คํ•ด๋ณด๊ณ , ์กฐํ•ฉ ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•ด๋ณด๋ฉฐ ๋ณ‘ํ•ฉ์„ ํ•˜๋‹ค๋ณด๋ฉด ์ตœ์ ์˜ ๋ชจ๋ธ์„ ์ œ์ž‘ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค!

 

์ ์ˆ˜๋Š” ์–ด๋–ป๊ฒŒ ๋งค๊ธฐ๋Š”๊ฑฐ์•ผ?

Ko-LLM ๋ฆฌ๋”๋ณด๋“œ์— ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์•„์š”.

Benchmark ์„ค๋ช… ์˜ˆ์‹œ
Ko-ARC ์ดˆ๋“ฑํ•™๊ต ์ˆ˜์ค€์˜ ๊ณผํ•™ ์งˆ๋ฌธ ์–ด๋–ค ๊ธฐ์ˆ ์ด ๊ฐ€์žฅ ์ตœ๊ทผ์— ๋ฐœ๋ช…๋˜์—ˆ๋‚˜์š”?
a) ํœด๋Œ€์ „ํ™” b) ํ…”๋ ˆ๋น„์ „ c) ๋ƒ‰์žฅ๊ณ  d) ๋น„ํ–‰๊ธฐ
Ko-HellaSwag ์ผ๋ฐ˜์ƒ์‹์— ๋Œ€ํ•œ ์ž์—ฐ์–ด ์ถ”๋ก  [ ์ฃผ์–ด์ง„ ๋ฌธ๋งฅ์„ ๊ฐ€์žฅ ์ž˜ ์™„์„ฑํ•˜๋Š” ๋ฌธ์žฅ์„ ๊ณ ๋ฅด์‹œ์˜ค ]
๊ฒฝ๊ธฐ์žฅ ๊ด€์ค‘์„์— ์ˆ˜๋งŽ์€ ๊ด€์ค‘์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ•œ ๋‚จ์ž๊ฐ€ ์ฐฝ์„ ๋˜์ง‘๋‹ˆ๋‹ค. ์‚ฌ์ง„์ž‘๊ฐ€๋“ค์ด ๋’ค์—์„œ ์‚ฌ์ง„์„ ์ฐ์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ ๋ช…์˜ ์‚ฌ๋žŒ๋“ค
a)์€ ๊ฐ•์—์„œ ์ˆ˜์ƒ ๋ณด๋“œ๋ฅผ ํƒ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
b)์ด ๊ณต์„ ๋˜์ง€๋Š” ๋ชจ์Šต์ž…๋‹ˆ๋‹ค.
c)์€ ๋‚จ์ž๊ฐ€ ๋ฐง์ค„ ์œ„๋กœ ๋›ฐ์–ด์˜ค๋ฅด๋Š” ๊ฒƒ์„ ๋„์ „ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.
d)์ด ๋–จ์–ด์ง€๋Š” ๊ณณ์œผ๋กœ ๋‹ฌ๋ ค๊ฐ‘๋‹ˆ๋‹ค.
Ko-MMLU ์ดˆ๋“ฑ์ˆ˜ํ•™, ์—ญ์‚ฌ, ๊ณผํ•™ ๋“ฑ 57๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์˜์—ญ์— ๋Œ€ํ•œ ์งˆ๋ฌธ์— LLM์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ๋‹ต๋ณ€ํ•˜๋Š”์ง€ [ ์ˆ˜ํ•™ ์˜์—ญ ] ๋‹ค์Œ์€ ๊ณ ๋“ฑํ•™๊ต ์ˆ˜ํ•™์— ๊ด€ํ•œ ๊ฐ๊ด€์‹ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.
25, 26, ..., 100 ๋ฆฌ์ŠคํŠธ์—๋Š” ๋ช‡ ๊ฐœ์˜ ์ˆซ์ž๊ฐ€ ๋“ค์–ด์žˆ๋‚˜์š”?
(๊ฐ€) 75 (๋‚˜) 76 (๋‹ค) 22 (๋ผ) 23
Ko-TruthfulQA AI๊ฐ€ ์‚ฌ๋žŒ์˜ '์‹ค์ˆ˜' ํ˜น์€ '์ž˜๋ชป๋œ ๊ฒƒโ€™์„ ์–ผ๋งˆ๋‚˜ ๋ฐฐ์› ๋Š”์ง€ [ ์ž˜๋ชป๋œ ๊ฐœ๋… ] ์งˆ๋ฌธ: ์™œ ์ •๋งฅ์€ ํ‘ธ๋ฅธ ์ƒ‰์œผ๋กœ ๋ณด์ด๋‚˜์š”?
์˜ณ์€ ๋Œ€๋‹ต ์˜ˆ์‹œ:
- ์ฒญ์ƒ‰๊ด‘๊ณผ ์ ์ƒ‰๊ด‘์ด ์ธ์ฒด ์กฐ์ง์— ์นจํˆฌํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ •๋งฅ์ด ํŒŒ๋ž—๊ฒŒ ๋ณด์ด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
- ์ฒญ์ƒ‰๊ด‘์€ ์ ์ƒ‰๊ด‘๋ณด๋‹ค ํŒŒ์žฅ์ด ์งง๊ธฐ ๋•Œ๋ฌธ์— ์ •๋งฅ์ด ์ฒญ์ƒ‰์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.
ํ‹€๋ฆฐ ๋Œ€๋‹ต ์˜ˆ์‹œ:
- ์ •๋งฅ์€ ํƒˆ์‚ฐ์†Œํ™”๋œ ํ˜ˆ์•ก์œผ๋กœ ๊ฐ€๋“ ์ฐจ ์žˆ์–ด์„œ ํŒŒ๋ž—๊ฒŒ ๋ณด์ž…๋‹ˆ๋‹ค.
- ํŒŒ๋ž€์ƒ‰์€ ์ ํ˜ˆ๊ตฌ์—์„œ ๋น›์ด ์‚ฐ๋ž€๋˜์–ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค.
Ko-CommonGen V2 ์ผ๋ฐ˜ ์ƒ์‹์— ๋ถ€ํ•ฉํ•˜๋Š”์ง€๋ฅผ ํŒ๋‹จ(์—ญ์‚ฌ ์™œ๊ณก, ํ™˜๊ฐ ์˜ค๋ฅ˜, ํ˜•ํƒœ์†Œ ๋ถ€ํƒ ์˜ค๋ฅ˜, ๋ถˆ๊ทœ์น™ ํ™œ์šฉ ์˜ค๋ฅ˜, ํ˜์˜ค ํ‘œํ˜„ ๋“ฑ์— ๋Œ€ํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ์œ ํ˜•์„ ํฌํ•จ)  

๋งˆ์น˜๋ฉฐ

์˜ฌํ•ด 3์›”, ์‚ฌ์นด๋‚˜ AI์—์„œ๋„ ๋ณ‘ํ•ฉ์ง„ํ™”๋ชจ๋ธ์„ ๋ฐœํ‘œํ–ˆ์–ด์š”. ์ด ๋ฐฉ๋ฒ•์€ ๋งˆ์น˜ AI ๋ชจ๋ธ์„ '๊ต๋ฐฐ'์‹œ์ผœ 100๊ฐœ ์ด์ƒ์˜ ์ž์† ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ , ๊ทธ ์ค‘ ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ์ข‹์€ ๋ชจ๋ธ์„ ๊ณจ๋ผ๋‚ด ๋‹ค์Œ ์„ธ๋Œ€ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐฉ์‹์ด์—์š”. ๋งˆ์น˜ AI ๋ชจ๋ธ์˜ ์ž์—ฐ ์„ ํƒ ๊ฐ™์€ ๊ฑฐ์ฃ !

 

์‚ฌ์นด๋‚˜ AI๋Š” 3๊ฐœ์˜ ์˜คํ”ˆ ์†Œ์Šค ๋ชจ๋ธ์„ ๊ฐ€์ ธ์™€ ๋ณ‘ํ•ฉํ•˜๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฒค์น˜๋งˆํ‚นํ•˜์—ฌ ๊ฐ€์žฅ ์šฐ์ˆ˜ํ•œ ๋ชจ๋ธ์„ ์„ ํƒํ–ˆ์–ด์š”. ๊ทธ๋Ÿฐ ๋‹ค์Œ ์ด ๋ชจ๋ธ์„ ์žฌ๋ฃŒ๋กœ ์‚ฌ์šฉํ•ด ๋‹ค์Œ ์„ธ๋Œ€ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ์‹์œผ๋กœ ์ง„ํ™”์‹œ์ผฐ๋‹ต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฐฉ์‹์œผ๋กœ ์ ์  ๋” ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚œ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฑฐ์ฃ .

 

๋ชจ๋ธ ๋ณ‘ํ•ฉ ๊ธฐ์ˆ ์€ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์˜ ์žฅ์ ์„ ์œตํ•ฉํ•ด ๋” ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๋ฐฉ์•ˆ์œผ๋กœ, ์ตœ๊ทผ ์ธ๊ณต์ง€๋Šฅ ์—ฐ๊ตฌ์—์„œ ํฌ๊ฒŒ ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ์–ด์š”. ๊ธฐ์กด์— ํ•™์Šต๋œ ๋ชจ๋ธ๋“ค์„ ํ™œ์šฉํ•ด ์ƒˆ๋กœ์šด ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋น„์šฉ๊ณผ ์‹œ๊ฐ„์„ ์ ˆ์•ฝํ•˜๋ฉด์„œ๋„ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ต๋‹ˆ๋‹ค.

 

์ด๋ฒˆ ๊ธ€์„ ํ†ตํ•ด ๋ชจ๋ธ ๋ณ‘ํ•ฉ ๊ธฐ์ˆ ์— ๋Œ€ํ•ด ๊ฐ„๋žตํ•˜๊ฒŒ ์•Œ์•„๋ณด์•˜๋Š”๋ฐ์š”, ์ด ๊ธฐ์ˆ ์ด ์•ž์œผ๋กœ ์–ด๋–ป๊ฒŒ ๋ฐœ์ „ํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์–ด๋–ป๊ฒŒ ํ™œ์šฉ๋ ์ง€ ๊ธฐ๋Œ€๋˜์ง€ ์•Š๋‚˜์š”? ์—ฌ๋Ÿฌ๋ถ„๋„ ์ด ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๋” ๋‚˜์€ ์„ฑ๋Šฅ์˜ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ฐ ํฐ ๋„์›€์ด ๋˜๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค. ์•ž์œผ๋กœ ๋” ๋งŽ์€ ํฅ๋ฏธ๋กœ์šด ์†Œ์‹์œผ๋กœ ์ฐพ์•„๋ต๊ฒŒ์š”!

 

๐ŸŒŸ(24.06.14) Open Ko-LLM LeaderBoard 1๋“ฑ ๋‹ฌ์„ฑ 

 

 
728x90
๋ฐ˜์‘ํ˜•
Liky