Federated split bert for heterogeneous text classification
Lit, Zhengyang, et al. "Federated split bert for heterogeneous text classification." 2022 International Joint Conference on Neural Networks (IJCNN). IEEE, 2022.
Abstract
์ฐํฉ ํ์ต ์ค์ ์์ BERT๋ฅผ ์กฐ์ฌํ ๋ช ๊ฐ์ง ์ฐ๊ตฌ๊ฐ ์์ง๋ง ํด๋ผ์ด์ธํธ์ ๋ํ ์ด๊ธฐ์ข
(์: ๋น IID) ๋ฐ์ดํฐ๋ก ์ธํ ์ฑ๋ฅ ์์ค ๋ฌธ์ ๋ ์์ง ์ ๋๋ก ์กฐ์ฌ๋์ง ์์. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด BERT ์ธ์ฝ๋ ๊ณ์ธต์ ๋ก์ปฌ ๋ถ๋ถ๊ณผ ์ ์ญ ๋ถ๋ถ์ผ๋ก ๋ถํ ํ์ฌ ์ด์ข
๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ณ ํต์ ๋น์ฉ์ ์ค์ด๋ ํ๋ ์์ํฌ์ธ FedSplitBERT๋ฅผ ์ ์
์์ํ๋ฅผ ์ฌ์ฉํ FedSplitBERT๋ ํต์ ๋น์ฉ์ 11.9๋ฐฐ๊น์ง ์ค์ผ ์ ์์
Motivate
1. BERT๊ฐ์ PLM์ ๋ง์ NLP ์์
์์ ์ธ์์ ์ธ ์ฑ๋ฅ ๋ฌ์ฑ But, ๋ง์ ์ค์ ์ํฉ์์ Text Data๋ ์ผ๋ฐ์ ์ผ๋ก ๋ง์ ํด๋ผ์ด์ธํธ์ ๋ถ์ฐ๋์ด ์์ + ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๋ฐ ๊ท์ ๋๋ฌธ์ ์ค์ ์๋ฒ์ ์
๋ก๋ ๋ ์ ์์ → ์ฐํฉ ํ์ต์ผ๋ก ํด๊ฒฐ!
2. FL์์ BERT ๊ด๋ จ ์ฐ๊ตฌ๋ ๋ช๊ฐ์ง ์์ผ๋, ํด๋ผ์ด์ธํธ์ ์ด๊ธฐ์ข
๋ฐ์ดํฐ๋ก ์ธํ ์ฑ๋ฅ ํ๋ฝ ๋ฌธ์ ๋ ์ฐ๊ตฌ X → ์ด๊ธฐ์ข
๋ฐ์ดํฐ ์ฒ๋ฆฌํ๊ณ BERT ์ธ์ฝ๋ ๋ ์ด์ด๋ฅผ ๋ก์ปฌ+๊ธ๋ก๋ฒ ๋ถ๋ถ์ผ๋ก ๋ถํ ํด์ ํต์ ๋น์ฉ ์ ๊ฐ (FedSplitBERT Framework ์ ์)
3. BERT ๋ํ ํ๋ผ๋ฏธํฐ๊ฐ ๋๋ฌด ๋ง์์ ํต์ ๋น์ฉ์ด ๋์. → ๋ก์ปฌ ๋ ์ด์ด, ๊ธ๋ก๋ฒ ๋ ์ด์ด ๋๋ ์ ํ๋์ ํด๋ผ์ด์ธํธ์ ๋ฐ์ดํฐ๋ก๋ง ๋ก์ปฌ ํ์ต, ํ๋ผ๋ฏธํฐ ์ผ๋ถ๋ง ์๋ฒ๋ ์ํตํด ํต์ ๋น์ฉ ๋จ์ดํธ๋ฆผ
์ ์๋ชจ๋ธ ๋ฐ ๋ฐฉ์
ํ๋์ ์ธ์ฝ๋๋ง ๊ณต์ ํ๊ณ , ์ดํ๋ก๋ ๊ฐ๋ณ ํด๋ผ์ด์ธํธ์ ์ ์ํ๋ ๊ณ ์ ๋ก์ปฌ ๋ ์ด์ด๋ฅผ ๊ฐ์ง.
๊ธ๋ก๋ฒ ๋ ์ด์ด๋ ์๋ฒ๋ ํต์ ํ๊ณ , ๋ก์ปฌ ๋ ์ด์ด๋ ๊ฐ ํด๋ผ์ด์ธํธ์์ Private๋ก ์ ์งํจ.
์คํ
Non-IID(Independent and Identically Distributed) : ๋ฐ์ดํฐ๊ฐ "๋น๋ ๋ฆฝ์ "์ด๊ณ , "๋์ผํ์ง ์๊ฒ ๋ถ์ฐ"๋จ
์์ํ(Quantization): ์ ํ ์งํฉ์ ๋๋์ ์ ๋ ฅ๊ฐ์ ๋งคํํ๋ ๊ฒ. ์ฆ, ์ด์ฐ์ ์ธ ๊ฐ์ผ๋ก ๋ฐ๊พธ์ด ํ์
Result
๊ฒฐ๋ก
GLUE ๋ฒค์น๋งํฌ์์ ๋ค๋ฅธ FedAvg, FedProx, FedAdam์ ๋ฅ๊ฐํจ. BERT ๋ชจ๋ธ์ ํฐ ํฌ๊ธฐ๋ฅผ ์์ํ๋ฅผ ํ๊ณ ์ ์๋ฐฉ์์ฒ๋ผ ํ๋ ํต์ ๋น์ฉ 11.9๋ฐฐ ์ค์. ๊ตฌํํ๊ธฐ ์ฝ๊ณ ์ด๊ธฐ์ข
๋ฌธ์ ์ ํจ๊ณผ์ ์. ํจ๊ณผ์ ์ธ ๊ฐ์ค์น ์์ถ ๋ฐฉ์์ ์ ์ํจ.