๋…ผ๋ฌธ๋ช…: Unlearning Aware Minimization

์ €์ž: ๊น€ํ˜ธ๊ธฐ (์ค‘์•™๋Œ€), ๊น€๊ฑด์šฐ (๋„ค์ด๋ฒ„ ํด๋ผ์šฐ๋“œ), ์ฑ„์„ฑ์› (์„œ์šธ๋Œ€ ๋ฐ•์‚ฌ ๊ณผ์ •), ์œค์ƒ์› (๋Œ€๊ฒ€์ฐฐ์ฒญ ๊ณต์ต๋ฒ•๋ฌด๊ด€)

๊ฒŒ์žฌ์ง€: NeurIPS 2025

URL:https://neurips.cc/virtual/2025/loc/san-diego/poster/116406/

์ค‘์•™์ผ๋ณด ๊ธฐ์‚ฌ ์›๋ฌธ

์ค‘์•™๋Œ€ํ•™๊ต(์ด์žฅ ๋ฐ•์ƒ๊ทœ)๊ฐ€ ์ธ๊ณต์ง€๋Šฅ๋„ ๋ง๊ฐํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์—ฐ๊ตฌ ์„ฑ๊ณผ๋ฅผ ๋ฐœํ‘œํ–ˆ๋‹ค.

์ค‘์•™๋Œ€๋Š” ์‚ฐ์—…๋ณด์•ˆํ•™๊ณผ ๊น€ํ˜ธ๊ธฐ ๊ต์ˆ˜๊ฐ€ ์ œ1์ €์ž๋กœ ์ฐธ์—ฌํ•œ ์—ฐ๊ตฌํŒ€์˜ ๋…ผ๋ฌธ์ด ์„ธ๊ณ„ ์ตœ๊ณ  ๊ถŒ์œ„์˜ ์ธ๊ณต์ง€๋Šฅ ํ•™ํšŒ์ธ โ€˜NeurIPS(Neural Information Processing System) 2025โ€™์— ์ฑ„ํƒ๋๋‹ค๊ณ  ๋ฐํ˜”๋‹ค.

์ด๋ฒˆ ์—ฐ๊ตฌ๋Š” ๋„ค์ด๋ฒ„ ํด๋ผ์šฐ๋“œ, ๋Œ€๊ฒ€์ฐฐ์ฒญ ๋“ฑ๊ณผ ๊ณต๋™์—ฐ๊ตฌ๋กœ ์ง„ํ–‰๋˜์—ˆ์œผ๋ฉฐ, ์—ฐ๊ตฌํŒ€์€ ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ด ํŠน์ • ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋ง๊ฐ(Unlearning)ํ•˜๋„๋ก ๋งŒ๋“œ๋Š” ์ƒˆ๋กœ์šด ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ–ˆ๋‹ค. ๊ธฐ์กด ๊ธฐ๋ฒ•์€ โ€˜์žŠ์–ด์•ผ ํ•  ๋ฐ์ดํ„ฐโ€™๋ฅผ ์™„์ „ํžˆ ์ œ๊ฑฐํ•˜์ง€ ๋ชปํ•˜๊ฑฐ๋‚˜, โ€˜์œ ์ง€ํ•ด์•ผ ํ•  ๋ฐ์ดํ„ฐโ€™์˜ ์„ฑ๋Šฅ์„ ์ €ํ•˜์‹œํ‚จ๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ๋‹ค.

์—ฐ๊ตฌํŒ€์€ ์ด๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด โ€˜Unlearning-Aware Minimization(UAM)โ€™์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ์ตœ์†Œ-์ตœ๋Œ€(min-max) ์ตœ์ ํ™” ๋ฐฉ์‹์„ ์ œ์‹œํ–ˆ๋‹ค. ๋ง๊ฐ ๋Œ€์ƒ ๋ฐ์ดํ„ฐ์—์„œ ๋†’์€ ์†์‹ค์„ ์œ ๋ฐœํ•˜๋Š” ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ์•„๋‚ด๊ณ , ์ด๋ฅผ ํ™œ์šฉํ•ด ์œ ์ง€ ๋ฐ์ดํ„ฐ์˜ ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ•™์Šต์„ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, CIFAR-10, CIFAR-100, TinyImageNet ๋“ฑ์˜ ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹๊ณผ WMDP-Bio, WMDP-Cyber ๊ฐ™์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ์ž…์ฆํ–ˆ๋‹ค.

๊น€ํ˜ธ๊ธฐ ๊ต์ˆ˜๋Š” โ€œ์ด๋ฒˆ ์—ฐ๊ตฌ๋Š” ์‚ฌ์šฉ์ž์˜ โ€˜์žŠํ˜€์งˆ ๊ถŒ๋ฆฌ(right to be forgotten)โ€™๋ฅผ ์‹คํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ ๋กœ์จ ํ–ฅํ›„ ๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ ๋ถ„์•ผ์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ ๋กœ ๋ฐœ์ „ํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€ํ•œ๋‹คโ€๊ณ  ๋งํ–ˆ๋‹ค.

์—ฐ๊ตฌํŒ€์€ ์•ž์œผ๋กœ ์‹ค์ œ ์‘์šฉ ํ™˜๊ฒฝ์—์„œ์˜ ์–ธ๋Ÿฌ๋‹ ๋„์ž…๊ณผ ์„ค๋ช… ๊ฐ€๋Šฅํ•œ ์ธ๊ณต์ง€๋Šฅ ๊ฐœ๋ฐœ์„ ํ†ตํ•ด ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ธ๊ณต์ง€๋Šฅ ๊ตฌํ˜„์„ ๋ชฉํ‘œ๋กœ ์—ฐ๊ตฌ๋ฅผ ์ด์–ด๊ฐˆ ๊ณ„ํš์ด๋‹ค.

์ด๋ฒˆ ๋…ผ๋ฌธ โ€œUnlearning-Aware Minimizationโ€์€ 12์›” ๋ฏธ๊ตญ ์ƒŒ๋””์—๊ณ ์—์„œ ๊ฐœ์ตœ๋˜๋Š” NeurIPS 2025์—์„œ ๋ฐœํ‘œ๋  ์˜ˆ์ •์ด๋‹ค.