- (CVPR 2016) Image Style Transfer Using Convolutional Neural Networks (https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_2016_paper.pdf)
- (ECCV 2016)Perceptual Losses for Real-Time Style Transfer and Super-Resolution (https://arxiv.org/pdf/1603.08155.pdf)
โจ Style Transfer๋?
์ด๋ฏธ์ง์ '์ปจํ ์ธ '๋ ๊ทธ๋๋ก ๋๊ณ '์คํ์ผ'์ ๋ณํํ๋ ๊ธฐ์ ์ด๋ค. ํนํ 2016๋ ์ ๋ฐํ๋ ๋ ๋ ผ๋ฌธ, "Image Style Transfer Using Convolutional Neural Networks" (CVPR 2016)๊ณผ "Perceptual Losses for Real-Time Style Transfer and Super-Resolution" (ECCV 2016)์ style transfer ๊ธฐ์ ์ ๋ฐ์ ์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
1. Image Style Transfer Using Convolutional Neural Networks (CVPR 2016)
์ด ๋ ผ๋ฌธ์ CNN์ ์ฌ์ฉํด style transfer๋ฅผ ์ด๋ฃจ๋ ๋ฐฉ์์ ์ฐ๊ตฌํ๋ค. contents ์ด๋ฏธ์ง์ ๊ตฌ์กฐ์ style ์ด๋ฏธ์ง์ style์ ํฉํ๊ฒ ๋๋๋ฐ, ๋ ๊ฐ์ CNN ์ค ํ๋๋ contents ์ด๋ฏธ์ง๋ฅผ ์ฒ๋ฆฌํ๊ณ , ๋ค๋ฅธ ํ๋๋ style ์ด๋ฏธ์ง๋ฅผ ์ฒ๋ฆฌํ๋ค. ์ด๊ฒ๋ค์ด 'ํฉํด์ง๋' ๊ฒ์ ๊ฒฐ๊ตญ loss function์ ๋ฌ๋ ค์๋ค. Loss ์ญ์ ๋๋ก ๋๋๋๋ฐ, content loss์ contents ์ด๋ฏธ์ง์ ์์ฑ๋ ์ด๋ฏธ์ง ์ฌ์ด์ ์ฐจ์ด๋ฅผ ์ต์ํํ๊ณ , style ์์ค์ style ์ด๋ฏธ์ง์ ์์ฑ๋ ์ด๋ฏธ์ง ์ฌ์ด์ ์คํ์ผ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ค.
์ฐ์ content loss๋ค. ์ฌ๊ธฐ์ F๋ ์์ฑ๋ ์ด๋ฏธ์ง์ ๋ ์ด์ด l์์์ feature map, P๋ contents ์ด๋ฏธ์ง์ ๋ ์ด์ด l์์์ feature map์ ์๋ฏธํ๋ค. loss ํํ๋ ์ผ๋ฐ์ ์ผ๋ก ๊ทธ๋ ๋ฏ MSE loss term์ ๋ฏธ๋ถ ํธํ๊ฒ 1/2๊ฐ ๊ณฑํด์ง ํํ๋ค.
๋ค์์ style loss๋ค. ์ฌ๊ธฐ์ G๋ ์์ฑ๋ ์ด๋ฏธ์ง์ ๋ ์ด์ด l์์์ Gram Matrix, A๋ style ์ด๋ฏธ์ง์ ๋ ์ด์ด l์์์ Gram Matrix๋ค. (Gram Matrix ๊ณ์ฐ์ feature map์ ๊ณฑ์ผ๋ก ์ด๋ฃจ์ด์ง๋ค.) MSE๋ฅผ ์ทจํ๊ณ ๋ ์ด์ด l์ ํํฐ ์์ธ N_l๊ณผ ๋ ์ด์ด l์ feature map ํฌ๊ธฐ M_l์ ์ด์ฉํด 1์ฐจ weighting์ ํด์ฃผ๊ณ , w_l๋ก ๋ ์ด์ด l์ ์ต์ข weighting์ ๊ณฑํด ๋ชจ๋ layer์์ loss๋ฅผ ํฉํด(์ ์ฒด layer ์ L) ์ต์ข style loss๋ฅผ ๊ณ์ฐํ๋ค.
๊ฒฐ๊ตญ total loss๋ ์ด๋ ๊ฒ ๊ฒฐ์ ๋๋ค. ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํ alpha, beta ์กฐ์ ์ด ํต์ฌ์ด๋ค.
2. Perceptual Losses for Real-Time Style Transfer and Super-Resolution (ECCV 2016)
์์ ๋ ผ๋ฌธ(CVPR 2016์ style transfer)์์๋ loss ๊ณ์ฐ์ MSE๋ฅผ ์ฌ์ฉํด ๋ ์ด๋ฏธ์ง ๊ฐ์ ํฝ์ ๋จ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋ฐ ์ค์ ์ ๋์๋๋ฐ, ์ด๋ฌํ ์ ๊ทผ๋ฒ์ ์ ํด์๋ ์ด๋ฏธ์ง๋ ๋ ธ์ด์ฆ๊ฐ ํฌํจ๋ ์ด๋ฏธ์ง์ ๊ฐ์ ๋จ์ํ ๊ฒฝ์ฐ์๋ ์ ์๋ํ ์ ์์ง๋ง, ๊ณ ํด์๋ ์ด๋ฏธ์ง๋ ๋ณต์กํ ํจํด์ ํฌํจํ ์ด๋ฏธ์ง์์๋ ํ๊ณ๊ฐ ์๋ค. ๊ทธ๋์ ์ด ๋ ผ๋ฌธ์์๋ style transfer์ super-resolution์ ์ํ ์๋ก์ด loss function์ผ๋ก perceptual loss์ ์ ์ํ๋ค. perceptual loss๋ CNN์ ์ค๊ฐ ๋ ์ด์ด์์ ์ถ์ถํ feature map์ ์ฌ์ฉํด ๊ณ์ฐ๋์ด ์ด๋ฏธ์ง์ ๊ณ ์์ค ์๊ฐ์ ์ ๋ณด๋ฅผ ์ ์งํ๋ ๋ฐ ๋์์ ์ค๋ค.
Content Loss์ด๋ค. ฯj๋ ์ ๊ฒฝ๋ง์ jj ๋ฒ์งธ ๋ ์ด์ด์์์ feature map์ ์๋ฏธํ๋ค y_hat์ด ์์ฑ๋ ์ด๋ฏธ์ง, y๊ฐ contents ์ด๋ฏธ์ง๋ค.
Style loss๋ Gram Matrix๋ฅผ ์ฌ์ฉํ์ฌ feature map์ ์ฑ๋ ๊ฐ ์ํธ์์ฉ์ ํ๊ฐํ๋ค. ์ฌ๊ธฐ์ ์ฌ์ฉ๋๋ Gram Matrix๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ถ๊ฐ๋ก Total Variation Loss๋ฅผ ๊ตฌํ๊ฒ ๋๋๋ฐ, ์ด๋ฏธ์ง์ ๊ณต๊ฐ์ ์ฐ์์ฑ์ ์ ์งํ๊ณ , ์์ฑ๋ ์ด๋ฏธ์ง์์ artifact(์ธ์์ ์ธ ์๊ณก์ด๋ noise)๋ฅผ ์ค์ด๊ธฐ ์ํจ์ด๋ค.
๊ทธ๋์ ์ต์ข ์ ์ผ๋ก ์ต์ ํํด์ผํ๋ loss function์ ๋ค์๊ณผ ๊ฐ์ด ๋๋ค.
'Study > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Deep learning] Class-Incremental Learning (LwF, PODNet) (0) | 2024.07.08 |
---|---|
[Deep learning] Accelerating the Super-Resolution Convolutional Neural Network ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ (0) | 2024.07.07 |
[Deep Learning] Attention, Seq2Seq, Transformer (0) | 2024.02.19 |
[Deep Learning] RNN, LSTM, GRU ์ด์ ๋ฆฌโ (+ํ์) (1) | 2024.01.12 |
[AI] What is ResNet? (1) | 2024.01.05 |