๋ถ๋ฅ ์ ์ฒด๋ณด๊ธฐ31 [Deep learning] Class-Incremental Learning (LwF, PODNet) ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ํ ๋ฒ์ ์ ์ฅํ๊ณ ํ์ตํ๋ ๊ฒ์ ๋นํจ์จ์ ์ด๊ณ ์ด์ฉ๋ฉด ๋นํ์ค์ ์ด๋ค. ํนํ, ๋ฐ์ดํฐ๊ฐ ๋งค์ฐ ํฌ๊ฑฐ๋ ๋ฏผ๊ฐํ ์ ๋ณด๋ฅผ ํฌํจํ๋ ๊ฒฝ์ฐ์๋ ๋์ฑ! ๊ทธ๋์ ๊ณ ์๋ Class-Incremental Learning (CIL)์ ๋ชจ๋ธ์ด ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ ์ง์ ์ผ๋ก ์๋ก์ด ํด๋์ค๋ฅผ ํ์ตํ๋ ํ์ต๋ฒ์ด๋ค. ์ ํต์ ์ธ ํ์ต ๋ฐฉ์์์๋ ๋ชจ๋ ํด๋์ค๋ฅผ ํ ๋ฒ์ ํ์ตํ์ง๋ง, CIL์์๋ ๋ฐ์ดํฐ๊ฐ ์ ์ง์ ์ผ๋ก ์ ๊ณต๋๋ฉฐ ๋ชจ๋ธ์ด ์๋ก์ด ํด๋์ค๋ฅผ ํ์ตํ ๋ ์ด์ ์ ํ์ตํ ๋ด์ฉ์ ์์ง ์๋๋ก ํ๋ ๊ฒ์ด ์ค์ํ๋ค. ์ด๋ CIL์ด ๋ค๋ฃจ๋ Catastrophic Forgetting ๋ฌธ์ ๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋๋ฐ, ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ค์ํ ๋ฐฉ๋ฒ ์ค LwF์ PODNet์ ๊ฐ๋จํ ์๊ฐํด ๋ณด๊ฒ ๋ค.๋์ ๊ตฌํํ ipynb ํ์ผ์ ์๋ Github repo.. 2024. 7. 8. [Deep learning] What is 'Style transfer'? (CVPR 2016) Image Style Transfer Using Convolutional Neural Networks (https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_2016_paper.pdf)(ECCV 2016)Perceptual Losses for Real-Time Style Transfer and Super-Resolution (https://arxiv.org/pdf/1603.08155.pdf) โจ Style Transfer๋? ์ด๋ฏธ์ง์ '์ปจํ ์ธ '๋ ๊ทธ๋๋ก ๋๊ณ '์คํ์ผ'์ ๋ณํํ๋ ๊ธฐ์ ์ด๋ค. ํนํ 2016๋ ์ ๋ฐํ๋ ๋ ๋ ผ๋ฌธ, "Image Style Transfe.. 2024. 7. 7. [Deep learning] Accelerating the Super-Resolution Convolutional Neural Network ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ (ECCV 2016) Accelerating the Super-Resolution Convolutional Neural Network (https://arxiv.org/pdf/1608.00367.pdf)์ด ๋ ผ๋ฌธ์ ๊ธฐ์กด์ Super Resolution CNN(SRCNN)์ ์ฐ์ฐ์ ๊ฐ์ํํ๋ ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํ๋ค. Super resolution task๋ ์ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ์ ๋ ฅ๋ฐ์ ๊ณ ํด์๋๋ก ๋ณต์ํ๋ ์์ ์ด๋ค. 1. ๊ธฐ์กด์ SRCNN SRCNN์ Dong et al. (2014)์ ์ํด ์ ์๋ ๋ชจ๋ธ๋ก, ๊ธฐ๋ณธ์ ์ผ๋ก ์ธ ๊ฐ์ ์ปจ๋ณผ๋ฃจ์ ๋ ์ด์ด๋ก ๊ตฌ์ฑ๋์ด Patch Extraction and Representation, Non-Linear Mapping, Reconstruction์ ๊ณผ์ ์ ํตํด ์ด๋ฏธ์ง ํด์๋๋ฅผ ๋ณต์.. 2024. 7. 7. [CV] ViT, ViViT (Vision Transformer, Video Vision Transformer) https://yoomimi.tistory.com/entry/Attention-Seq2Seq-Transformer [Deep Learning] Attention, Seq2Seq, TransformerVision Transformer๋ฅผ ์ดํดํ๊ธฐ ์ํด ํ์์ ์ธ ๊ฐ๋ ๋ค์ ํ๋ฐ ์ ๋ฆฌํด๋ณด๋ ค๊ณ ํ๋ค.์ฐ์ RNN, LSTM, GRU์ ๊ดํ ํฌ์คํ ์ ์๋! ์ด ๊ฐ๋ ์ ์์์ผ ์ดํดํ๊ธฐ ํธํ๋ค. https://yoomimi.tistory.com/entry/RNN-LSTM-GRU [Deepyoomimi.tistory.com ์ฐ์ Attention๊ณผ Transformer์ ๊ดํ ์ดํด๊ฐ ํ์ํ๋ค. 1. ViT (Vision Transformer)Transformer๊ฐ ์์ฐ์ด ์ฒ๋ฆฌ ๋ถ์ผ์์ SOTA๋ก ์ฐ์ด๋ CV ์ชฝ์์๋ ์ด๋ฅผ.. 2024. 7. 5. [CV] Statistical object recognition, PCA/LDA, SVD ๐ Statistical object recognition, PCA/LDA, SVD2024๋ ์ฐ์ธ๋ํ๊ต ์ปดํจํฐ๊ณผํ๊ณผ 4ํ๋ ๊ณผ๋ชฉ์ธ Computer Vision์ ์๊ฐํ๋ฉฐ... #1. Object recognition์์ categorization์ ๋ํ statisticalํ ๊ด์ ๋ฒ ์ด์ฆ ์ ๋ฆฌ (Bayes Rule) ์ด์ฉ: p(zebra | image) = p(image | zebra) p(zebra) ์ฌํ ํ๋ฅ (Posterior): p(zebra โฃ image)์ฐ๋ (Likelihood): p(image โฃ zebra)์ฌ์ ํ๋ฅ (Prior): p(zebra) MAP decision (Maximum a Posteriori Decision): ๊ฒฐ๊ตญ ์ฐ๋ฆฌ์ ๋ชฉ์ ์ posterior๊ฐ ์ต๋๊ฐ ๋๋๋ก ํ๋.. 2024. 6. 9. [Deep Learning] Attention, Seq2Seq, Transformer Vision Transformer๋ฅผ ์ดํดํ๊ธฐ ์ํด ํ์์ ์ธ ๊ฐ๋ ๋ค์ ํ๋ฐ ์ ๋ฆฌํด๋ณด๋ ค๊ณ ํ๋ค.์ฐ์ RNN, LSTM, GRU์ ๊ดํ ํฌ์คํ ์ ์๋! ์ด ๊ฐ๋ ์ ์์์ผ ์ดํดํ๊ธฐ ํธํ๋ค. https://yoomimi.tistory.com/entry/RNN-LSTM-GRU [Deep Learning] RNN, LSTM, GRU ์ด์ ๋ฆฌโ (+ํ์)RNN(Recurrent Neural Network)์ฐ์ ๋ ์ต์ํ CNN์์ ์ถ๋ฐํด๋ณด์. CNN์ input(๋ค)์ ์ด์ฉํด output์ ์์ธกํ๋๋ฐ, ๊ทธ ๊ณผ์ ์์ data๊ฐ ์ฌ์ฌ์ฉ๋์ง ์๋๋ค. ๋น์ฐํ๋ค. CNN์ input ํ๋๋ฅผ ํ๊บผ๋ฒ์ ๋ฃ์ด์ฃผ๊ธฐ ๋๋ฌธyoomimi.tistory.com ๋ค์ด๊ฐ๊ธฐ ์ , ๊ธฐ๊ณ ๋ฒ์ญ์ ๋ฐ์ ๊ณผ์ ์ ์๊ณ ๊ฐ๋ฉด ์ข๋ค.RNN > LSTM > .. 2024. 2. 19. [Deep Learning] RNN, LSTM, GRU ์ด์ ๋ฆฌโ (+ํ์) RNN(Recurrent Neural Network)์ฐ์ ๋ ์ต์ํ CNN์์ ์ถ๋ฐํด๋ณด์. CNN์ input(๋ค)์ ์ด์ฉํด output์ ์์ธกํ๋๋ฐ, ๊ทธ ๊ณผ์ ์์ data๊ฐ ์ฌ์ฌ์ฉ๋์ง ์๋๋ค. ๋น์ฐํ๋ค. CNN์ input ํ๋๋ฅผ ํ๊บผ๋ฒ์ ๋ฃ์ด์ฃผ๊ธฐ ๋๋ฌธ์ด๋ค. ํ๋๋ฅผ ํ๊บผ๋ฒ์? ์ด๋ฏธ์ง ํ๋๋ฅผ ๋ฃ์ ๋ ๊ฐ๊ฐ์ ํฝ์ ์ ์์๋๋ก ๋ฃ์ง ์๊ณ ํ๋ฒ์ Convolution layer๋ฅผ ๋ง๋๊ฒ ํด๋ฒ๋ฆฌ๋ ์ผ์ ์์ํด๋ณด๋ฉด ๋๋ค. ๋ฌผ๋ก Convolution layer์ kernel size๋๋ฌธ์ ๋จผ์ ์ฝํ๋ ๋ถ๋ถ์ด ์กด์ฌํ์ง ์๋๋ ์ถ์ ์ ์์ง๋ง, ๊ทธ ์์๊ฐ ์ค์ํ๊ฐ? ์ ๋ ๊ทธ๋ ์ง ์๋ค. ์ด๋ฏธ์ง์์ locality๊ฐ ์ค์ํ ๊ฒ์ sequence๊ฐ ์ค์ํ ๊ฒ๊ณผ๋ ๋ค๋ฅธ ์๋ฏธ๋ค. RNN์ sequence data(์๊ณ์ด dat.. 2024. 1. 12. [HCI] The Alleviation of Perceptual Blindness During Driving in Urban Areas Guided by Saccades Recommendation, IEEE Transactions on Intelligent Transportation Systems (2022) (๋ ผ๋ฌธ ๋ฆฌ๋ทฐ) โจ ABSTRACT ์ด์ ์ ์ธ์ง์ ๋งน์ ์ด ์ฃผ์ ๊ตํต์ฌ๊ณ ์์ธ ์ค ํ๋๋ค. ์ด ๋ ผ๋ฌธ์ computational visual attention models (CVAMs)์ด ์ธ๊ฐ์ attention mechanism๊ณผ ์ ์ฌํ๊ฒ ์ฃผ์๋ฅผ ์์ธกํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๊ฒ์ ๊ธฐ๋ฐ์ผ๋ก, ๋์ ๋๋ก ํ๊ฒฝ์์ ์ด์ ์์ ์ ํฅ์์ํค๊ธฐ ์ํ saccades strategy recommendation์ ์์ฌํ๋ค. ์ด ๋ ผ๋ฌธ์ ์ฐจ๋ณ์ ์ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ด driving task์์ visual attention์ ์ด์ฉํ computational model์ testํ ๋ image๋ video๋ฅผ ์ฌ์ฉํ๋ฐ ๋ฐํด real-world task๋ฅผ ์ํ์์ผฐ๋ค๋ ์ ์ด๋ค. โจ METHOD eye movements๋ฅผ ๋ค์์ ํน์ง๋ค์ ๋ฐ๋ผ ๋ถ๋ฅํ๊ณ , ์ด๋ฅผ .. 2024. 1. 12. ์ด์ 1 2 3 4 ๋ค์