본문 바로가기
과학/머신러닝

딥러닝 주요 논문 리뷰 (3) - 이미지

by pandatta 2022. 12. 10.

딥러닝 주요 논문 리뷰 시리즈

딥러닝 주요 논문 리뷰 (0) - 기초
MTL, TL, GDO
딥러닝 주요 논문 리뷰 (1) - 자연어
BiRNN, LSTM, Skip-gram, Word2Vec
딥러닝 주요 논문 리뷰 (2) - 자연어 생성
Seq2Seq, Attention, Transformer, GPT, BERT
딥러닝 주요 논문 리뷰 (3) - 이미지
CNN, AlexNet, ResNet, EffNet
딥러닝 주요 논문 리뷰 (4) - 이미지 생성
VAE, GAN, StyleGAN, StableDiffusion

딥러닝 주요 논문 리뷰 시리즈 Deep learning milestone papers review series

통계 공부에 이어 또 캐글 예제나 풀어볼까 하다가, 다시 초심으로 돌아가자는 마음에 딥러닝의 주요 논문들을 뽑아서 읽어보기로 했습니다. GitHub 웹사이트에서 Arxiv 논문을 찾아, 읽는 김에 요약도 해보기로 했습니다. 자세히 읽지는 않았으니 정확하지 않거나 핵심이 아닌 부분이 있을 수도 있고, 모든 딥러닝의 주요 논문이 있지도 않습니다. 혹시 공부하시다가 놓친 부분을 제 글에서 다시 잡으실 수라도 있으면 저는 뿌듯하겠습니다.

네번째 글은 이미지처리에 대한 논문들입니다. 이미지 분야는 머신러닝으로는 한계가 있던 ImageNet이라는 데이터셋을 분류하는 작업을 통해 발전해왔습니다. 최근 이슈가 되고있는 Stable Diffusion 생성 모델은 다음 글에서 다루겠습니다. 머신러닝이나 딥러닝 기초를 학습하시고 싶은 분들은 단단한 머신러닝 또는 심층 학습 같은 교과서를 먼저 읽고 오시면 좋습니다.

1. CNN (Convolutional Neural Networks)

  • Ciresan, D., Meier, U., & Schmidhuber, J. (2012). Multi-column deep neural networks for image classification. In 2012 IEEE conference on computer vision and pattern recognition.
  • "The DNN of this paper have 2-dimensional layers of winner-take-all neurons with overlapping receptive fields whose weights are shared."
  • 동물의 시각피질이 겹겹이 쌓인 이미지를 어떻게 해석하는지에서 영감을 얻음.
  • 이미지를 1차원으로 해석한 기존의 CNN과 달리, 이미지를 2차원 벡터로 나타낸 다음 일정 크기의 사각형 안의 값 중 가장 영향력이 큰 하나를 선택(max pooling)해서 저해상도의 이미지로 재해석하는 방법.
  • Max pooling 시 영향력의 가중치를 주는 벡터를 filter라고 하고, 처음에는 filter를 무작위로 초기화함.
  • 특정 영역의 픽셀 모음 중 가장 영향력이 큰 픽셀을 계속 가져다 씀으로써 filter가 뚜렷해지며 해당 영역을 대표하는 형태를 추출할 수 있음.

2. AlexNet

3. ResNet (Residual Networks)

4. EffNet (Efficient Networks)

댓글