Deep Learning, CNN
1. 딥러닝 기반 영상인식
딥러닝이란
- 딥러닝은 Deep Neural Network를 통해 학습(Learning) 하는 것을 말함
- 층(레이어, Layer)의 갯수 <= 3 > 얕은층 신경망(Shallow Network)
- 층(레이어, Layer)의 갯수 > 3 > 심층 신경망(Deep Network)
Neural Network
비선형함수의 필요성
- NN은 1개의 벡터(텐서)를 다른 벡터로 매핑(Mapping)하는 함수로 볼 수 있다. 위의 NN은 X을 a(3)로 매핑하는 함수.
- 만약 W(1)과 W(2)의 사이에 어떤 비선형적인 함수가 없다면 W(2)W(1)은 W와 같아짐. 결국 2개의 행렬로 표현되는 NN을 1개의 행렬로 표현할 수 있어 2개의 레이어를 가진 NN과 같아짐
영상인식
Approximator로서의 DNN
- x와 f(x) 간의 관계가 단순하면 모델링하기도 쉽고 파라미터를 구하기도 쉬움
- 픽셀공간에서 Beaver와 Beaver 영상들간의 거리가 Beaver와 Anchor 영상들간의 거리보다 멀 수 있음
- Feature 매핑을 통해 Beaver 영상들을 한데로 모으고, Anchor 영상들을 한데로 모아서 분리가 쉽게 하도록 하는 것이 필요함
2. Convolutional Neural Network
Convolution 연산
CNN Filters
- https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner’s-Guide-To-Understanding-Convolutional-Neural-Networks
Multi-Channel Convolution
Input의 Ch 개수 = 필터의 Depth 개수 / 필터의 개수 = Feature Map의 개수
- Figure from: https://www.youtube.com/watch?v=jajksuQW4mc
비선형 함수(Non-Linear Function)
- Sigmoid 함수: 0 에서 1사이의 값으로 변환
Pooling
Pooling의 효과
CNN의 Structure
- Figure from Matlab site
- Figure by Abin - Roozgard
댓글남기기