반응형
Computer Vision
목표
- 컴퓨터가 이미지를 이해하게 하는 것
- 사진에 무엇이 있는가?
- 무엇을 하고 있느 사진인가?
- 사진을 묘사할 수 있는가?
CNN
기존의 - Fully Connected Layer
- 이미지 데이터를 input으로 넣기 위해서는 2D 흑백 이미지나 컬러 이미지를 1차원 벡터로 변환하는 과정이 필요했음
- 이 과정에서 이미지의 구조가 파괴되고, 위치 정보가 손실된다는 문제가 있었음
- 이러한 문제로 인해 복잡한 이미지 분류 문제에서 성능 상의 한계가 존재함.
CNN의 특징
- filter이라고 하는 커널 행렬과, input의 합성곱을 통해 input의 shape은 유지하면서 정보를 요약한 축소된 Feature map을 생성함
- 서로 다른 가중치를 갖는 filter을 n개 사용하면, n개의 새로운 feature map을 생성할 수 있음
- 이 과정을 통해 만들어진 feature map의 레이어를 convolutional layer이라고 함.
Convolutional Neural Networks
Stride
filter가 input 데이터를 이동하는 shift 간격을 나타냄.
기본값은 1이며, 추출 후 다음 행/열로 이동함. stride가 2인 경우, filter는 두 픽셀씩 이동함
파라미터를 줄여 연산을 줄이는 효과가 있어 stride 사용 → 모델의 효율성을 높이는 데 도움이 됌
Zero Padding
기존의 데이터 외곽에 0값을 추가하는 것.
목적
- padding을 적용하면 외곽에 있는 정보의 추출 횟수가 증가해 정보 손실을 줄일 수 있다.
Pooling layer
- 정보를 축약하여 다운 샘플링하는 기법
- depth를 유지한 채로 데이터 사이즈를 줄여 연산량을 줄이는 것을 목표로함.
Max pooling
원본 데이터에서 가장 큰 값만 남기고 나머지를 제거하여 축약함
→ 가장 큰 값은 가장 영향을 많이 주는 값
→ 신호가 강한것만 가져오는 relu와 유사
반응형
'Review > KT Aivle School' 카테고리의 다른 글
[4기 에이쁠 기자단] 미니프로젝트 4차 (0) | 2023.10.31 |
---|---|
[4기 에이쁠 기자단] 시각지능 딥러닝(2) (0) | 2023.09.26 |
[4기 에이쁠 기자단] 미니프로젝트 2차 (0) | 2023.09.25 |
[4기 에이쁠 기자단] 딥러닝 (0) | 2023.09.25 |
[4기 에이쁠 기자단] 웹 크롤링 (0) | 2023.09.22 |