티스토리 뷰
728x90
https://sims-solve.tistory.com/122
이전까지는 YOLOv8의 BackBone이 어떻게 돌아가는지 코드를 디버깅해보고, 손으로 input image의 shape의 변화를 작성해 봤다.
BackBone은 이미지의 특성을 추출하는 부분으로, 다수의 feature map을 만드는 역할을 해준다.
이제, 생성된 Feature 맵을 이용하여 Detection에서 필요로 하는 Bbox의 좌표들과 Class를 나누는 역할을 해주는 Head 부분을 살펴보려 한다.
Head부분은 BackBorn에서 구한 결과 값들을 Concat하는 상황이 많이 발생하므로 해당 부분만 신경써서 보면 큰 문제는 없을 것이다.
이렇게 되면, Large / Middle / Small 사이즈 크기( 3종류) 의 Feature map을 생성할 수 있게 된다.
이 Feature map을 이용하여 Detection의 Bbox와 Class들을 정하게 되는데 해당 내용은 다음 포스팅으로 이어가겠다.
막연하게 Yolo Architecture를 살펴봤을땐, 어렵다고 느껴졌지만, 하나씩 Flow를 따라가다보니, 충분히 따라갈 수 있었다.
아직 yolo 아키텍쳐가 막연하다면 한번 디버깅을 통해 직접 손으로 shape을 중심으로 찾아가는 것도 추천한다.
다음 포스팅은 어떻게 이런 output을 이용하여 최종 output으로 바꾸는지 포스팅 해보겠다.
반응형
'Deep-learning' 카테고리의 다른 글
YOLOv8 이해하기 (4) - Loss (0) | 2024.11.11 |
---|---|
YOLOv8 이해하기 (3) - Detection output shape (0) | 2024.11.10 |
YOLOv8 이해하기 (1) - Backbone (0) | 2024.11.07 |
[Deep Learning] YOLOv2 정리 - Anchor 적용 (0) | 2024.07.15 |
[Deep Learning] YOLOv1 정리 - YOLO의 시작 (0) | 2024.07.07 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- c3k2
- 티스토리챌린지
- YOLO
- 오류
- 이미지
- java
- CNN
- 백준
- 어탠션
- 초보자
- 욜로
- 깃
- 딥러닝
- 자바
- yolov11
- Tree
- GIT
- 디텍션
- V11
- YOLOv8
- github
- 도커
- DeepLearning
- docker
- 오블완
- 알고리즘
- 정리
- 뜯어보기
- GNN
- python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함