YOLOv8 이해하기 (2)

티스토리 뷰

Deep-learning

Sims. 2024. 11. 8. 20:21

728x90

YOLOv8 이해하기 (1) - Backbone

디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. 디텍션에는 2-stage / 1-stage 두개로 나뉘는데, YOLO는 1-stag

sims-solve.tistory.com

이전까지는 YOLOv8의 BackBone이 어떻게 돌아가는지 코드를 디버깅해보고, 손으로 input image의 shape의 변화를 작성해 봤다.

BackBone은 이미지의 특성을 추출하는 부분으로, 다수의 feature map을 만드는 역할을 해준다.

이제, 생성된 Feature 맵을 이용하여 Detection에서 필요로 하는 Bbox의 좌표들과 Class를 나누는 역할을 해주는 Head 부분을 살펴보려 한다.

Head부분은 BackBorn에서 구한 결과 값들을 Concat하는 상황이 많이 발생하므로 해당 부분만 신경써서 보면 큰 문제는 없을 것이다.

이렇게 되면, Large / Middle / Small 사이즈 크기( 3종류) 의 Feature map을 생성할 수 있게 된다.

이 Feature map을 이용하여 Detection의 Bbox와 Class들을 정하게 되는데 해당 내용은 다음 포스팅으로 이어가겠다.

막연하게 Yolo Architecture를 살펴봤을땐, 어렵다고 느껴졌지만, 하나씩 Flow를 따라가다보니, 충분히 따라갈 수 있었다.

아직 yolo 아키텍쳐가 막연하다면 한번 디버깅을 통해 직접 손으로 shape을 중심으로 찾아가는 것도 추천한다.

다음 포스팅은 어떻게 이런 output을 이용하여 최종 output으로 바꾸는지 포스팅 해보겠다.

YOLOv8 이해하기 (4) - Loss (0)	2024.11.11
YOLOv8 이해하기 (3) - Detection output shape (1)	2024.11.10
YOLOv8 이해하기 (1) - Backbone (0)	2024.11.07
[Deep Learning] YOLOv2 정리 - Anchor 적용 (0)	2024.07.15
[Deep Learning] YOLOv1 정리 - YOLO의 시작 (0)	2024.07.07

공지사항

최근에 올라온 글

최근에 달린 댓글

링크

글 보관함