티스토리 뷰

728x90

https://sims-solve.tistory.com/122

 

YOLOv8 이해하기 (1) - Backbone

디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. 디텍션에는 2-stage / 1-stage 두개로 나뉘는데, YOLO는 1-stag

sims-solve.tistory.com

 

이전까지는 YOLOv8의 BackBone이 어떻게 돌아가는지 코드를 디버깅해보고, 손으로 input image의 shape의 변화를 작성해 봤다.

 

BackBone은 이미지의 특성을 추출하는 부분으로, 다수의 feature map을 만드는 역할을 해준다.

이제, 생성된 Feature 맵을 이용하여 Detection에서 필요로 하는 Bbox의 좌표들과 Class를 나누는 역할을 해주는 Head 부분을 살펴보려 한다.

 

Head부분은 BackBorn에서 구한 결과 값들을 Concat하는 상황이 많이 발생하므로 해당 부분만 신경써서 보면 큰 문제는 없을 것이다.

 

 

이렇게 되면, Large / Middle / Small 사이즈 크기( 3종류) 의 Feature map을 생성할 수 있게 된다.

이 Feature map을 이용하여 Detection의 Bbox와 Class들을 정하게 되는데 해당 내용은 다음 포스팅으로 이어가겠다.

 

막연하게 Yolo Architecture를 살펴봤을땐, 어렵다고 느껴졌지만, 하나씩 Flow를 따라가다보니, 충분히 따라갈 수 있었다.

아직 yolo 아키텍쳐가 막연하다면 한번 디버깅을 통해 직접 손으로 shape을 중심으로 찾아가는 것도 추천한다.

 

다음 포스팅은 어떻게 이런 output을 이용하여 최종 output으로 바꾸는지 포스팅 해보겠다.

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함