YOLOv11 이해하기 (1) - Backbone
yolov11은 Backbone + neck + head 총 3가지로 나눠져 있다고 한다. ( backbone + head 로만 나누기도 한다.)
이중, 이번에는 Backbone을 살펴보고자 한다.
yolov11의 Backbone은 형태가 yolov8의 아키텍쳐와 거의 똑같다고 보면 된다. 하지만 중간중간 특정 Block으로 바뀌면서 yolov11로 업그레이드 됐다고 보면 된다.
https://sims-solve.tistory.com/122
YOLOv8 이해하기 (1) - Backbone
디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. 디텍션에는 2-stage / 1-stage 두개로 나뉘는데, YOLO는 1-stag
sims-solve.tistory.com
해당 글을 보고오면 더 쉽게 이해할 수 있을 것이다.
이번에도 yolov8에서 한 것 처럼 Backbone을 걸치면서 어떻게 shape이 바뀌는지 직접 해보고자 한다.
shape의 형태를 잘 알 수 있으면 어떻게 구성되고, 어떤 작업을 하는지 한층 더 깊게 파악 할 수 있다.
손으로 작성을 하다보니 굉장히 긴 과정을 거쳤다. 여기서 가장 집중적으로 봐야할 것은 C3K2 , C2PSA 블럭 두가지만 살펴보면 된다. 특히 C2PSA는 Attention 기법이 들어간 것이라 따로 때놓고 살펴보는것을 추천한다.
https://sims-solve.tistory.com/129
YOLOv11 - C2PSA Block
https://sims-solve.tistory.com/128 YOLOv11 - C3K2 BlockYOLOv8과 v11는 여러개 차이점이 있지만, 그중에서도 이번에는 C3K2 Block의 구조와 output shape을 살펴볼 것이다. 아래 이미지가 C3K2 과정을 도식화 한 이미
sims-solve.tistory.com
이 글을 참고해도 좋을 것 같다.
YOLOv11도, 총 3개의 서로다른 grid cell 사이즈를 가지는 정보를 바탕으로 최종적으로 Bbox를 예측하는 것은 yolov8과 같기때문에 바뀐 부분만 살펴보면 될 것 같다.