티스토리 뷰

728x90

https://sims-solve.tistory.com/126

 

YOLOv8 이해하기 (4) - Loss

https://sims-solve.tistory.com/125 YOLOv8 이해하기 (3) - Detection output shapehttps://sims-solve.tistory.com/123 YOLOv8 이해하기 (2) - Headhttps://sims-solve.tistory.com/122 YOLOv8 이해하기 (1) - Backbone디텍션 테스크를 하다보면

sims-solve.tistory.com

이전까지 YOLOv8에 대해 알아보는 시간을 가져보았다. 

최근 YOLOv11이 배포되었고, ultralytics에서 정식으로 소개를 하고있다.

 

https://docs.ultralytics.com/models/yolo11/

 

YOLO11 🚀 NEW

Discover YOLO11, the latest advancement in state-of-the-art object detection, offering unmatched accuracy and efficiency for diverse computer vision tasks.

docs.ultralytics.com

 

이전에 v9, v10도 있었지만, 홈페이지에 제대로 소개를 해주진 않았다. 하지만, 모든 버젼 다 업데이트 될때마다 v8과의 비교를 했을때, 비슷한 성능 & 속도 개선의 결과를 보여주었다.

 

잠시후 Yolov11의 성능 및 속도 관련하여 살펴보겠지만, 모델 내 Block의 구조를 변경하여 성능은 유지하되 속도를 개선했다. 자세히 어떠한 아키텍쳐인지 공식적으로 설명해주지는 않지만, 인터넷 상에서 내용을 공유해주고 있다.

위 이미지가 V11 아키텍쳐인데, 어디서 많이 본 형태라고 생각될 것이다.

v8과 거의 유사한 형태의 아키텍쳐를 가지고 있다. 여기서는 Backbone + Neck + Head 총 3개의 부분으로 나눠져 있다고 설명하지만, 사실 v8도 아키텍쳐를 설명할때 Backbone + Neck + Head로 표현하는 그림도 있지만, Backbone + Head로 공식설명에서 설명하고 있다. 즉, v11도 v8과 별 다르지 않다고 생각하면 된다.

 

하지만, 내부적인 구조에서 바뀐 부분이 보인다. v8은 C2f 블럭이 주로 사용되었지만, v11에서는 C3K2라는 블럭으로 변경된 걸 볼 수 있다. 또한, SPFF 블럭에서 바로 Upsample을 진행하는게 아닌, C2PSA 블럭을 한번 더 통과하여 진행하는 ㅂ분이 다른 것을 볼 수 있다. 그외에는 거의 유사한 아키텍쳐를 보이고 있어서, v8과 크게 다르지 않다.

 

 

성능

위는 공식적으로 제공해주는 v11의 성능표다.

다른 타 YOLO모델과 비교했을때, 비슷한 크기의 모델에서 성능은 유지하되, 처리 속도는 10x보단 살짝 느린 수준을 보여주고 있다. v8과 비교했을때는 성능, 속도 모두 개선된 모습을 보여주고 있으므로, 새로 적용된 블럭들에 관해서 자세히 살펴보는 시간이 필요하다.

 

추후 v8과 비슷하게 v11의 코드를 디버깅하면서 아키텍쳐를 따라가며 shape이 어떻게 변화되고, Block은 어떤 과정을 거치는지 자세히 살펴보고 정리할 예정이다.

 

 

반응형

'Deep-learning' 카테고리의 다른 글

YOLOv11 - C2PSA Block  (0) 2024.11.14
YOLOv11 - C3K2 Block  (0) 2024.11.13
YOLOv8 이해하기 (4) - Loss  (0) 2024.11.11
YOLOv8 이해하기 (3) - Detection output shape  (0) 2024.11.10
YOLOv8 이해하기 (2) - Head  (0) 2024.11.08
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함