Sims의 문제해결 저장소

https://sims-solve.tistory.com/128 YOLOv11 - C3K2 BlockYOLOv8과 v11는 여러개 차이점이 있지만, 그중에서도 이번에는 C3K2 Block의 구조와 output shape을 살펴볼 것이다. 아래 이미지가 C3K2 과정을 도식화 한 이미지이다.C3K2도 C2f와 유사한 형태를 가지고sims-solve.tistory.com지난번에는 YOLOv8과 달라진 부분인 C3K2 Block에 대해 알아보았다.이번에는 연장선으로 모델 중 한번만 거치는 블럭이지만, v11에 추가된 Block인 C2PSA를 살펴보도록 하겠다. 일단, C2PSA Block을 들어가기 전 input shape은 (1,256,8,8) 로 가정하겠다.위는 실제 C2PSA 코드이다. 어텐션 메커니즘을..

Deep-learning 2024. 11. 14. 21:00

YOLOv11 - C3K2 Block

YOLOv8과 v11는 여러개 차이점이 있지만, 그중에서도 이번에는 C3K2 Block의 구조와 output shape을 살펴볼 것이다. 아래 이미지가 C3K2 과정을 도식화 한 이미지이다.C3K2도 C2f와 유사한 형태를 가지고 있다. 하지만 C2f와 다르게 Channel Split하기전에 추가적으로 Conv를 수행해주는 모습을 볼 수 있다.그외에는 C2f와 같은 과정을 거치는 것을 볼 수 있다. 실제로, 코드상으로 봐도 C3K2는 C2f를 상속받는 걸 볼 수 있다. 즉, 연산과정은 C2f와 같은것을 볼 수 있다. 이처럼 변경사항은 굉장히 간단하다는 것을 볼 수 있었다.다음에는 새로 추가된 블럭 C2PSA 블럭을 한번 살펴보고자 한다.

Deep-learning 2024. 11. 13. 20:26

YOLOv11 이해하기 (0) - 전체적인 내용

https://sims-solve.tistory.com/126 YOLOv8 이해하기 (4) - Losshttps://sims-solve.tistory.com/125 YOLOv8 이해하기 (3) - Detection output shapehttps://sims-solve.tistory.com/123 YOLOv8 이해하기 (2) - Headhttps://sims-solve.tistory.com/122 YOLOv8 이해하기 (1) - Backbone디텍션 테스크를 하다보면sims-solve.tistory.com이전까지 YOLOv8에 대해 알아보는 시간을 가져보았다. 최근 YOLOv11이 배포되었고, ultralytics에서 정식으로 소개를 하고있다. https://docs.ultralytics.com/mode..

Deep-learning 2024. 11. 12. 20:45

YOLOv8 이해하기 (4) - Loss

https://sims-solve.tistory.com/125 YOLOv8 이해하기 (3) - Detection output shapehttps://sims-solve.tistory.com/123 YOLOv8 이해하기 (2) - Headhttps://sims-solve.tistory.com/122 YOLOv8 이해하기 (1) - Backbone디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명sims-solve.tistory.com지금까지 모델의 구조와 최종 output을 살펴보았다. 결국 Detection을 모두 진행하면 (batch, ClassNum + 4(xywh) , 8400(Gird cell 수 )) 가 나오는 것을 알 수 있었다.해당 정보를 바탕으로 ..

Deep-learning 2024. 11. 11. 21:23

YOLOv8 이해하기 (3) - Detection output shape

https://sims-solve.tistory.com/123 YOLOv8 이해하기 (2) - Headhttps://sims-solve.tistory.com/122 YOLOv8 이해하기 (1) - Backbone디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. sims-solve.tistory.comYOLOv8의 head부분에서 Detection을 지나면 각각 어떤 shape의 결과물이 나오는지 살펴보았다.이 3개의 서로다른 size의 grid cell로 나눈것을 합쳐서 최종적으로 Loss를 구하기 위한 형태로 변경하는 과정이 더 필요하다. 최종적으로 어떤 형태로 output이 나오는지 살펴보고, 어떤 의미를 가지..

Deep-learning 2024. 11. 10. 20:17

LabelImg - Draw Bbox Tool

딥러닝 분야는 다양한 분야가 있지만 그중에 비젼분야 중 Detection 분야는 특정 객체를 바운딩박스로 표현해 주기때문에 시각적인 효과로 인해 엄청나게 큰 인상을 남길 수 있다.하지만 딥러닝은 언제나 그렇듯 가장 처음 준비해야 할 것은 데이터라는 것을 알 수있을 것이다. 비젼 Classification의 경우 원하는 이미지를 크롤링, 다운로드 등 다양한 방법으로 수집만 하면 되지만,디텍션같은 경우는 학습하고자 하는 객체의 Bbox(바운딩 박스)가 필요하여 사람이 수작업으로 표시해줘야 하는 경우가 많다. 즉, 디텍션 테스크를 하면 때놓은 수 없는것이 Bbox 라벨링 작업이다. 시중에 라벨링을 전문적으로 처리하는 회사는 자체적으로 웹상 툴을 제공하여 크라우드워커에게 제공을 해주만,개인적인 프로젝트나, 자체..

카테고리 없음 2024. 11. 9. 20:21

YOLOv8 이해하기 (2) - Head

https://sims-solve.tistory.com/122 YOLOv8 이해하기 (1) - Backbone디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. 디텍션에는 2-stage / 1-stage 두개로 나뉘는데, YOLO는 1-stagsims-solve.tistory.com 이전까지는 YOLOv8의 BackBone이 어떻게 돌아가는지 코드를 디버깅해보고, 손으로 input image의 shape의 변화를 작성해 봤다. BackBone은 이미지의 특성을 추출하는 부분으로, 다수의 feature map을 만드는 역할을 해준다.이제, 생성된 Feature 맵을 이용하여 Detection에서 필요로 하는 Bbox의..

Deep-learning 2024. 11. 8. 20:21

YOLOv8 이해하기 (1) - Backbone

디텍션 테스크를 하다보면 YOLO를 한번쯤은 들어본적이 있을 것이다.물론 YOLO가 너무 유명해서 관심이 없어도 한번쯤은 들어봤을 것이다.. 디텍션에는 2-stage / 1-stage 두개로 나뉘는데, YOLO는 1-stage로 bbox, classification 두개를 한번에 하는 모델 구조를 말한다.(반대로 2-stage는 localizaion 과 classification을 다른 두개의 모델을 이용하여 예측하게 된다. ) 해당 포스팅은 realtime detection의 가장 큰 부분을 차지하는 YOLO에 대해 알아보고, 특히 v8에 대해 정리하고자 한다. 실질적으로 ultralytics가 배포한 yolov8n의 모델은 어떻게 구성되어있는지 살펴보고, code가 어떻게 구성되어 있는지도 공부해보..

Deep-learning 2024. 11. 7. 20:31

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

티스토리툴바