7기 5

카메라 딥러닝 객체인식 [기존 영상처리 기법과 딥러닝 기반의 차이]

작성자: 황태언 다음은 간단하게 번호판 인식으로 기존 영상처리 기법과 딥러닝 기반의 차이를 보여드리겠습니다. 영상 처리를 러닝 기반이 아니기에 화면의 픽셀 값으로 연산을 수행하면 됩니다. 이제 딥러닝 기반은 학습이 필요합니다. (open source가 요즘 상당히 잘 돼 있습니다.) 학습된 가중치들만 가져다 쓸 수 있어서 편리하다는 장점도 있습니다. - 영상처리 기반 방법 요약 1. 이미지를 rgb에서 gray scale로 변경합니다. 2. 모폴로지 기법을 적용합니다. 3. 가우시안 필터를 사용하여 잡음 제거 후 threshold로 0 or 255로 나타냅니다. 4. 외곽선 검출 (edge detection)을 수행합니다. 5. Bounding box 검출 후에 임의 조건이 다 맞으면 번호판으로 인식합니..

7기 2022.02.12

카메라 딥러닝 객체인식 [YOLO v5, YOLO X, CNN의 단점, SOTA]

작성자: 황태언 YOLO v5 Yolo v5는 논문이 아닌 걸로 알고 있습니다. 그러나 현재 detection 분야에서 가장 많이 쓰고 있지 않나라는 개인적인 생각입니다. FPS가 무려 140이고 Map는 89.5를 달성했다. Small, medium, large, xlarge 버전이 있다. 알맞은 것 사용하면 될 것 같습니다. 블로그를 통해 확인할 수 있을 것입니다. YOLOv5 is Here: State-of-the-Art Object Detection at 140 FPS (roboflow.com) Backbone은 잘 알려져 있습니다. CSPNet을 사용한 것입니다. 자세한 설명은 하지 않고 간단하게 설명하겠습니다. CSPNet[20]: 3가지 이슈를 다루고 있다며 Introduction에서 언급합..

7기 2022.02.12

카메라 딥러닝 객체인식 [FPN, EfficientDet, YOLO v3,v4]

작성자: 황태언 FPN(Feature Pyramid Networks for Object Detection) 다음은 FPN에 대해 설명하겠습니다. 후에 언급할 EfficientDet이나 YOLO v4에서 구조를 적용하기도 합니다. 이 둘은 아직까지 잘 사용되고 있으며 실제 제가 번호판 detection project에서 사용한 모델도 YOLO v4입니다. FPN(Feature Pyramid Network) [14]: Layer가 깊어지면서 더 전역적인 특징을 갖는 특징 맵을 추출하게 됩니다. 깊은 Layer에서 추출한 특징 맵을 현재 Layer의 특징 맵과 Concatenation 하여 동시에 고려합니다. 이는 객체 인식의 성능을 개선합니다. 논문에서 (a) Featurized image pyramid, ..

7기 2022.02.12

카메라 딥러닝 객체인식 [Object detection, Stage Detector, YOLO, SSD]

작성자: 황태언 Object detection object detection은 앞서 언급했듯이 분류의 문제와 위치를 동시에 고려해야 합니다. 그렇기에 동시에 해결하기 위한 신경망 학습이 필요합니다. 또한 손실함수도 이에 맞게 설정될 필요가 있습니다. 크게 발전 방향은 2-Stage Detector와 1-Stage Detector로 나눌 수 있습니다. 이에 맞는 대표적인 알고리즘과 최신 트렌드를 설명해보겠습니다. experiment 부분은 설명하지 않을 것입니다. 출처: https://mlai.iptek.web.id/2019/01/20/object-detection-state-of-the-art-progress/ 위 그림은 유명한 순서도입니다. 빨간색으로 된 것은 상당히 유명한 알고리즘입니다. 현재는 유명..

7기 2022.02.12

카메라 딥러닝 객체인식 [객체인식과 CNN]

작성자: 황태언 컴퓨터 비전의 주 목적은 이미지를 이해하는 것입니다. 픽셀로부터 정보를 추출하는 것이 목적입니다. 이것들은 객체 위치나 개수 등일 것입니다. 그에 따라 애플리케이션 분야는 많습니다. 객체 분류, 식별, 탐지 및 위치 측정, 객체 및 인스턴스 분할, 자세 추정, 동영상 분석, 장면 복원 등 상당하게 많은 분야가 있습니다. 객체인식이 무엇인가? 객체인식은 이미지 (비디오) 같은 영상 데이터 안에서 물체를 라벨링하고 인식하는 것을 의미합니다. (Classification + Localization 개념) 무조건 카메라에서 나오는 데이터는 아닙니다. (lidar의 point cloud data etc…) 이번 조사에서는 object detection 연구나 트렌드 위주로 설명하겠습니다. 자율주행..

7기 2022.02.12