분류 전체보기 185

Object Detection Milestones

Object Detection- 컴퓨터 비전 분야에서 이미지나 비디오에서 객체를 탐지하고, 해당 객체의 위치와 크기를 식별하는 기술- 이미지나 비디오에서 여러 개의 객체를 감지하고, 분류하는 작업을 수행=> Object Detection = Multi-labeled Classification + Bounding Box Regression Object Detection은 보통 두 가지 작업으로 분류된다.Classification(객체 분류)- 이미지에서 객체가 무엇인지 판단하는 작업- 해당 객체가 어떤 카테고리에 속하는지 판단하는 것 Localization(객체 위치 식별)- 이미지에서 객체가 어디에 있는지를 찾아내는 작업- 이미지 내에서 각 객체의 Bounding Box를 찾는 것   Two-stage ..

ODAI 2024.12.28

Object Detection Model - CNN vs YOLO

CNN(Convolution Neural Network)- 인간의 시신경을 모방하여 만들어짐- DNN의 문제점에서 부터 출발=> DNN은 기본적으로 1차원 형태의 데이터를 사용/ 2차원 이미지가 입력값이 되는 경우, 이를 이것을 flatten 시켜 한 줄의 데이터로 만드는데 이 과정에서 공간적, 지역적 정보가 손실된다.- CNN은 이미지를 그대로 받아 공간적, 지역적 정보를 유지한 채 특성들의 계층을 빌드업한다.=> 이미지 전체보다는 부분을 본다, 이미지의 한 픽셀과 주변 픽셀들의 연관성을 살린다.BackgroundConvolution- input: d1 X d2- Filter: k1 X k2=> Output: (d1-k1+1) X (d2-k2+1)Zero Padding- Edge(테두리)를 0으로 구성..

ODAI 2024.12.28

[Review]FairMOT

0. Abstract- MOT를 단일 네트워크에서 객체 탐지(Detection)와 재식별(re-ID)을 결합하여 멀티태스킹 학습으로 정의하면, 두 작업을 공동으로 최적화 가능하고 계산 효율성을 높인다.- 그러나 두 작업 간의 경쟁으로 인해 하나의 작업(탐지)에 편향되는 문제가 발생=> CenterNet이라는 anchor-free 객체 탐지 아키텍처를 기반으로 한 FairMOT라는 간단하지만 효과적인 접근법을 제안- 탐지 및 추적 모두에서 높은 정확도를 달성- 여러 데이터 셋에서 기존 최신 방법론을 능가하는 결과를 보인다.  기존 MOT의 문제점을 해결하는 CenterNet을 기반으로 한 anchor-free 구조의 FairMOT 제안  1. IntroductionExisting Methods(기존 접근법..

ODAI 2024.12.21

12주차-Learning Strategies

Knowledgw Distillation- "지식을 증류한다"라는 의미- 상대적으로 성능이 뛰어나고 용량이 큰 모델(teacher)에서 상대적으로 용량이 작은 모델(student)로 지식을 추출하는 방법 Cross Entropy & Entropyp: 실제 확률 분포 / q: 모델의 예측 확률 분포Cross Entropy> H(p, q)Entropy> H(p)EX) KL Divergence(Kullback-Leibler divergence)(KL div)- 두 확률 분포 p와 q간의 차이를 측정하는 방법성질>1. 비음수성- 두 분포가 같을 때만 0이 된다.2. 비대칭성- KL div는 대칭적이지 않다.KL div Loss> Soft LabelHard Label- 정확한 클래스에만 확률 1을 할당하고 나머지..

3-2/기계학습 2024.12.07

11주차-Loss Function Design

Feature Extractor & Classifier1. 입력 벡터 x가 주어진다.2. 네트워크 레이어 W를 통과하며 hidden feature a를 생성한다. => 최종 hidden feature a[L-1]은 Feature Vector(Embedding Vector)로 사용 3. Feature Vector v는 classifier g()를 통해 모델의 예측값 yhat으로 변환 Feature Embedding Space- Embedding Vector v: 각 데이터 포인트가 Embedding space에 매핑된 Vector- yij = 1: 두 샘플이 같은 클래스에 속한다.- yij = 0: 두 샘플이 다른 클래스에 속한다.- Easy Sample: 분리가 잘 된 샘플- Hard Sample: 분리..

3-2/기계학습 2024.12.07

8주차-Frequency Domain Processing

Preliminary Comcepts(기본 개념) Filtering- 정의) 가지고 있는 신호에서 특정 주파수 값을 줄이거나 죽이는 것1. Frequency-shaping filters (주파수 성형 필터)스펙트럼(주파수 분포)의 형태를 변경2. Frequency-selective filters (주파수 선택 필터)특정 주파수는 왜곡 없이 통과시키고, 나머지 주파수는 크게 약화하거나 제거- Frequency Response of the system Frequency-shaping filter ExampleDifferentiating Filter>- 입력 신호의 순간적인 변화나 급격한 전이를 강조하는 필터=> W가 클수록 신호를 더 크게 증폭 DT LTI Filter ExampleTwo-Point Aver..

3-2/패턴인식 2024.12.06

11주차- Morphological Image Processing

Reflection and TranslationReflection- x 방향으로 반전, y 방향으로 반전Translation- z만큼 translation 시킨 set Set of pixels: object and structuring elements(SEs)Foreground(전경)>- 이미지에서 객체가 차지하는 픽셀Background(배경)>- 전경 외의 모든 픽셀Structuring Element(SE)>- 전경 및 배경 픽셀의 패턴을 정의하는 작은 형태 Reflextion about the originOrigin(원점)>- SE의 기준점- 일반적으로 중앙값으로 설정Don't Care Elements>- 해당 요소는 전경(1)이든 배경(0)이든 상관 없음=> Reflection은 Origin을 기준..

3-2/패턴인식 2024.12.02

10주차-Multi-class Classification

Multi-class Classification- binary classification에 관해서 다뤘었다 => Logistic Regression- Multi-class Classification으로 확장을 해보자 Decision Boundary of Multi-class Classification Softmax Regression(Classification)Softmax>Logistic Regression의 일반화된 형태로 설명된다.- Softmax는 각 클래스의 확률을 계산하며, 계산된 확률의 총합은 항상 1이 된다.- Softmax는 (one-shot) argmax의 smooth approximation으로 사용된다.EX) Hard Max VS Soft MaxLogistic VS Softmax A..

3-2/기계학습 2024.12.01

10주차-Image Compression

PreliminariesInner Product(내적)1. Euclidean Space - 실수 값으로 정의 2. Unitary Space- 복소수 벡터에 정의3. Integral Inner Product- 연속 함수에 적용 / 적분 내적 공간Orthogonal Basis(직교)1. Vector Norm or Length2. Vector Angle between nonzero vectors z and w3. 직교 조건- = 0일 때 z와 w는 orthogonal- 벡터 w0, w1, ...가 pairwise orthogonal(쌍직교) 하려면4. Orthogonal Basis(직교 기저)- 벡터 공간의 기저가 직교 관계를 만족하면 이를 직교 기저라고 한다.- 기저 벡터가 정규화된 경우, 이를 직교 정규..

3-2/패턴인식 2024.12.01

9주차-Image Restoration

Image Restoration- degradation 현상에 대한 사전 지식을 활용하여 손상된 이미지를 복구하려는 시도 Image enhancement VS Image restoration원래 애초에 원본이 있는데 그것을 더 좋게, 기존의 값을 더 좋게 이미지가 원래는 어느 정도 품질로 있었는데, 손상이 되었을 때 어떻게 손상되었는지를 추정하여 그 부분을 보완 Image Degradatian/ Restoration Process- Image는 Operator H에 의해 degradation된다고 모델링되며, 이는 입력 이미지 f(x, y)에 작용하여 degraded image g(x, y)를 생성- 만약 H가 linear, position-invariant operator이라면Noise Models- ..

3-2/패턴인식 2024.11.30