ODAI 16

[Review]FairMOT

0. Abstract- MOT를 단일 네트워크에서 객체 탐지(Detection)와 재식별(re-ID)을 결합하여 멀티태스킹 학습으로 정의하면, 두 작업을 공동으로 최적화 가능하고 계산 효율성을 높인다.- 그러나 두 작업 간의 경쟁으로 인해 하나의 작업(탐지)에 편향되는 문제가 발생=> CenterNet이라는 anchor-free 객체 탐지 아키텍처를 기반으로 한 FairMOT라는 간단하지만 효과적인 접근법을 제안- 탐지 및 추적 모두에서 높은 정확도를 달성- 여러 데이터 셋에서 기존 최신 방법론을 능가하는 결과를 보인다.  기존 MOT의 문제점을 해결하는 CenterNet을 기반으로 한 anchor-free 구조의 FairMOT 제안  1. IntroductionExisting Methods(기존 접근법..

ODAI 2024.12.21

[Review]SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC

0. Abstract- SORT는 간단하고 효율적인 알고리즘에 초점을 맞춘 multi object detection의 실용적인 접근 방식이다.- 이 논문에서는 SORT에 appearance(외형) 정보를 통합하여 성능을 개선하였다.- 이러한 확장으로 더 긴 차단 기간동안 객체를 추척할 수 있고, 결과적으로 identity switch(객체 식별 전환) 횟수를 효과적으로 줄일 수 있다. SORT에 apperance정보를 통합하여 Detection 성능을 개선하고 차단 상황에서도 객체를 효과적으로 추적할 수 있도록 하는 방법 제안  1. Introduntion- Tracking-by-detection: 객체 탐지 기술의 발전으로 다중 객체 추적에서 주류 방식이 됨=> Batch 처리로 인해 온라인 시나리오에..

ODAI 2024.11.22

[Review]Simple Online and Realtime Tracking(SORT)

1. Introduction- 이 논문은 다중 객체 추적(MOT) 문제를 다루는 tracking-by-detection 프레임워크를 간결하게 구현한 방식을 제안.- 객체는 매 프레임 탐지되고 바운딩 박스로 표현됨- 많은 batch 기반 추적 접근법과 다르게 이 연구는 online tracking을 목표로 하여 이전 프레임과 현재 프레임에서 탐지된 결과만을 사용하여 추적기를 작동한다.MOT 문제 정의- MOT는 데이터를 연관시키는 문제로 간주될 수 있으며, 목표는 비디오 시퀸스에서 프레임 간 탐지를 연결하는 것- Data association problem을 지원하기 위해 이 논문에서는 visual MOT benchmark에서 얻은 관찰을 기반으로 함=> Multiple Hypothesis Tracking..

ODAI 2024.11.22

[Review]SHViT: Single-Head Vision Transformer

- 이 논문은 VVision Transformer(ViT) 모델에서 발생하는 계산 중복을 해결하고자 메모리 효율적인 설계를 적용한 SHViT모델을 제안한다.- SHViT는 단일 Head-Attention module을 도입하여 성능을 유지하면서 불필요한 계산을 줄이고, 여러 장치에서 뛰어난 성능을 보여준다.  1. Introduction- ViT는 다양한 비전 작업에서 우수한 성능을 보이지만, 많은 데이터와 계산 비용이 요구된다. - 이를 개선하기 위해 본 논문은 ViT의 매크로 및 마이크로 설계에서 발생하는 중복 문제를 분석하고, 효율적인 패치 임베딩과 단일 헤드 설계를 제안함. - SHViT는 다양한 장치에서 빠른 속도와 높은 정확성을 달성해 실시간 비전 작업에 적합한 솔루션을 제공.  2. Anal..

ODAI 2024.10.30

[Review]Neural Coding in Spiking Neural Networks(입력 전처리 Neural Encoding)

- 이 연구는 뉴럴 코딩 기법 중 4가지인 rate coding, TTFS(time-to-first-spike) coding, phase coding, burst coding의 성능을 다양한 관점에서 비교하였다. - TTFS코딩이 높은 계산 성능과 낮은 하드웨어 구현 부담을 제공하는데 있어 가장 유리- phase 코딩은 노이즈 내성이 강함.- burst 코딩은 네트워크 압축과 하드웨어 비이상성에 대한 견고성에서 우수.이 연구는 다양한 neuromorphic system 설계에서 요구되는 성능과 제약을 고려하여 최적의 코딩 방식을 선택할 수 있는 지침을 제공 1.  Introduction- SNN은 에너지 효율성 측면에서 큰 관심을 받고 있으며, 생물학적 신경계를 기반으로 뉴런이 생성한 스파이크를 통해 정..

ODAI 2024.10.07

[Review]Deep learning in spiking neural networks (전반적인 SNN)

1. IntroductionANNs의 성공- 딥러닝, 특히 Deep Neural Networks, DNNs 은 최근 몇 년 동안 컴퓨터 비전, 음성 인식 등의 분야에서 뛰어난 성과를 보여줌.- DNN은 연속적인 활성화 함수(continuous activation function)를 사용하고, 이를 통해 많은 데이터를 학습해 뛰어난 분류 정확도를 달성할 수 있었다. 2012년 AlexNet의 성공이 그 예로, 이미지 분류에서 인간을 능가하는 성능을 보여주었다.ANNs와 SNNs의 차이- ANNs는 연속적인 활성화를 사용하는 반면, 생물학적 신경망은 스파이크(불연속적인 신호)를 사용 - SNN은 이러한 생물학적 신경 네트워크를 모방하여 스파이크 타이밍과 스파이크 비율을 기반으로 정보를 처리- 이는 ANNs보..

ODAI 2024.10.03