SK AI Data Academy 1기 중급/[SKT] 통신탑 안전이상 감지 모델 개발

02. 데이터 이해 및 전처리

Donghun Kang 2024. 9. 7. 15:56
  • 통신탑 이미지 분류 데이터
  • train data: 볼트가 포함된 통신탑 이미지 427개/ 통신탑이 포함되지 않은 이미지 222개

  • test data: 볼트가 포함된 통신탑 이미지 97개/ 통신탑이 포함되지 않은 이미지 81개

  • 데이터셋 폴더 경로 설정

  • Glob 모듈을 통해서 데이터 개수 확인

  • 데이터 시각화

  • Open CV를 통해 이미지 출력

  • 통신탑 이미지 객체 인식 데이터
Class id Class name  설명 예시 사진
1 target 너트의 모든 class: Normal + Unscrewed red + ...  
2 Normal 너트와 와셔 부분의 이격이 발견되지 않고, 부식이 발생하지 않았으며 변색이 없더나 경미한 정도
3 Unscrewed red 와셔 쪽 와트 풀림이 발생했더나 너트와 와셔 부분의 이격 정도가 명확
4 Rusty yellow 변색이 명확하게 일어났거나 부식이 발생한 조치 관리 대상
5 Rusty red 명확한 변색을 동반한 심한 부식이 발생하여 조치가 필요한 대상
6 Unscrewed yellow 너트와 와셔 부분의 경미한 이격 발생

 

  • 데이터셋 폴더 경로를 설정: 이미지 폴더와 주석 파일의 위치를 지정

  • Annotation(주석) 파일을 load하여 정보 확인

  • Annotation 파일 구성요소 개수 확인: 5개

  • 0. info: 데이터 셋 정보를 포함하는 섹션

  • 1. Licenses: 데이터 셋 사용에 관한 라이센스 정보를 포함하는 섹션

  • 2. categories: 데이터 셋에 포함된 객체 카테고리에 대한 정보 

  • 3. Images: 데이터 셋에 포함된 이미지 정보를 포함한 섹션

  • 4. Object Annotation: 객체의 주석 정보를 포함하는 섹션

  • matplotlib를 통한 시각화

Normal, Rusty_Yellow에 비해 타 클래스의 데이터가 부족
데이터 증강 필요
  • matplotlib를 통한 시각화

Normal, Rusty_Yellow에 비해 타 클래스의 데이터가 부족
데이터 증강 필요

  • Open CV를 이용하여 이미지와 경계상자 함께 출력
  • Annotation 파일을 load, 이미지 별로 image_id가 일치할 경우 target으로 묶음

  • 각 클래스 별 경계상자의 색을 지정, 이름을 할당