본문 바로가기
5. 자기계발

초급:2편/데이터 라벨링

by 우연! 2023. 2. 23.
728x90
SMALL

어제 몇장면 수업중 캡쳐해둔 사진 등 필기해둔 내용으로

정리해 보기로 합니다.

 

데이터의 유형 네가지 --이미지, 영상, 텍스트, 오디오 중~

1. '이미지 데이터'는

랜ㄷ마크나 손글씨, 얼굴인식, 질환진단, 엑스레이 위험물 탐지기술 등에

활용되는것으로 보통 수집의 경우에는

작업대상과 기준에 맞춰 사진을 찍어 업로드하는 방식으로 진행된다.

온라인에서 이미지를 다운 받아 업로드하는 행위로 인해 발생하는

저작권 문제를 미연에 방지하기 위하여

 

 

 

작업화면에서 카메라를 작동시켜서 촬영 후 바로 업로드하는 방식으로 주로 진행된다..

 

이미지 데이터 가공의 경우에는 라벨링 기법이 다양하다.

 

 

이미지데이터의 가공방식들

 

 

 

이 중에서도 가장 많이 진행되는 방식은 ◈ '바운딩'이다.

작업기준에 맞춰 지정된 작업대상을 네모난 박스에 넣어준다고 해서

'바운딩 박스'라고도 한다.

바운딩은 마우스를 드래그하여 박스를 그리는 것으로

작업 대상이 2개 이상 일 경우에는 

바운딩과 함께 작업대상이 무엇인지 구별할 수 있도록 '태깅'이 진행된다.

(※'태깅'이란 대표할 수 있는 키워드를 달아줌으로써 대상을 분류하는 작업)

 

◈'감정분석은' 사진 속 사람릐 표정을 보고 어떤 감정 상태일지를 추론하는것으로

해당되는 감정을 태깅하거나 글로 묘사하는 방식으로 진행된다.

 

'키포인트'는 작업대상이 특정 지점에 마우스를 클릭하여 점을 찍는 작업으로

 

 

 

특징점을 비교하여 이미지를 매칭하거나 특징점을 연결하여 골격을 추출하는 기술에 주로 이용된다.

 

◈'얼굴랜드마크' 역시 마우스를 클릭하여 점을 찍는 작업으로

 

 

점의 위치는 얼굴위 주요 부위가 해당된다.

안면 인식과 표정 변화를 통한 감정인식 기술에 주로 활용되고 있다.

 

'OCR' 은

AI가 인간의 글을 인식할 수 있도록 해주는 라벨링 기법으로 일반적으로

글자를 바운딩 후 태깅이나 전사로 이어진다.

 

 

※ 'OCR' (Optical Character Recongnition) ~ 영상,이미지상의 텍스트를

기계가 읽을 수 있는 문자로 변환하는 라베링

주로 비대면 인증서비스와 고서이 데이터베이스화, 변역서비스 개발 등에 화용되고 있따.

◈ '폴리곤'은 작업 대상위 외곽선을 따라 점을 찍어 라벨링하는 바법이다.

 

 

점으로부터 시작해서 선의 형태로 이어지기 때문에 빈 공간없이 대상을  검출하는데 효과적이다.

그런데 폴리곤과 아주 유사한 형태이 라벨링 기법이   또 하나 있다.

 

◈'폴리라인' 이다.

 

 

이 역시도 작업 대상을 따라 여러개이 점을 연속적으로 그리는 작업이다.

두 작업의 가장 큰 특징은 바로 '시작점과 끝점이 연결되었는지 여부'다.

폴리곤은 작업 범위가 면적에 해당, 시작점과 끝점이 만나 닫힌 형태로써

도형으로 라벨링 되고

폴라라인은 선을 라벨링하기 위한 것이기 때문에 시작점과 끝선이

연결되지 않는다는 차이가 있다.

차이점 꼭 기억해야 한다.

 

이상으로 이미지 데이터에 진행되는 라벨링 방법을 

 

 

바운딩~폴리라인까지 모두 살펴 보았다.

 

오늘은 여기까지~~~이어서 3편에서^^

 

 

728x90
LIST

댓글