데이터라벨링6 데이터 라벨링/크라우드웍스에서 국비 지원으로 수업했어요. 데이터속에서 살아왔고, 앞으로도 빅데이터 시대를 살아가면서 관심 가져야 할 분야라고 생각합니다. 도전해보시길~~~ 추천드려요.^^ 2023. 3. 6. 초급5편:음성데이터/데이트라벨링 마지막으로 '음성'입니다. 4. '음성데이터'는 상황별 맞춤 대화록 작성과 음성을 문서로 변환해 주는 인공지능 서비스는 물론 자동 번역, 영상자막 등 다양한 곳에서 활용되고 있다. 이미지, 영상 수집과 마찬가지로 저작권 문제 방지 위해 휴대폰으로 음성 등의 소리를 녹음하어 바로 업로드하는 방식으로 수집이 진행된다. 주변의 소리가 함께 녹음되어야 하는 프로젝트를 제외하고는 대체로 잡음 없이 녹음되어야 하기 때문에 조용한 곳에서 수집작업 진행하는것이 좋다. 음성데이터 가공의 경우에는 '화자 구분'과 '음성 받아쓰기' 작업이 주로 진행된다. 제시된 음성을 모두 듣고 동일한 사람의목소리인지를 판단해서 태깅하는 작업이다. '음성받아쓰기'는 주어진 음성을 듣고 받아쓰는 작업으로 작업 기준에 따라 *들리는 그대로 적.. 2023. 2. 23. 초급4편:텍스트데이터/데이터 라벨링 3. '텍스트 데이터'에는 어떤 가공 방식이 진행되는지 볼까요. 텍스트, 문자, 즉 문자로 구성되어 있는 데이터로 '언어 모델' 이라고도 부른다. 인터넷 자동 완성 기능이나 연관 검색어가 이에 해당하고 비대면 의사소통이 증가함으로써 텍스트 데이터를 활용한 챗봇서비스의 개발 및 사용 또한 활발해지고 있다. 텍스트 데이터의 수집은 제시된 내용에 적절한 질문을 작성하거나 Q&A대화를 만드는 작업이 해당된다. 가공의 경우에는 주어진 문장들의 의미가 같은것인지 여부를 태깅하는 '문장 의미 비교' 제시된 글을 읽었을 때 느껴지는 감정을 선택하는 '감정 태깅' 대화 내용 속에서 핵심이 되는 키워드를 찾는 '키워드 찾기' 글을 읽고 핵심이 되는 내용을 요약하는 '문장 요약' 이와같은 텍스트데이터는 ●문장의 비교, ●감.. 2023. 2. 23. 초급3편영상데이터/데이터 라벨링 이번에는 영상데이터에 어떤 방식의 라벨링이 진행과정 2. '영상데이터'는 이상행동 탐지나 동작분석, 감저인식 등에 활용되는 것으로 보통 수집의 경우에는 이미지 수집과 마찬가지로 작업대상과 기준에 맞춰 영상을 찍어 업로드하는 방식으로 진행한다. 영상 수집의 겅우에도 온라인에서 영상 다운으로 업로드하는 것과 같은 저작권 문제 발생 우려 때문에 작업화면에서 카메라 작동 촬영 후 바로 업로드하는 방식으로 진행된다. 영상데이터 가공의 경우에도 라벨리 기법이 다양하다. 영상 속에서 작업대상을 박스에 넣어주는 '바운딩' 주로 작업 대상의 행동 패턴을 분석하기 위해 특정 부위에 점을 찍어주는 '스켈레톤' '스켈레톤 추출' 작업대상이 사전에 제시된 기준에 해당하는 말이나 행동등을 할 때의 구간을 선택해 추출하는 '특정구.. 2023. 2. 23. 초급:2편/데이터 라벨링 어제 몇장면 수업중 캡쳐해둔 사진 등 필기해둔 내용으로 정리해 보기로 합니다. 데이터의 유형 네가지 --이미지, 영상, 텍스트, 오디오 중~ 1. '이미지 데이터'는 랜ㄷ마크나 손글씨, 얼굴인식, 질환진단, 엑스레이 위험물 탐지기술 등에 활용되는것으로 보통 수집의 경우에는 작업대상과 기준에 맞춰 사진을 찍어 업로드하는 방식으로 진행된다. 온라인에서 이미지를 다운 받아 업로드하는 행위로 인해 발생하는 저작권 문제를 미연에 방지하기 위하여 작업화면에서 카메라를 작동시켜서 촬영 후 바로 업로드하는 방식으로 주로 진행된다.. 이미지 데이터 가공의 경우에는 라벨링 기법이 다양하다. 이 중에서도 가장 많이 진행되는 방식은 ◈ '바운딩'이다. 작업기준에 맞춰 지정된 작업대상을 네모난 박스에 넣어준다고 해서 '바운딩 .. 2023. 2. 23. 데이터 라벨링(초급:1편) '데이터 라벨링'이란 인공지능 알고리즘 고도화를 위해 AI 가 스스로 학습할 수 있는 형태로 데이터를 가공하는 작업이다. 사람은 어린아이가 태어나면 그 아이는 커가면서 보고, 듣고 배워서 세상을 알아 나가게 된다. 인공지능 역시 어떤 목적으로 만들어졌건 일단 만들어진 그 상태만으로는 세상에 갓 태어난 어린아이와 다를 바가 없다. 아이가 가르침을 받으며 세상을 알아가듯, 인공지능 또한 학습을 통해 세상을 인식하고 똑똑한 인공지능으로 발전할 수 있는 것이다. 학습하지 않은 인공지능은 어린아이처럼 아는 게 없다. 이때 인공지능이 학습할 수 있도록 하기 위해서는 이렇게 데이터 라벨을 달아주는 것을 '데이터 라벨링'이라고 한다. 가공은 라벨을 달아주는 작업이다. 데이터의 유형과 개발 목적에 맞는 정제와 라벨링이 .. 2023. 2. 23. 이전 1 다음