초급4편:텍스트데이터/데이터 라벨링

728x90

SMALL

3. '텍스트 데이터'에는

어떤 가공 방식이 진행되는지 볼까요.

텍스트, 문자, 즉 문자로 구성되어 있는 데이터로

'언어 모델' 이라고도 부른다.

인터넷 자동 완성 기능이나 연관 검색어가 이에 해당하고

비대면 의사소통이 증가함으로써

텍스트 데이터를 활용한 챗봇서비스의 개발 및 사용

또한 활발해지고 있다.

텍스트 데이터의 수집은 제시된 내용에 적절한 질문을

작성하거나 Q&A대화를 만드는 작업이 해당된다.

가공의 경우에는 주어진 문장들의 의미가 같은것인지 여부를

태깅하는 '문장 의미 비교'

제시된 글을 읽었을 때 느껴지는 감정을 선택하는 '감정 태깅'

대화 내용 속에서 핵심이 되는 키워드를 찾는 '키워드 찾기'

글을 읽고 핵심이 되는 내용을 요약하는 '문장 요약'

이와같은 텍스트데이터는

●문장의 비교, ●감정 태깅, ●키워드 찾기, ●문장 요약이 있다.

작업은 텍스트 속에서 인간이 의미하는 바를 좀 더 잘 인식하고

이해할 수 있게 하기 위한 라벨링 방법이다.

그렇기 때문에 인간과 인공지능을 이어주는 '데이터 라벨러'의

역할이 매우 중요하고 의미 있는 작업이라고 할 수 있다.

~~~ 섬세할수록 인간에 가까운 사이보그들이 속출될

미래가 기대되기도 하지만 두려워지기도 한다.^^

이어서 5편으로~~~

728x90

LIST

우연