728x90
SMALL
3. '텍스트 데이터'에는
어떤 가공 방식이 진행되는지 볼까요.
텍스트, 문자, 즉 문자로 구성되어 있는 데이터로
'언어 모델' 이라고도 부른다.
인터넷 자동 완성 기능이나 연관 검색어가 이에 해당하고
비대면 의사소통이 증가함으로써
텍스트 데이터를 활용한 챗봇서비스의 개발 및 사용
또한 활발해지고 있다.
텍스트 데이터의 수집은 제시된 내용에 적절한 질문을
작성하거나 Q&A대화를 만드는 작업이 해당된다.
가공의 경우에는 주어진 문장들의 의미가 같은것인지 여부를
태깅하는 '문장 의미 비교'
제시된 글을 읽었을 때 느껴지는 감정을 선택하는 '감정 태깅'
대화 내용 속에서 핵심이 되는 키워드를 찾는 '키워드 찾기'
글을 읽고 핵심이 되는 내용을 요약하는 '문장 요약'
이와같은 텍스트데이터는
●문장의 비교, ●감정 태깅, ●키워드 찾기, ●문장 요약이 있다.
작업은 텍스트 속에서 인간이 의미하는 바를 좀 더 잘 인식하고
이해할 수 있게 하기 위한 라벨링 방법이다.
그렇기 때문에 인간과 인공지능을 이어주는 '데이터 라벨러'의
역할이 매우 중요하고 의미 있는 작업이라고 할 수 있다.
~~~ 섬세할수록 인간에 가까운 사이보그들이 속출될
미래가 기대되기도 하지만 두려워지기도 한다.^^
이어서 5편으로~~~
728x90
LIST
'5. 자기계발' 카테고리의 다른 글
말은 생각의 창이다 (0) | 2023.02.25 |
---|---|
초급5편:음성데이터/데이트라벨링 (0) | 2023.02.23 |
초급3편영상데이터/데이터 라벨링 (0) | 2023.02.23 |
초급:2편/데이터 라벨링 (0) | 2023.02.23 |
데이터 라벨링(초급:1편) (0) | 2023.02.23 |
댓글