본문 바로가기

5. 자기계발

초급5편:음성데이터/데이트라벨링

by 우연! 2023. 2. 23.

728x90

SMALL

마지막으로 '음성'입니다.

4. '음성데이터'는

상황별 맞춤 대화록 작성과 음성을 문서로 변환해 주는

인공지능 서비스는 물론

자동 번역, 영상자막 등 다양한 곳에서 활용되고 있다.

이미지, 영상 수집과 마찬가지로 저작권 문제 방지 위해

휴대폰으로 음성 등의 소리를

녹음하어 바로 업로드하는 방식으로 수집이 진행된다.

주변의 소리가 함께 녹음되어야 하는 프로젝트를 제외하고는

대체로 잡음 없이 녹음되어야

하기 때문에 조용한 곳에서 수집작업 진행하는것이 좋다.

음성데이터 가공의 경우에는

'화자 구분'과 '음성 받아쓰기' 작업이 주로 진행된다.

제시된 음성을 모두 듣고 동일한 사람의목소리인지를

판단해서 태깅하는 작업이다.

'음성받아쓰기'는 주어진 음성을 듣고 받아쓰는 작업으로

작업 기준에 따라

*들리는 그대로 적는 일반전사와

*들리는 것과 맞춤법에 따른 두가지 모두를 기재하는 이중 전사

등으로 나뉘기 때문에 작업 기준을 반드시 확인하고 진행하는것이

무엇보다 중요하다.

이상으로 가공 형태별 분류에 따른 공부는 마쳤다.

※참고로~~

각각의 라벨링 기법은 해당 데이터 유형에만 한정되는 것이 아니라

다른 유형에도 얼마든지 적용될 수있다.

→예를 들자면 이미지 데이터에서 주로 이용되는 '바운딩'이 영상데이터에서도

사용되고 텍스트 데이터에서 이용되는 '감정 분석'이 음성데이터에서도

사용되는 것처럼~~

이처럼 라벨링은 데이터가 유형뿐 아니라 사용 목적 기준 등 다양한 조건을

고려해 효과적인 방식을 선택하게 된다.

검수 과정까지 거친 학습에 적합한 형태로 변모한 데이터는 인공지능을

한층 똑똑하게 만들어주는 소중한 자원이 되고 이러한 자원을 토대로 성장한

인공지능은 우리 삶을 더욱 편리하고 풍요롭게 바꿔주고 있다.

728x90

LIST

저작자표시 비영리 변경금지

'5. 자기계발' 카테고리의 다른 글

PDS(PLAN. DO. SEE) (0)	2023.02.27
말은 생각의 창이다 (0)	2023.02.25
초급4편:텍스트데이터/데이터 라벨링 (0)	2023.02.23
초급3편영상데이터/데이터 라벨링 (0)	2023.02.23
초급:2편/데이터 라벨링 (0)	2023.02.23

댓글

티스토리툴바