목록Guided-tts (2)
웅재의 코딩세상

Heeseung Kim, Sungwon Kim, Sungroh Yoon Seoul National University 23 Nov 2021 Instroduction The TTS model of neural networks is a model for generating human-like speech in a given text. Most TTS models can be learned only when the transcription data of the target speaker is provided. In order to utilize untranscribed data, it is necessary to divide into sentences and accurately transcribe each v..

Heeseung Kim, Sungwon Kim, Sungroh Yoon Seoul National University 23 Nov 2021 소개 신경망의 TTS 모델은 주어진 텍스트에서 사람과 같은 음성을 생성하기 위한 모델입니다. 대부분의 TTS 모델은 타겟 스피커의 전사 데이터가 제공되어야 학습이 가능합니다. 전사되지 않은 데이터를 활용하기 위해서는 문장으로 나누어 각 음성을 정확하게 전사해야 합니다. ( 음성 -> 텍스트 ) 기존 모델은 텍스트가 주어진 음성의 조건부 분포를 직접 모델링하기 때문에 전사되지 않은 데이터를 직접 사용하는 것은 어려운 문제입니다. 제안 본 논문에서는 unconditional DDPM으로 음성 생성을 학습하고 classifier guidance를 사용하여 텍스트 음성 합..