에코 (ECHO)

제24회 충북컴퓨터꿈나무축제 고등학교 공모전(SW제작) 대상 수상작

작품 소개

이 서비스는 Diff-SVC 프로젝트를 기반으로 제작되었습니다.
직접 자신의 목소리를 학습시켜 인공지능 모델을 제작하고, 그 모델로 TTS 기능을 이용할 수 있도록 하는 서비스입니다.
Streamlit 패키지로 사용자 친화적 인터페이스를 구현하여 누구나 쉽게 모델 제작 및 음성 생성을 할 수 있는 환경을 제공합니다.

사전 준비

0. 최소사양 및 권장사양

	최소사양	권장사양
RAM	8GB	16GB
GPU	GeForce GTX 1050 Ti	GeForce RTX 2070
VRAM	4GB	8GB

1. Python 3.10.11 설치

https://www.python.org/downloads/release/python-31011/

2. CUDA Toolkit 11.8 설치

https://developer.nvidia.com/cuda-11-8-0-download-archive

3. FFmpeg 설치

Windows

https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-essentials.7z
압축 해제 후 bin 폴더를 환경 변수에 추가

Debian / Ubuntu

sudo apt update
sudo apt install ffmpeg

4. 현재 리포지토리 다운로드

Windows

https://github.com/k-yumin/echo/archive/refs/heads/main.zip

Debian / Ubuntu

sudo apt install git
git clone https://github.com/k-yumin/echo.git

5. Pre-trained 모델 다운로드

Hubert 체크포인트 다운로드
압축 해제 후 checkpoints 폴더를 diff-svc 폴더 안으로 이동

(Optional) GPU 메모리가 6GB 이상인 경우

NSF-HiFiGAN 체크포인트 다운로드
압축 해제 후 nsf_hifigan 폴더를 checkpoints 폴더 안으로 이동

6. 필요한 패키지 다운로드

setup.py 실행

서비스 실행

Windows

run.bat 실행

Debian / Ubuntu

./run.sh

런타임 에러 해결 방법

Traceback (most recent call last):
  (...)
  File "(...)/torch/functional.py", line 641, in stft
    return _VF.stft(input, n_fft, hop_length, win_length, window,  # type: ignore[attr-defined]
RuntimeError: stft requires the return_complex parameter be given for real inputs, and will further require that return_complex=True in a future PyTorch release.

모델 학습 중 다음과 같은 런타임 에러가 발생했을 경우, 프롬포트에 출력된 경로 (...)/torch/functional.py 파일의 641번째 줄에 다음 코드를 추가한다.

    if not return_complex:
        return torch.view_as_real(_VF.stft(input, n_fft, hop_length, win_length, window,  # type: ignore[attr-defined]
            normalized, onesided, return_complex=True))

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
diff-svc		diff-svc
workspace		workspace
.gitignore		.gitignore
README.md		README.md
main.py		main.py
run.bat		run.bat
run.sh		run.sh
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

에코 (ECHO)

작품 소개

사전 준비

0. 최소사양 및 권장사양

1. Python 3.10.11 설치

2. CUDA Toolkit 11.8 설치

3. FFmpeg 설치

Windows

Debian / Ubuntu

4. 현재 리포지토리 다운로드

Windows

Debian / Ubuntu

5. Pre-trained 모델 다운로드

(Optional) GPU 메모리가 6GB 이상인 경우

6. 필요한 패키지 다운로드

서비스 실행

Windows

Debian / Ubuntu

런타임 에러 해결 방법

About

Releases

Packages

Languages

k-yumin/echo

Folders and files

Latest commit

History

Repository files navigation

에코 (ECHO)

작품 소개

사전 준비

0. 최소사양 및 권장사양

1. Python 3.10.11 설치

2. CUDA Toolkit 11.8 설치

3. FFmpeg 설치

Windows

Debian / Ubuntu

4. 현재 리포지토리 다운로드

Windows

Debian / Ubuntu

5. Pre-trained 모델 다운로드

(Optional) GPU 메모리가 6GB 이상인 경우

6. 필요한 패키지 다운로드

서비스 실행

Windows

Debian / Ubuntu

런타임 에러 해결 방법

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages