VoiceApp

Este proyecto presenta una aplicación en Python diseñada para clonar voces utilizando la potencia de PyTorch. Con soporte para los idiomas inglés y español, la aplicación emplea una variedad de modelos para codificar, sintetizar y vocodear el audio.

Funcionalidades Principales:

Clonación de Voces: La aplicación permite al usuario clonar voces utilizando técnicas avanzadas de procesamiento de señales de audio.
Entrada de Texto y Audio: Los usuarios pueden ingresar un texto junto con un fragmento de audio de aproximadamente 5 segundos, y la aplicación generará un audio clonado con el texto proporcionado.

Requerimientos

Python 3.9
FFmpeg
PyTorch

Modelos

Descarga la carpeta aquí que contiene los modelos.

Instalación y Uso

Para instalar los requerimientos, ejecuta el siguiente comando:

pip install -r requerimientos.txt

Correr la inferencia

python main.py --text "<text>" --audio "<audio_de_referencia>"

Nota

En el archivo main.py colocar las rutas de los modelos

    model_path = "/models/spanish/pretrained_spanish/"
    encoder_path = model_path + "encoder/saved_models/pretrained.pt"
    syn_path = model_path + "synthesizer/saved_models/pretrained/pretrained.pt"
    voc_path = model_path + "vocoder/saved_models/pretrained/pretrained.pt"

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
encoder		encoder
synthesizer		synthesizer
vocoder		vocoder
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
demo_output.wav		demo_output.wav
demo_output_01.wav		demo_output_01.wav
demo_output_02.wav		demo_output_02.wav
demo_output_2024-04-01_12-01-07.wav		demo_output_2024-04-01_12-01-07.wav
demo_output_2024-04-08_11-41-16.wav		demo_output_2024-04-08_11-41-16.wav
main.py		main.py
requirements.txt		requirements.txt
yo.wav		yo.wav

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VoiceApp

Funcionalidades Principales:

Requerimientos

Modelos

Instalación y Uso

Correr la inferencia

Nota

About

Releases

Packages

Languages

bkoscar/VoiceApp

Folders and files

Latest commit

History

Repository files navigation

VoiceApp

Funcionalidades Principales:

Requerimientos

Modelos

Instalación y Uso

Correr la inferencia

Nota

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages