Skip to content

SubGenie是一个开源工具,整合了YouTube视频下载,语音识别,字幕翻译等功能,主要用于为视频生成双语字幕。

License

Notifications You must be signed in to change notification settings

1e0nhardt/SubGenie

Repository files navigation

SubGenie

目录

简介

SubGenie是一个开源工具,整合了YouTube视频下载,Whisper语音识别,字幕翻译等功能,主要用于为视频生成高质量双语字幕。

SubGenie字幕生成工具使用faster-whisper库进行语音识别,对识别结果进行基于简单规则的断句,并使用deepmultilingualpunctuation库修正长视频识别结果中没有标点符号的情况。再调用通义千问的API使用qwen-max模型进行翻译。最终生成ass格式的双语字幕。

此外,我使用Godot 4.2.2 stable,基于GoZen_lite,写了一个字幕编辑界面(百度网盘下载),方便对字幕进行校正,以进一步提升字幕质量。

安装与使用指南

  1. 克隆仓库

    git clone https://github.com/1e0nhardt/SubGenie
  2. 安装虚拟环境: 进入 SubGenie 目录并双击运行setup_windows.bat 脚本:

    cd SubGenie
    setup_windows.bat

    默认安装为 cu121 版本的 PyTorch 如果你需要手动安装特定 CUDA 版本的 PyTorch,可以去setup_windows.bat中修改。

  3. 环境设置: 在运行程序之前,需要进行以下环境设置:
    模型下载

    设置通义千问API key

    • 不使用通义千问API翻译,可以跳过此步骤。
    • 在系统环境变量中添加DASHSCOPE_API_KEY=your_api_key
    • 或者直接填入src/utils.py的第44行

    安装ffmpeg

    • 下载ffmpeg,并配置好环境变量。
  4. 运行程序

    • 运行start_py_venv.bat启动虚拟环境。
    • 在虚拟环境中,输入python app.py -h查看帮助。
    • 常用命令示例见run_sub_genie.bat
  5. 人工修正字幕

视频演示

Godot+AI 我的双语字幕制作流程

贡献指南

欢迎对 SubGenie 进行贡献。您可以通过 GitHub Issue 或 Pull Request 提交改进建议或报告问题。

About

SubGenie是一个开源工具,整合了YouTube视频下载,语音识别,字幕翻译等功能,主要用于为视频生成双语字幕。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published