Skip to content

一个简单的 Python 脚本,可以通过语音与本地大语言模型进行对话。

License

Notifications You must be signed in to change notification settings

foobarhe/voice-assistant

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

语音助手

一个简单的 Python 脚本,可以通过语音与本地大语言模型进行对话。本项目中 whisper 实现来自 mlx 官方示例库

macOS 安装指南

以下为 macOS 的安装过程,Windows 与 Linux 可以使用 speech_recognition 与 pyttsx3 来替代下文中的 macOS 的 hear/whisper 与 say 指令。

创建环境

conda create -n VoiceAI python=3.11
conda activate VoiceAI
pip install -r requirements.txt
CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python

# 安装音频处理工具
brew install portaudio
pip install pyaudio

安装 hear 语音识别模块

从开源项目 hear下载安装包,解压文件夹后运行sudo bash install.sh(需要管理员权限)。安装完成后可以直接通过控制台指令调用 macOS 的语音识别功能。注意要开启电脑设置里的键盘听写选项:设置 -> 键盘 -> 听写(开启开关)。在 macOS 上首次使用时还要在“设置 -> 隐私与安全性”允许 hear 模块运行。

模型文件

模型文件存放于 models/ 文件夹下,在脚本中通过变量 MODEL_PATH 指定。 推荐下载 TheBloke 与 XeIaso 的 gguf 格式模型,其中 6B 模型显存占用更小:

About

一个简单的 Python 脚本,可以通过语音与本地大语言模型进行对话。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 99.8%
  • Shell 0.2%