qwen.rs

一个非官方的使用 rust 实现的通义千问-7B-chat，能够在 cpu 上运行，不需要任何依赖。基于 candle 和 tiktoken-rs，大量参考了 candle 中的 llama 的例子。

实现了一个原始版本和一个量化版本（基于 ggml，但并不是标准的文件。基本按照 ggmlv3，未处理 align）。原始版本需要下载官方的权重文件（Hugging Face 或 ModelScope）下的八个后缀为 .safetensors 的文件。量化版本所需的权重文件可以使用 release 页面下的 convert_ggml 程序来将原始权重文件转为 ggml 格式的文件。

使用方法

在你想要运行这个程序的目录下创建 weight 文件夹，将权重文件放入。

在 release 页面下载可执行文件，windows 就下 .exe 后缀的，linux 就下另一个，mac 的 ci 出了点问题没有导出。当在命令行看到 >>> 就可以开始对话了。如果闪退了一般是权重文件没有正确放置。

如果想要自行编译运行，下载安装 rust，然后克隆当前项目，并在当前项目下命令行输入 cargo run --release 即可。想生成可执行文件则是 cargo build --release，然后即可在 target/release 目录下找到可执行程序。

MKL

cargo build --release --features=mkl

Accelerate

cargo build --release --features=accelerate

使用协议

模型本身的协议参见官方仓库的说明。本仓库的代码为 Apache 和 MIT 协议。

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.cargo		.cargo
.github/workflows		.github/workflows
assets		assets
examples		examples
src		src
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

qwen.rs

使用方法

MKL

Accelerate

使用协议

About

Releases 6

Packages

Languages

yportne13/qwen.rs

Folders and files

Latest commit

History

Repository files navigation

qwen.rs

使用方法

MKL

Accelerate

使用协议

About

Resources

Stars

Watchers

Forks

Releases 6

Packages 0

Languages

Packages