dp-trtllm

Dummy Plug for NVIDIA TensorRT-LLM used by transformers pipeline.

Installation

git clone https://github.com/bloodeagle40234/dp-trtllm
cd dp-trtllm
pip install .

Usage

Create DummyPlug instance via TensorRT-LLM engine directory, then pass the instance to transformers pipeline

from transformers import AutoTokenizer
from transformers.pipelines import pipeline
from dp_trtllm import DummyPlug

tokenizer = AutoTokenizer.from_pretrained(
    "<base model path>", device_map="cuda")
model = DummyPlug("<engine path>")

pipe = pipeline(
    "text-generation",
    model=model,
    framework="pt",
    tokenizer=tokenizer,
    eos_token=tokenizer.eos_token_id,
    pad_token=tokenizer.pad_token_id,
    max_new_tokens=1024,
    device_map="cuda"
)

pipe("Hello, how are you?")

Example: llm-jp-eval

If you want to use DummyPlug for evaluation tool like llm-jp-eval, set DummyPlug class for model target. Note that addtional configigurations other than TensorRT-LLM's build config (e.g. dtype, device) will be ignored.

model:
  _target_: dp_trtllm.DummyPlug
  pretrained_model_name_or_path: <engine path>

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
dp_trtllm		dp_trtllm
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

dp-trtllm

Installation

Usage

Example: llm-jp-eval

References

About

Releases

Packages

Languages

License

bloodeagle40234/dp-trtllm

Folders and files

Latest commit

History

Repository files navigation

dp-trtllm

Installation

Usage

Example: llm-jp-eval

References

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages