This branch is 2 commits ahead of, 11 commits behind AI-Hypercomputer/JetStream:main.

Name	Name	Last commit message	Last commit date
Latest commit wangkuiyi Update api_server.py Dec 10, 2024 f32ae27 · Dec 10, 2024 History 125 Commits
.github	.github	Makefile (AI-Hypercomputer#125 )	Aug 7, 2024
benchmarks	benchmarks	Rename third_party folder to Avoid Copybara g3 Errors (AI-Hypercomput…	Nov 8, 2024
docs	docs	Update JetStream instructions (AI-Hypercomputer#132 )	Aug 23, 2024
jetstream	jetstream	Update api_server.py	Dec 10, 2024
.gitignore	.gitignore	Prometheus Metrics (AI-Hypercomputer#71 )	May 10, 2024
AUTHORS	AUTHORS	JetStream init version	Mar 1, 2024
CONTRIBUTING.md	CONTRIBUTING.md	JetStream init version	Mar 1, 2024
LICENSE	LICENSE	JetStream init version	Mar 1, 2024
MANIFEST.in	MANIFEST.in	Update deps file (AI-Hypercomputer#130 )	Aug 12, 2024
Makefile	Makefile	Rename third_party folder to Avoid Copybara g3 Errors (AI-Hypercomput…	Nov 8, 2024
README.md	README.md	Update deps file (AI-Hypercomputer#130 )	Aug 12, 2024
license_preamble.txt	license_preamble.txt	Makefile (AI-Hypercomputer#125 )	Aug 7, 2024
pylintrc	pylintrc	Rename third_party folder to Avoid Copybara g3 Errors (AI-Hypercomput…	Nov 8, 2024
requirements.txt	requirements.txt	Standalone JetStream removes pinned deps (AI-Hypercomputer#129 )	Aug 12, 2024
setup.py	setup.py	Update deps file (AI-Hypercomputer#130 )	Aug 12, 2024

Repository files navigation

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices, starting with TPUs (and GPUs in future -- PRs welcome).

JetStream Engine Implementation

Currently, there are two reference engine implementations available -- one for Jax models and another for Pytorch models.

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

make install-deps

Run local server & Testing

Use the following commands to run a server locally:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Test core modules

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream Engine Implementation

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

Run local server & Testing

Test core modules

About

Releases

Packages

Languages

License

wangkuiyi/JetStream

Folders and files

Latest commit

History

Repository files navigation

JetStream is a throughput and memory optimized engine for LLM inference on XLA devices.

About

JetStream Engine Implementation

Jax

Pytorch

Documentation

JetStream Standalone Local Setup

Getting Started

Setup

Run local server & Testing

Test core modules

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages