reword

Signed-off-by: Roger Wang <[email protected]>
vllm-project · Dec 30, 2024 · bbd5752 · bbd5752
1 parent 55eada7
commit bbd5752
Showing 1 changed file with 3 additions and 3 deletions.
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
@@ -655,9 +655,9 @@ def profile_run(self) -> None:
                 self.mm_registry.get_mm_limits_per_prompt(
                     self.model_config).values())
 
-            # NOTE: We do not consider max_num_batched_tokens on
-            # purpose because the image embeddings can be generated in
-            # advanced and chunked prefilled.
+            # NOTE: We do not consider max_num_batched_tokens on purpose
+            # because the multimodal embeddings can be generated in advance
+            # and chunked prefilled.
             max_num_mm_items_decoder_budget = self.max_num_reqs * \
                 max_mm_items_per_req