Fix device hardcoding and duplicate function in pipeline.py

ronantakizawa · ronantakizawa · commit f51ef7fe5f0d · 2025-10-14T23:12:43.000-06:00
- Use model_device instead of hardcoded cuda:0 for multi-GPU compatibility
- Define _materialize_meta_tensors once before loop to avoid duplication
- Improves maintainability and correctness in multi-device environments

Signed-off-by: ronantakizawa &lt;ronantakizawa@gmail.com&gt;
diff --git a/src/llmcompressor/pipelines/sequential/pipeline.py b/src/llmcompressor/pipelines/sequential/pipeline.py
@@ -91,6 +91,22 @@ def __call__(
             # prepare intermediates cache
             activations = IntermediatesCache.from_dataloader(dataloader, model_device)
 
+            # Define helper function to materialize meta tensors once
+            # Fixes "Tensor.item() on meta tensors" error when using device offloading
+            def _materialize_meta_tensors(obj):
+                if isinstance(obj, torch.Tensor) and obj.is_meta:
+                    return torch.zeros_like(obj, device=model_device)
+                elif isinstance(obj, dict):
+                    return {
+                        k: _materialize_meta_tensors(v)
+                        for k, v in obj.items()
+                    }
+                elif isinstance(obj, (list, tuple)):
+                    return type(obj)(
+                        [_materialize_meta_tensors(x) for x in obj]
+                    )
+                return obj
+
             for subgraph_index, subgraph in enumerate(subgraphs):
                 # prepare tqdm description texts
                 calib_desc = f"({subgraph_index + 1}/{num_subgraphs}): Calibrating"
@@ -101,26 +117,6 @@ def __call__(
                     # do a preliminary pass to trigger modifier hooks
                     for batch_idx in tqdm(range(len(dataloader)), desc=calib_desc):
                         inputs = activations.fetch(batch_idx, subgraph.input_names)
-
-                        # PATCH: Materialize meta tensors before traced code
-                        # Fixes "Tensor.item() on meta tensors" error
-                        def _materialize_meta_tensors(obj):
-                            if isinstance(obj, torch.Tensor) and obj.is_meta:
-                                device = torch.device(
-                                    "cuda:0" if torch.cuda.is_available() else "cpu"
-                                )
-                                return torch.zeros_like(obj, device=device)
-                            elif isinstance(obj, dict):
-                                return {
-                                    k: _materialize_meta_tensors(v)
-                                    for k, v in obj.items()
-                                }
-                            elif isinstance(obj, (list, tuple)):
-                                return type(obj)(
-                                    [_materialize_meta_tensors(x) for x in obj]
-                                )
-                            return obj
-
                         inputs = _materialize_meta_tensors(inputs)
                         subgraph.forward(model, **inputs)
 
@@ -131,25 +127,6 @@ def _materialize_meta_tensors(obj):
                     with HooksMixin.disable_hooks():
                         for batch_idx in tqdm(range(len(dataloader)), desc=prop_desc):
                             inputs = activations.fetch(batch_idx, subgraph.input_names)
-
-                            # PATCH: Materialize meta tensors (same as above)
-                            def _materialize_meta_tensors(obj):
-                                if isinstance(obj, torch.Tensor) and obj.is_meta:
-                                    device = torch.device(
-                                        "cuda:0" if torch.cuda.is_available() else "cpu"
-                                    )
-                                    return torch.zeros_like(obj, device=device)
-                                elif isinstance(obj, dict):
-                                    return {
-                                        k: _materialize_meta_tensors(v)
-                                        for k, v in obj.items()
-                                    }
-                                elif isinstance(obj, (list, tuple)):
-                                    return type(obj)(
-                                        [_materialize_meta_tensors(x) for x in obj]
-                                    )
-                                return obj
-
                             inputs = _materialize_meta_tensors(inputs)
                             output = subgraph.forward(model, **inputs)