vllm-project · kylesayrs · Mar 15, 2025 · Mar 15, 2025 · Mar 15, 2025 · Mar 15, 2025
diff --git a/src/llmcompressor/core/events/event.py b/src/llmcompressor/core/events/event.py
@@ -44,6 +44,7 @@ class EventType(Enum):
     BATCH_START = "batch_start"
     LOSS_CALCULATED = "loss_calculated"
     BATCH_END = "batch_end"
+    SEQUENTIAL_BATCH_END = "sequential_batch_end"
 
     # step lifecycle
     OPTIM_PRE_STEP = "optim_pre_step"
@@ -82,6 +83,10 @@ class Event:
     global_step: int = 0
     global_batch: int = 0
 
+    def __init__(self, **kwargs):
+        for key, value in kwargs.items():
+            setattr(self, key, value)
+
     @property
     def epoch_based(self) -> bool:
         """

diff --git a/src/llmcompressor/core/llmcompressor/event_lifecycle.py b/src/llmcompressor/core/llmcompressor/event_lifecycle.py
@@ -0,0 +1,121 @@
+from functools import wraps
+from typing import TYPE_CHECKING, Any, Callable, List, Optional
+
+from loguru import logger
+
+from llmcompressor.core.events import Event, EventType
+from llmcompressor.utils.singleton import SingletonMixin
+
+if TYPE_CHECKING:
+    from llmcompressor.core.llmcompressor.events_mixin import EventsMixin
+
+
+class EventsLifecycle(SingletonMixin):
+    auto_step: Optional[bool] = None
+    event_order: List[EventType] = [
+        EventType.BATCH_START,
+        EventType.LOSS_CALCULATED,
+        EventType.OPTIM_PRE_STEP,
+        EventType.OPTIM_POST_STEP,
+        EventType.BATCH_END,
+    ]
+    last_event_type: Optional[EventType] = EventType.BATCH_END
+    initialized: bool = False
+    finalized: bool = False
+
+    @classmethod
+    def initialize(cls, fn: Callable[[Any], Any]):
+        def validator(self: "EventsMixin", **kwargs):
+            if cls.initialized:
+                raise ValueError("Cannot initialize twice")
+            cls.initialized = True
+            cls.finalized = False
+
+        return cls._wrap_with_validation(fn, validator)
+
+    @classmethod
+    def finalize(cls, fn: Callable[[Any], Any]):
+        def validator(self: "EventsMixin", **kwargs):
+            if not cls.initialized:
+                raise ValueError("Cannot finalize before initializing")
+            if cls.finalized:
+                raise ValueError("Cannot finalize twice")
+            cls.finalized = True
+            cls.initialized = False
+
+        return cls._wrap_with_validation(fn, validator)
+
+    @classmethod
+    def global_step(cls, fn: Callable[[Any], Any]):
+        def validator(self: "EventsMixin", global_step: Optional[int] = None, **kwargs):
+            # configure auto step
+            if cls.auto_step is None:
+                if global_step is None:
+                    logger.info(
+                        "No global_step was passed to batch_start event, "
+                        "auto-stepping based on batches"
+                    )
+                    cls.auto_step = True
+                else:
+                    cls.auto_step = False
+
+            # auto step
+            if global_step is None:
+                if not cls.auto_step:
+                    raise ValueError(
+                        "Cannot auto-step batches if global_step was "
+                        "previously passed to batch_start event"
+                    )
+                global_step = self.state.current_index + 1
+            else:
+                if cls.auto_step:
+                    raise ValueError(
+                        "Cannot auto-step batches if global_step "
+                        "was passed to batch_start event"
+                    )
+
+            # validate order
+            if global_step <= self.state.current_index:
+                raise ValueError("global_step must be greater than the current index")
+
+            self.state.current_index = global_step
+
+        return cls._wrap_with_validation(fn, validator)
+
+    @classmethod
+    def event(cls, fn: Callable[[Any], Any]):
+        def validator(self: "EventsMixin", event: Event):
+            event_type = event.type_
+
+            # ignore unhandled events
+            if event_type not in cls.event_order:
+                return
+
+            # validate
+            if event_type == EventType.BATCH_START:
+                valid = cls.last_event_type != EventType.BATCH_START
+            else:
+                last_event_index = cls.event_order.index(cls.last_event_type)
+                curr_event_index = cls.event_order.index(event_type)
+                valid = last_event_index <= curr_event_index
+
+            if not valid:
+                raise ValueError(
+                    f"Lifecycle events must appear in order: {cls.event_order}. "
+                    f"Instead, {cls.last_event_type} was called before {event_type}"
+                )
+
+            cls.last_event_type = event_type
+
+        return cls._wrap_with_validation(fn, validator)
+
+    @classmethod
+    def _wrap_with_validation(
+        cls, fn: Callable[[Any], Any], validator: Callable[[Any], Any]
+    ) -> Callable:
+        @wraps(fn)
+        def wrapped(*args, **kwargs):
+            validator(*args, **kwargs)
+            return fn(*args, **kwargs)
+
+        return wrapped
diff --git a/src/llmcompressor/core/llmcompressor/events_mixin.py b/src/llmcompressor/core/llmcompressor/events_mixin.py
@@ -0,0 +1,74 @@
+from abc import ABC
+from typing import List
+
+import torch
+
+from llmcompressor.core import Event, EventType, State
+from llmcompressor.core.llmcompressor.event_lifecycle import EventsLifecycle
+from llmcompressor.modifiers import Modifier
+from llmcompressor.transformers.sparsification.compressed_tensors_utils import (
+    modify_save_pretrained,
+)
+
+
+class EventsMixin(ABC):
+    state: State
+    modifiers: List[Modifier]
+
+    @EventsLifecycle.initialize
+    def initialize(self):
+        for modifier in self.modifiers:
+            modifier.on_initialize(self.state)
+
+    @EventsLifecycle.finalize
+    def finalize(self):
+        for modifier in self.modifiers:
+            modifier.on_finalize(self.state)
+
+        # TODO: log info stating that save_pretrained has been modified
+        # TODO: make sure wrapped function can access new recipe and processor
+        modify_save_pretrained(self.state.model)
+
+    def update_state(self, **kwargs):
+        self.state.update(**kwargs)
+        # if future modifiers require update, do that update here
+
+    @EventsLifecycle.global_step
+    def batch_start(self, **kwargs):
+        # modifiers can only start on batch_start
+        for modifier in self.modifiers:
+            if modifier.should_start(self.state):
+                modifier.on_start(self.state)
+
+        event = Event(type_=EventType.BATCH_START, **kwargs)
+        self._handle_event(event)
+
+    def pre_optim(self, **kwargs):
+        event = Event(type_=EventType.OPTIM_PRE_STEP, **kwargs)
+        self._handle_event(event)
+
+    def post_optim(self, **kwargs):
+        event = Event(type_=EventType.OPTIM_POST_STEP, **kwargs)
+        self._handle_event(event)
+
+    def update_loss(self, loss: torch.Tensor, **kwargs):
+        event = Event(type_=EventType.LOSS_CALCULATED, loss=loss, **kwargs)
+        self._handle_event(event)
+
+    def sequential_batch_end(self, **kwargs):
+        event = Event(type_=EventType.SEQUENTIAL_BATCH_END, **kwargs)
+        self._handle_event(event)
+
+    def batch_end(self, **kwargs):
+        # modifiers can only end on batch_end
+        for modifier in self.modifiers:
+            if modifier.should_end(self.state):
+                modifier.on_end(self.state)
+
+        event = Event(type_=EventType.BATCH_END, **kwargs)
+        self._handle_event(event)
+
+    @EventsLifecycle.event
+    def _handle_event(self, event: Event):
+        for modifier in self.modifiers:
+            modifier.on_event(self.state, event)
diff --git a/src/llmcompressor/core/llmcompressor/globals.py b/src/llmcompressor/core/llmcompressor/globals.py
@@ -0,0 +1,25 @@
+from typing import TYPE_CHECKING
+
+from transformers import PreTrainedModel
+
+if TYPE_CHECKING:
+    from llmcompressor.core import State
+    from llmcompressor.core.llmcompressor.llmcompressor import LLMCompressor
+
+
+def get_compressor() -> "LLMCompressor":
+    from llmcompressor.core.llmcompressor.llmcompressor import LLMCompressor
+
+    return LLMCompressor.instance()
+
+
+def get_state() -> "State":
+    from llmcompressor.core.llmcompressor.llmcompressor import LLMCompressor
+
+    return LLMCompressor.instance().state
+
+
+def get_model() -> PreTrainedModel:
+    from llmcompressor.core.llmcompressor.llmcompressor import LLMCompressor
+
+    return LLMCompressor.instance().state.model
diff --git a/src/llmcompressor/core/llmcompressor/llmcompressor.py b/src/llmcompressor/core/llmcompressor/llmcompressor.py
@@ -0,0 +1,60 @@
+from typing import List, Optional, Union
+
+from torch.utils.data import DataLoader
+
+from llmcompressor.args.model_arguments import ModelArguments
+from llmcompressor.core import State
+from llmcompressor.core.llmcompressor.events_mixin import EventsMixin
+from llmcompressor.core.llmcompressor.train import HFSFTMixin
+from llmcompressor.core.llmcompressor.utils import (
+    LCDatasetArguments,
+    check_for_calibration_data,
+    get_modifiers_from_recipe,
+    parse_args,
+    prepare_models,
+    resolve_calibration_pipeline,
+)
+from llmcompressor.datasets.utils import get_calibration_dataloader
+from llmcompressor.modifiers import Modifier
+from llmcompressor.pytorch.model_load.helpers import save_checkpoint
+from llmcompressor.recipe import RecipeInput
+from llmcompressor.typing import DatasetType, ModelInput
+from llmcompressor.utils.singleton import SingletonMixin
+
+
+class LLMCompressor(SingletonMixin, EventsMixin, HFSFTMixin):
+    state: State
+    modifiers: List[Modifier]
+    calibration_loader: Optional[DataLoader] = None
+
+    def __init__(self, model: ModelInput, recipe: RecipeInput, **kwargs):
+        model_args = parse_args(ModelArguments, model=model, **kwargs)
+
+        self.modifiers = get_modifiers_from_recipe(recipe)
+
+        model, teacher, processor = prepare_models(model_args)
+        self.state = State(model=model, teacher_model=teacher, processor=processor)
+
+    def set_calibration_dataset(self, dataset: Union[str, DatasetType], **kwargs):
+        dataset_args = parse_args(LCDatasetArguments, dataset=dataset, **kwargs)
+
+        # temporary hack to support better interface
+        if dataset_args.split is not None:
+            dataset_args.splits = {"calibration": dataset_args.split}
+
+        self.calibration_loader = get_calibration_dataloader(
+            dataset_args, self.state.processor
+        )
+
+    def post_train(self, pipeline: Optional[str] = None, save_path: Optional[str] = None):
+        check_for_calibration_data(self.modifiers, self.calibration_loader)
+        pipeline_fn, pipeline_kwargs = resolve_calibration_pipeline(
+            pipeline, self.modifiers
+        )
+
+        self.initialize()
+        pipeline_fn(self.state.model, self.calibration_loader, **pipeline_kwargs)
+        self.finalize()
+
+        if save_path is not None:
+            save_checkpoint(save_path, self.state.model, self.state.processor)
diff --git a/src/llmcompressor/core/llmcompressor/train.py b/src/llmcompressor/core/llmcompressor/train.py
@@ -0,0 +1,62 @@
+import math
+from typing import TYPE_CHECKING, Optional, Union
+
+from llmcompressor.args.training_arguments import TrainingArguments
+from llmcompressor.core import State
+from llmcompressor.core.llmcompressor.utils import LCDatasetArguments, parse_args
+from llmcompressor.datasets.utils import get_processed_dataset
+from llmcompressor.transformers.finetune.trainer import Trainer
+from llmcompressor.typing import DatasetType
+
+if TYPE_CHECKING:
+    from transformers.data.data_collator import DataCollator
+
+
+class HFSFTMixin:
+    state: State
+    train_dataset: Optional[DatasetType] = None
+    train_data_collator: Optional["DataCollator"] = None
+
+    def set_train_dataset(self, dataset: Union[str, DatasetType], **kwargs):
+        dataset_args = parse_args(LCDatasetArguments, dataset=dataset, **kwargs)
+
+        processed_dataset = get_processed_dataset(
+            dataset_args=dataset_args,
+            processor=self.state.processor,
+        )
+        self.train_dataset = processed_dataset.get("train")
+
+    def train(self, **kwargs):
+        raise NotImplementedError(
+            "Implementing LLMCompressor.train would require "
+            "changes which break existing training pathways"
+        )
+
+        training_args = parse_args(TrainingArguments, **kwargs)
+
+        trainer = Trainer(
+            model=self.state.model,
+            teacher=self.state.teacher_model,
+            # recipe=recipe_args.recipe,
+            # recipe_args=recipe_args.recipe_args,
+            args=training_args,
+            # model_args=model_args,
+            # dataset_args=dataset_args,
+            train_dataset=self.train_dataset,
+            processing_class=self.state.processor,
+            data_collator=self.train_data_collator,
+        )
+
+        # run training
+        checkpoint = training_args.resume_from_checkpoint
+        train_result = trainer.train(resume_from_checkpoint=checkpoint)
+
+        # save metrics
+        metrics = train_result.metrics
+        metrics["train_samples"] = len(self.train_dataset)
+        metrics["perplexity"] = math.exp(metrics["train_loss"])
+        trainer.log_metrics("train", metrics)
+        trainer.save_metrics("train", metrics)
+
+        # save model
+        trainer.save_model(output_dir=training_args.output_dir)