Why `preserve_rng_state=False` in activation checkpointing #1323

Open

Open

Why preserve_rng_state=False in activation checkpointing#1323

Labels

high prioritymodule: activation checkpointingquestiontriage review

opened

on Jun 20, 2025

Why does torchtitan set preserve_rng_state=False for activation checkpointing? E.g.:

torchtitan/torchtitan/models/llama3/infra/parallelize.py

Line 238 in f4048f8

return ptd_checkpoint_wrapper(module, preserve_rng_state=False)

Metadata

Assignees

No one assigned

Labels

high prioritymodule: activation checkpointingquestiontriage review

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests