lerobot

Files

AdilZouitine f83d215e7a Refactor SAC policy and training loop to enhance discrete action support

- Updated SACPolicy to conditionally compute losses for grasp critic based on num_discrete_actions.
- Simplified forward method to return loss outputs as a dictionary for better clarity.
- Adjusted learner_server to handle both main and grasp critic losses during training.
- Ensured optimizers are created conditionally for grasp critic based on configuration settings.

2025-04-18 15:10:22 +02:00

act

[pre-commit.ci] auto fixes from pre-commit.com hooks

2025-04-18 15:09:25 +02:00

diffusion

[pre-commit.ci] auto fixes from pre-commit.com hooks

2025-04-18 15:09:25 +02:00

hilserl

[pre-commit.ci] auto fixes from pre-commit.com hooks

2025-04-18 15:10:22 +02:00

pi0

[pre-commit.ci] auto fixes from pre-commit.com hooks