Use data parallel sharding by default (#267)

Our model expects that and so this is a reasonable default to use out of the box.
2025-02-05 23:15:24 -08:00
parent 6104624aca
commit f543cb1d87
1 changed files with 6 additions and 1 deletions
--- a/src/openpi/training/data_loader.py
+++ b/src/openpi/training/data_loader.py
@@ -214,7 +214,12 @@ class TorchDataLoader:
            raise ValueError(f"Local batch size ({local_batch_size}) is larger than the dataset size ({len(dataset)}).")

        if sharding is None:
-            sharding = jax.sharding.SingleDeviceSharding(jax.devices()[0])
+            # Use data parallel sharding by default.
+            sharding = jax.sharding.NamedSharding(
+                jax.sharding.Mesh(jax.devices(), ("B",)),
+                jax.sharding.PartitionSpec("B"),
+            )
+
        self._sharding = sharding
        self._num_batches = num_batches