rename to image_transforms

2024-06-06 16:50:22 +00:00
parent a86f387554
commit c45dd8f848
8 changed files with 23 additions and 24 deletions
--- a/examples/6_add_image_transforms.py
+++ b/examples/6_add_image_transforms.py
@@ -18,7 +18,7 @@ output_dir.mkdir(parents=True, exist_ok=True)
 repo_id = "lerobot/aloha_static_tape"
 # Create a LeRobotDataset with no transformations
-dataset = LeRobotDataset(repo_id, transform=None)
+dataset = LeRobotDataset(repo_id, image_transforms=None)
 # Get the index of the first observation in the first episode
 first_idx = dataset.episode_data_index["from"][0].item()
@@ -41,7 +41,7 @@ transforms = v2.Compose(
 )
 # Create another LeRobotDataset with the defined transformations
-transformed_dataset = LeRobotDataset(repo_id, transform=transforms)
+transformed_dataset = LeRobotDataset(repo_id, image_transforms=transforms)
 # Get a frame from the transformed dataset
 transformed_frame = transformed_dataset[first_idx][transformed_dataset.camera_keys[0]]
--- a/lerobot/common/datasets/factory.py
+++ b/lerobot/common/datasets/factory.py
@@ -19,7 +19,7 @@ import torch
 from omegaconf import ListConfig, OmegaConf
 from lerobot.common.datasets.lerobot_dataset import LeRobotDataset, MultiLeRobotDataset
-from lerobot.common.datasets.transforms import make_transforms
+from lerobot.common.datasets.transforms import make_image_transforms
 def resolve_delta_timestamps(cfg):
@@ -72,21 +72,21 @@ def make_dataset(cfg, split: str = "train") -> LeRobotDataset | MultiLeRobotData
    resolve_delta_timestamps(cfg)
-    transform = make_transforms(cfg.image_transform) if cfg.image_transform.enable else None
+    image_transforms = make_image_transforms(cfg.image_transforms) if cfg.image_transforms.enable else None
    if isinstance(cfg.dataset_repo_id, str):
        dataset = LeRobotDataset(
            cfg.dataset_repo_id,
            split=split,
            delta_timestamps=cfg.training.get("delta_timestamps"),
-            transform=transform,
+            image_transforms=image_transforms,
        )
    else:
        dataset = MultiLeRobotDataset(
            cfg.dataset_repo_id,
            split=split,
            delta_timestamps=cfg.training.get("delta_timestamps"),
-            transform=transform,
+            image_transforms=image_transforms,
        )
    if cfg.get("override_dataset_stats"):
--- a/lerobot/common/datasets/lerobot_dataset.py
+++ b/lerobot/common/datasets/lerobot_dataset.py
@@ -46,7 +46,7 @@ class LeRobotDataset(torch.utils.data.Dataset):
        version: str | None = CODEBASE_VERSION,
        root: Path | None = DATA_DIR,
        split: str = "train",
-        transform: Callable | None = None,
+        image_transforms: Callable | None = None,
        delta_timestamps: dict[list[float]] | None = None,
    ):
        super().__init__()
@@ -54,7 +54,7 @@ class LeRobotDataset(torch.utils.data.Dataset):
        self.version = version
        self.root = root
        self.split = split
-        self.transform = transform
+        self.transform = image_transforms
        self.delta_timestamps = delta_timestamps
        # load data from hub or locally when root is provided
        # TODO(rcadene, aliberts): implement faster transfer
@@ -226,7 +226,7 @@ class MultiLeRobotDataset(torch.utils.data.Dataset):
        version: str | None = CODEBASE_VERSION,
        root: Path | None = DATA_DIR,
        split: str = "train",
-        transform: Callable | None = None,
+        image_transforms: Callable | None = None,
        delta_timestamps: dict[list[float]] | None = None,
    ):
        super().__init__()
@@ -240,7 +240,7 @@ class MultiLeRobotDataset(torch.utils.data.Dataset):
                root=root,
                split=split,
                delta_timestamps=delta_timestamps,
-                transform=transform,
+                image_transforms=image_transforms,
            )
            for repo_id in repo_ids
        ]
@@ -275,7 +275,7 @@ class MultiLeRobotDataset(torch.utils.data.Dataset):
        self.version = version
        self.root = root
        self.split = split
-        self.transform = transform
+        self.transform = image_transforms
        self.delta_timestamps = delta_timestamps
        self.stats = aggregate_stats(self._datasets)
--- a/lerobot/common/datasets/transforms.py
+++ b/lerobot/common/datasets/transforms.py
@@ -98,7 +98,7 @@ class RangeRandomSharpness(Transform):
        return self._call_kernel(F.adjust_sharpness, inpt, sharpness_factor=sharpness_factor)
-def make_transforms(cfg, to_dtype: torch.dtype = torch.float32):
+def make_image_transforms(cfg, to_dtype: torch.dtype = torch.float32):
    transforms_list = [
        v2.ColorJitter(brightness=(cfg.brightness.min, cfg.brightness.max)),
        v2.ColorJitter(contrast=(cfg.contrast.min, cfg.contrast.max)),
--- a/lerobot/configs/default.yaml
+++ b/lerobot/configs/default.yaml
@@ -58,7 +58,7 @@ wandb:
  project: lerobot
  notes: ""
-image_transform:
+image_transforms:
  # brigthness, contrast, saturation and hue are instances of torchvision Colorjitter, sharpness is an instance of custom class
  enable: true
  # A subset of these transforms will be applied for each batch. This is the maximum size of that subset.
--- a/lerobot/scripts/visualize_image_transforms.py
+++ b/lerobot/scripts/visualize_image_transforms.py
@@ -4,14 +4,13 @@ import hydra
 from torchvision.transforms import ToPILImage
 from lerobot.common.datasets.lerobot_dataset import LeRobotDataset
-from lerobot.common.datasets.transforms import make_transforms
+from lerobot.common.datasets.transforms import make_image_transforms
 to_pil = ToPILImage()
 def main(cfg, output_dir=Path("outputs/image_transforms")):
-
+    dataset = LeRobotDataset(cfg.dataset_repo_id, image_transforms=None)
    dataset = LeRobotDataset(cfg.dataset_repo_id, transform=None)
    output_dir = Path(output_dir) / Path(cfg.dataset_repo_id.split("/")[-1])
    output_dir.mkdir(parents=True, exist_ok=True)
@@ -27,11 +26,11 @@ def main(cfg, output_dir=Path("outputs/image_transforms")):
    for transform_name in transforms:
        for t in transforms:
            if t == transform_name:
-                cfg.image_transform[t].weight = 1
+                cfg.image_transforms[t].weight = 1
            else:
-                cfg.image_transform[t].weight = 0
+                cfg.image_transforms[t].weight = 0
-        transform = make_transforms(cfg.image_transform)
+        transform = make_image_transforms(cfg.image_transforms)
        img = transform(frame)
        to_pil(img).save(output_dir / f"{transform_name}.png", quality=100)
--- a/tests/scripts/save_image_transforms.py
+++ b/tests/scripts/save_image_transforms.py
@@ -15,7 +15,7 @@ to_pil = v2.ToPILImage()
 def main(repo_id):
-    dataset = LeRobotDataset(repo_id, transform=None)
+    dataset = LeRobotDataset(repo_id, image_transforms=None)
    output_dir = Path(ARTIFACT_DIR)
    output_dir.mkdir(parents=True, exist_ok=True)
--- a/tests/test_transforms.py
+++ b/tests/test_transforms.py
@@ -8,7 +8,7 @@ from torchvision.transforms.v2 import functional as F  # noqa: N812
 from PIL import Image
 from safetensors.torch import load_file
-from lerobot.common.datasets.transforms import RandomSubsetApply, RangeRandomSharpness, make_transforms
+from lerobot.common.datasets.transforms import RandomSubsetApply, RangeRandomSharpness, make_image_transforms
 from lerobot.common.datasets.utils import flatten_dict
 from lerobot.common.utils.utils import init_hydra_config, seeded_context
 from tests.utils import DEFAULT_CONFIG_PATH
@@ -147,7 +147,7 @@ class TestMakeTransforms:
        config = self.config
        config[transform_key]["weight"] = 1
        cfg = OmegaConf.create(config)
-        transform = make_transforms(cfg, to_dtype=torch.uint8)
+        transform = make_image_transforms(cfg, to_dtype=torch.uint8)
        # expected_t = self.transforms[transform_key]
        with seeded_context(seed):