datasets/main.py

import argparse
import asyncio
from pathlib import Path
import signal
import traceback
from typing import Any, List, NamedTuple, Optional, Union
from numbers import Number
import ray

import torch
import tqdm.asyncio
from render import render_shape, RenderParameters, ZERO_DISTRIBUTION
from shapes import *

def bool_or_float(s: Any) -> Union[bool, float]:
    ua = str(s).upper()
    if 'TRUE'.startswith(ua):
       return True
    elif 'FALSE'.startswith(ua):
       return False
    try:
        return float(s)
    except:
        raise ValueError("Expected a bool or number, but got", s)


class DatasetParameters(NamedTuple):
    resolution: torch.Size
    event_density: float
    bg_density: float
    shape_density: float = 1
    polarity: bool = True

    upsampling_factor: int = 8
    upsampling_cutoff: float = 1 / 2
    bg_files: Optional[List[str]] = None
    device: str = "cuda"
    length: int = 128

    translate: bool = False
    scale: Union[bool, float] = False
    rotate: bool = False
    shear: bool = False
    max_velocity: float = 0.2
    constant_velocity: bool = True


def superimpose_data(file, images, p: DatasetParameters):
    _, _, frames, _, _, _, _ = torch.load(file, map_location=p.device)
    # Reduce polarity
    if not p.polarity:
        frames = frames.sum(-1, keepdim=True)
    # Crop
    frames = frames[:, : p.resolution[0], : p.resolution[1]]
    # Permute to TCHW
    frames = frames.permute(0, 3, 2, 1)
    # Normalize
    return (images + frames).clip(0, 1)


def render_shapes(p: DatasetParameters):
    shapes = []
    labels = []
    args = {}
    for fn in [circle, square, triangle]:
        if p.constant_velocity:
            cat = torch.distributions.Categorical(torch.tensor([0.5, 0.5]))
            if p.translate:
                args["translate_velocity_delta"] = lambda x: ZERO_DISTRIBUTION.sample(
                    (x,)
                )
                args["translate_velocity_start"] = (
                    (cat.sample((2,)).to(p.device) - 0.5) * 2 * p.max_velocity
                )
            if p.scale and isinstance(p.scale, bool):
                args["scale_velocity_delta"] = lambda x: ZERO_DISTRIBUTION.sample((x,))
                args["scale_velocity_start"] = (
                    (cat.sample((1,)).to(p.device) - 0.5) * 2 * p.max_velocity
                )
            if isinstance(p.scale, Number) and not isinstance(p.scale, bool):
                args["scale_velocity_delta"] = lambda x: ZERO_DISTRIBUTION.sample((x,))
                args["scale_start"] = float(p.scale)
            if p.rotate:
                args["rotate_velocity_delta"] = lambda x: ZERO_DISTRIBUTION.sample((x,))
                args["rotate_velocity_start"] = (
                    (cat.sample((1,)).to(p.device) - 0.5) * 2 * p.max_velocity
                )
            if p.shear:
                args["shear_velocity_delta"] = lambda x: ZERO_DISTRIBUTION.sample((x,))
                args["shear_velocity_start"] = (
                    (cat.sample((1,)).to(p.device) - 0.5) * 2 * p.max_velocity
                )
        render_p = RenderParameters(
            length=p.length,
            resolution=p.resolution,
            shape_density=p.shape_density,
            bg_noise_density=p.bg_density,
            event_density=p.event_density,
            device=p.device,
            scale=p.scale == True,
            translate=p.translate,
            rotate=p.rotate,
            rotate_start=None if p.rotate else 10,
            shear=p.shear,
            shear_start=None if p.shear else 10,
            upsampling_factor=p.upsampling_factor,
            upsampling_cutoff=p.upsampling_cutoff,
            transformation_velocity_max=p.max_velocity,
            **args,
        )
        s, l = render_shape(fn, render_p)
        shapes.append(s)
        labels.append(l)

    images = torch.stack(shapes).sum(0)
    if not p.polarity:
        images = images.sum(1, keepdim=True)
    images = images.clip(0, 1)
    labels = torch.stack(labels).permute(1, 0, 2, 3)
    return images, labels

@ray.remote(num_gpus=1)
def render_points(output_folder, index, p: DatasetParameters):
    filename = output_folder / f"{index}.dat"
    try:
        with torch.inference_mode():
            images, labels = render_shapes(p)
            if p.bg_files is not None:
                images = superimpose_data(
                    p.bg_files[index % len(p.bg_files)], images, p
                )

            t = [images.clip(0, 1).to_sparse(), labels]
            torch.save(t, filename)
    except Exception as e:
        print(e)
        traceback.print_exc()

def main(args):

    if args.seed is not None:
        torch.manual_seed(args.seed)

    n = torch.arange(args.n)
    resolution = (300, 300)
    root_folder = Path(args.root)
    if not root_folder.exists():
        root_folder.mkdir()

    bg_files = None
    if args.root_bg is not None:
        bg_folder = Path(args.root_bg)
        if bg_folder.exists():
            bg_files = list(bg_folder.glob("*.dat"))
            sorted(bg_files)

    # Permutations of transformations
    transformation_combinations = [
        args.translation,
        args.scaling,
        args.rotation,
        args.shearing,
    ]

    # Start multiprocessing
    sigint_handler = signal.signal(signal.SIGINT, signal.SIG_IGN)
    signal.signal(signal.SIGINT, sigint_handler)
    futures = []
    for event_p in args.event_densities:
        for max_velocity in args.max_velocities:
            combination_name = "".join(
                ["1" if x == True else "0" for x in transformation_combinations]
            )
            if isinstance(args.scaling, float):
                combination_name = f"s{args.scaling}_" + combination_name
            output_folder = (
                root_folder
                / f"v{max_velocity:.2f}-p{event_p:.2f}-{combination_name}"
            )
            for i in n:

                parameters = DatasetParameters(
                    resolution=resolution,
                    bg_density=0.001,
                    bg_files=bg_files,
                    event_density=event_p,
                    polarity=args.polarity,
                    device=f"cuda",
                    translate=args.translation,
                    scale=args.scaling,
                    rotate=args.rotation,
                    shear=args.shearing,
                    max_velocity=max_velocity,
                    constant_velocity=True,
                )
                if not output_folder.exists():
                    output_folder.mkdir()
                f = render_points.remote(output_folder, i, parameters)
                futures.append(f)
    ray.get(futures)


if __name__ == "__main__":
    parser = argparse.ArgumentParser("Render dataset")
    parser.add_argument("n", type=int, help="Number of samples per event density")
    parser.add_argument("root", type=str, help="Path to output directory")
    parser.add_argument(
        "--root_bg",
        type=str,
        default=None,
        help="Location of dataset to use as background",
    )
    parser.add_argument(
        "--seed",
        type=int,
        default=None,
        help="Random seed to initialize random dataset mapping",
    )
    parser.add_argument(
        "--translation",
        default=False,
        action="store_true",
    )
    parser.add_argument(
        "--scaling",
        default=False,
        type=bool_or_float
    )
    parser.add_argument(
        "--rotation",
        default=False,
        action="store_true",
    )
    parser.add_argument(
        "--shearing",
        default=False,
        action="store_true",
    )
    parser.add_argument(
        "--polarity",
        default=True,
        action="store_true",
    )
    parser.add_argument(
        "--event_densities",
        nargs="+",
        type=float,
        default=[1.0],
        help="Event density as a list of floats",
    )
    parser.add_argument(
        "--max_velocities",
        type=float,
        nargs="+",
        default=[0.2],
        help="Max velocities as a list of float (1 = 1px change/frame)",
    )
    args = parser.parse_args()

    ray.init()
    main(args)