[proto] Speed-up crop on bboxes and tests

pytorch · vfdev-5 · Nov 3, 2022 · Nov 1, 2022 · Nov 1, 2022 · Nov 1, 2022
commit 6a618e2afaad0f755674623e0e6be6419925e945
diff --git a/test/prototype_transforms_kernel_infos.py b/test/prototype_transforms_kernel_infos.py
@@ -862,6 +862,29 @@ def sample_inputs_crop_video():
  yield ArgsKwargs(video_loader, top=4, left=3, height=7, width=8)
 
 
+def reference_crop_bounding_box(bounding_box, *, format, top, left, height, width):
+
+ affine_matrix = np.array(
+ [
+ [1, 0, -left],
+ [0, 1, -top],
+ ],
+ dtype="float32",
+ )
+
+ expected_bboxes = reference_affine_bounding_box_helper(
+ bounding_box, format=format, affine_matrix=affine_matrix
+ )
+ return expected_bboxes, (height, width)
+
+
+def reference_inputs_crop_bounding_box():
+ for bounding_box_loader, params in itertools.product(
+ make_bounding_box_loaders(extra_dims=((), (4,))), [_CROP_PARAMS[0], _CROP_PARAMS[-1]]
+ ):
+ yield ArgsKwargs(bounding_box_loader, format=bounding_box_loader.format, **params)
+
+
 KERNEL_INFOS.extend(
  [
  KernelInfo(
@@ -875,6 +898,8 @@ def sample_inputs_crop_video():
  KernelInfo(
  F.crop_bounding_box,
  sample_inputs_fn=sample_inputs_crop_bounding_box,
+ reference_fn=reference_crop_bounding_box,
+ reference_inputs_fn=reference_inputs_crop_bounding_box,
  ),
  KernelInfo(
  F.crop_mask,

diff --git a/torchvision/prototype/transforms/functional/_geometry.py b/torchvision/prototype/transforms/functional/_geometry.py
@@ -801,7 +801,7 @@ def pad(
 crop_image_pil = _FP.crop
 
 
-def crop_bounding_box(
+def crop_bounding_box_old(
  bounding_box: torch.Tensor,
  format: features.BoundingBoxFormat,
  top: int,
@@ -827,6 +827,27 @@ def crop_bounding_box(
  )
 
 
+def crop_bounding_box(
+ bounding_box: torch.Tensor,
+ format: features.BoundingBoxFormat,
+ top: int,
+ left: int,
+ height: int,
+ width: int,
+) -> Tuple[torch.Tensor, Tuple[int, int]]:
+
+ bounding_box = bounding_box.clone()
+
+ # Crop or implicit pad if left and/or top have negative values:
+ if format == features.BoundingBoxFormat.XYXY:
+ sub = torch.tensor([left, top, left, top])
+ else:
+ sub = torch.tensor([left, top, 0, 0])
+ bounding_box.sub_(sub)
+
+ return bounding_box, (height, width)
+
+
 def crop_mask(mask: torch.Tensor, top: int, left: int, height: int, width: int) -> torch.Tensor:
  return crop_image_tensor(mask, top, left, height, width)