codeplaysoftware
diff --git a/‎aten/src/ATen/SparseCsrTensorImpl.cpp‎
Lines changed: 2 additions & 1 deletion b/‎aten/src/ATen/SparseCsrTensorImpl.cpp‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎aten/src/ATen/native/native_functions.yaml‎
Lines changed: 12 additions & 12 deletions b/‎aten/src/ATen/native/native_functions.yaml‎
Lines changed: 12 additions & 12 deletions
diff --git a/‎aten/src/ATen/native/sparse/SparseCsrTensor.cpp‎
Lines changed: 17 additions & 11 deletions b/‎aten/src/ATen/native/sparse/SparseCsrTensor.cpp‎
Lines changed: 17 additions & 11 deletions
diff --git a/‎c10/core/DispatchKey.cpp‎
Lines changed: 3 additions & 0 deletions b/‎c10/core/DispatchKey.cpp‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎c10/core/DispatchKey.h‎
Lines changed: 1 addition & 0 deletions b/‎c10/core/DispatchKey.h‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎c10/core/DispatchKeySet.h‎
Lines changed: 4 additions & 2 deletions b/‎c10/core/DispatchKeySet.h‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎c10/core/TensorOptions.h‎
Lines changed: 3 additions & 0 deletions b/‎c10/core/TensorOptions.h‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎test/test_sparse.py‎
Lines changed: 65 additions & 5 deletions b/‎test/test_sparse.py‎
Lines changed: 65 additions & 5 deletions
diff --git a/‎torch/_tensor_str.py‎
Lines changed: 21 additions & 9 deletions b/‎torch/_tensor_str.py‎
Lines changed: 21 additions & 9 deletions
@@ -55,7 +55,8 @@ SparseCsrTensorImpl::SparseCsrTensorImpl(
  "to https://github.com/pytorch/pytorch/issues.");
 
  TORCH_INTERNAL_ASSERT(((key_set.has(DispatchKey::SparseCsrCPU) && device().type() == kCPU)
- || (key_set.has(DispatchKey::SparseCsrCUDA) && device().type() == kCUDA)),
+ || (key_set.has(DispatchKey::SparseCsrCUDA) && device().type() == kCUDA)
+ || (key_set.has(DispatchKey::SparseCsrMeta) && device().type() == kMeta)),
  "Inconsistent key_set (=", key_set, ") and device (=", device(), ")");
 
  set_storage_access_should_throw();
 
@@ -2370,7 +2370,7 @@
  Meta: empty_meta_symint
  MkldnnCPU: empty_mkldnn
  SparseCPU, SparseCUDA, SparseMeta: empty_sparse
- SparseCsrCPU, SparseCsrCUDA: empty_sparse_compressed
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: empty_sparse_compressed
  QuantizedCPU, QuantizedCUDA, QuantizedMeta: empty_unknown_quantized
  tags: core
 
@@ -2476,7 +2476,7 @@
  CompositeExplicitAutograd: empty_like
  QuantizedCPU, QuantizedCUDA: empty_like_quantized
  SparseCPU, SparseCUDA, SparseMeta: empty_like_sparse_coo
- SparseCsrCPU, SparseCsrCUDA: empty_like_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: empty_like_sparse_csr
  NestedTensorCPU, NestedTensorCUDA: empty_like_nested
  autogen: empty_like.out
 
@@ -6986,7 +6986,7 @@
 
 - func: sparse_compressed_tensor.comp_plain_value_size(Tensor compressed_indices, Tensor plain_indices, Tensor values, SymInt[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=False) -> Tensor
  dispatch:
- CompositeExplicitAutograd: sparse_compressed_tensor
+ CompositeExplicitAutograd, SparseCsrMeta: sparse_compressed_tensor
 
 - func: sparse_csr_tensor.crow_col_value_size(Tensor crow_indices, Tensor col_indices, Tensor values, int[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=False) -> Tensor
 - func: sparse_csc_tensor.ccol_row_value_size(Tensor ccol_indices, Tensor row_indices, Tensor values, int[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=False) -> Tensor
@@ -7003,7 +7003,7 @@
 
 - func: _sparse_compressed_tensor_unsafe(Tensor compressed_indices, Tensor plain_indices, Tensor values, SymInt[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=None) -> Tensor
  dispatch:
- CompositeImplicitAutograd: _sparse_compressed_tensor_unsafe_symint
+ CompositeImplicitAutograd, SparseCsrMeta: _sparse_compressed_tensor_unsafe_symint
 
 - func: _sparse_csr_tensor_unsafe(Tensor crow_indices, Tensor col_indices, Tensor values, int[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=None) -> Tensor
 - func: _sparse_csc_tensor_unsafe(Tensor ccol_indices, Tensor row_indices, Tensor values, int[] size, *, ScalarType? dtype=None, Layout? layout=None, Device? device=None, bool? pin_memory=None) -> Tensor
@@ -7090,7 +7090,7 @@
  dispatch:
  CPU, CUDA: sparse_dim_strided
  SparseCPU, SparseCUDA, SparseMeta: sparse_dim_sparse
- SparseCsrCPU, SparseCsrCUDA: sparse_dim_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: sparse_dim_sparse_csr
  device_check: NoCheck
  device_guard: False
 
@@ -7107,7 +7107,7 @@
  dispatch:
  CPU, CUDA: dense_dim_strided
  SparseCPU, SparseCUDA, SparseMeta: dense_dim_sparse
- SparseCsrCPU, SparseCsrCUDA: dense_dim_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: dense_dim_sparse_csr
  device_check: NoCheck
  device_guard: False
 
@@ -7123,7 +7123,7 @@
  variants: method
  dispatch:
  SparseCPU, SparseCUDA, SparseMeta: _nnz_sparse
- SparseCsrCPU, SparseCsrCUDA: _nnz_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: _nnz_sparse_csr
  device_check: NoCheck
  device_guard: False
 
@@ -7186,7 +7186,7 @@
  variants: method
  dispatch:
  SparseCPU, SparseCUDA, SparseMeta: values_sparse
- SparseCsrCPU, SparseCsrCUDA: values_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: values_sparse_csr
  NestedTensorCPU, NestedTensorCUDA: values_nested
  CompositeExplicitAutograd: values_default
  device_check: NoCheck
@@ -7195,31 +7195,31 @@
 - func: crow_indices(Tensor(a) self) -> Tensor(a)
  variants: method
  dispatch:
- SparseCsrCPU, SparseCsrCUDA: crow_indices_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: crow_indices_sparse_csr
  CompositeExplicitAutograd: crow_indices_default
  device_check: NoCheck
  device_guard: False
 
 - func: col_indices(Tensor(a) self) -> Tensor(a)
  variants: method
  dispatch:
- SparseCsrCPU, SparseCsrCUDA: col_indices_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: col_indices_sparse_csr
  CompositeExplicitAutograd: col_indices_default
  device_check: NoCheck
  device_guard: False
 
 - func: ccol_indices(Tensor(a) self) -> Tensor(a)
  variants: method
  dispatch:
- SparseCsrCPU, SparseCsrCUDA: ccol_indices_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: ccol_indices_sparse_csr
  CompositeExplicitAutograd: ccol_indices_default
  device_check: NoCheck
  device_guard: False
 
 - func: row_indices(Tensor(a) self) -> Tensor(a)
  variants: method
  dispatch:
- SparseCsrCPU, SparseCsrCUDA: row_indices_sparse_csr
+ SparseCsrCPU, SparseCsrCUDA, SparseCsrMeta: row_indices_sparse_csr
  CompositeExplicitAutograd: row_indices_default
  device_check: NoCheck
  device_guard: False
 
@@ -258,22 +258,24 @@ static void _validate_sparse_compressed_tensor_args_worker(const Tensor& compres
  compressed_indices_name, " and ", plain_indices_name, " dtype must be Int or Long, but got ",
  compressed_indices_type);
 
- // Indices invariants
- at::_validate_compressed_sparse_indices(
+ if (!values.is_meta()) {
+ // Indices invariants
+ at::_validate_compressed_sparse_indices(
  /*is_crow = */layout == kSparseCsr || layout == kSparseBsr,
  compressed_indices,
  plain_indices,
  compressed_dim_size,
  plain_dim_size,
  values_nnz);
+ }
 
  // Device Invariants
  // 4.1
  TORCH_CHECK(
- values.device().type() == kCPU || values.device().type() == kCUDA,
+ values.device().type() == kCPU || values.device().type() == kCUDA || values.device().type() == kMeta,
  "device type of values (",
  values.device().type(),
- ") must be CPU or CUDA");
+ ") must be CPU or CUDA or Meta");
  // 4.2, 4.3, 4.4
  TORCH_CHECK(
  compressed_indices.get_device() == values.get_device(),
@@ -333,14 +335,18 @@ static SparseCsrTensor new_compressed_tensor(const TensorOptions& options) {
  Layout layout = AT_DISPATCH_ALL_SPARSE_COMPRESSED_LAYOUTS(options.layout(), "new_compressed_tensor", [&] { return the_layout; });
  DispatchKey dispatch_key;
 
- TORCH_CHECK_NOT_IMPLEMENTED(
- options.device().type() == kCPU || options.device().type() == kCUDA,
- "Could not run 'new_compressed_tensor' from the '", options.device(), "' device.)");
-
- if (options.device().is_cuda()) {
- dispatch_key = DispatchKey::SparseCsrCUDA;
- } else {
+ switch(options.device().type()) {
+ case kCPU:
  dispatch_key = DispatchKey::SparseCsrCPU;
+ break;
+ case kCUDA:
+ dispatch_key = DispatchKey::SparseCsrCUDA;
+ break;
+ case kMeta:
+ dispatch_key = DispatchKey::SparseCsrMeta;
+ break;
+ default:
+ TORCH_CHECK_NOT_IMPLEMENTED(false, "Could not run 'new_compressed_tensor' from the '", options.device(), "' device.)");
  }
 
  return detail::make_tensor<SparseCsrTensorImpl>(DispatchKeySet(dispatch_key), options.device(), layout, options.dtype());
 
@@ -95,6 +95,8 @@ const char* toString(DispatchKey t) {
  return "SparseCsrCPU";
  case DispatchKey::SparseCsrCUDA:
  return "SparseCsrCUDA";
+ case DispatchKey::SparseCsrMeta:
+ return "SparseCsrMeta";
 
  case DispatchKey::NestedTensor:
  return "NestedTensor";
@@ -276,6 +278,7 @@ c10::DispatchKey parseDispatchKey(const std::string& k) {
  {"Sparse", c10::DispatchKey::Sparse},
  {"SparseCsrCPU", c10::DispatchKey::SparseCsrCPU},
  {"SparseCsrCUDA", c10::DispatchKey::SparseCsrCUDA},
+ {"SparseCsrMeta", c10::DispatchKey::SparseCsrMeta},
  {"BackendSelect", c10::DispatchKey::BackendSelect},
  {"Python", c10::DispatchKey::Python},
  {"PythonTLSSnapshot", c10::DispatchKey::PythonTLSSnapshot},
 
@@ -220,6 +220,7 @@ enum class DispatchKey : uint16_t {
  // TODO: Make SparseCsr a functionality key
  SparseCsrCPU,
  SparseCsrCUDA,
+ SparseCsrMeta,
 
  NestedTensor,
 
 
@@ -685,8 +685,10 @@ constexpr DispatchKeySet python_ks = DispatchKeySet({
 
 constexpr DispatchKeySet sparse_ks = DispatchKeySet(DispatchKey::Sparse);
 
-constexpr DispatchKeySet sparse_csr_ks =
- DispatchKeySet({DispatchKey::SparseCsrCPU, DispatchKey::SparseCsrCUDA});
+constexpr DispatchKeySet sparse_csr_ks = DispatchKeySet(
+ {DispatchKey::SparseCsrCPU,
+ DispatchKey::SparseCsrCUDA,
+ DispatchKey::SparseCsrMeta});
 
 constexpr DispatchKeySet mkldnn_ks = DispatchKeySet(DispatchKey::MkldnnCPU);
 
 
@@ -700,6 +700,8 @@ inline DispatchKey computeDispatchKey(
  return DispatchKey::SparseCsrCPU;
  case c10::DeviceType::CUDA:
  return DispatchKey::SparseCsrCUDA;
+ case c10::DeviceType::Meta:
+ return DispatchKey::SparseCsrMeta;
  default:
  AT_ERROR(
  "Unsupported device type for ",
@@ -720,6 +722,7 @@ inline Layout dispatchKeyToLayout(DispatchKey dispatch_key) {
  return Layout::Sparse;
  case DispatchKey::SparseCsrCPU:
  case DispatchKey::SparseCsrCUDA:
+ case DispatchKey::SparseCsrMeta:
  TORCH_CHECK(
  false,
  "Cannot map DispatchKey ",
 
@@ -4234,14 +4234,14 @@ def test_future_empty_dim(self, device, dtype, op):
 class TestSparseMeta(TestCase):
  exact_dtype = True
 
- def test_basic(self):
- r = torch.empty(4, 4, layout=torch.sparse_coo, device='meta')
+ def _test_basic_coo(self, dtype):
+ r = torch.empty(4, 4, dtype=dtype, layout=torch.sparse_coo, device='meta')
  self.assertTrue(r.is_meta)
  self.assertEqual(r.device.type, "meta")
  r2 = torch.empty_like(r)
  self.assertTrue(r2.is_meta)
  self.assertEqual(r, r2)
- r3 = torch.sparse_coo_tensor(size=(4, 4), device='meta')
+ r3 = torch.sparse_coo_tensor(size=(4, 4), dtype=dtype, device='meta')
  self.assertTrue(r3.is_meta)
  self.assertEqual(r, r3)
  r.sparse_resize_((4, 4), 1, 1)
@@ -4260,9 +4260,67 @@ def test_basic(self):
  # TODO: this sort of aliasing will need to be handled by
  # functionalization
  self.assertEqual(r._indices(), torch.empty(2, 0, device='meta', dtype=torch.int64))
- self.assertEqual(r._values(), torch.empty(0, 4, device='meta'))
+ self.assertEqual(r._values(), torch.empty(0, 4, dtype=dtype, device='meta'))
  self.assertEqual(r.indices(), torch.empty(2, 0, device='meta', dtype=torch.int64))
- self.assertEqual(r.values(), torch.empty(0, 4, device='meta'))
+ self.assertEqual(r.values(), torch.empty(0, 4, dtype=dtype, device='meta'))
+
+ def _test_basic_sparse_compressed(self, dtype, layout, batch_shape, dense_shape):
+ index_dtype = torch.int64
+ blocksize = (2, 3) if layout in {torch.sparse_bsr, torch.sparse_bsc} else ()
+ sparse_shape = (4, 6)
+ nnz = 0
+
+ shape = (*batch_shape, *sparse_shape, *dense_shape)
+ compressed_dim = 0 if layout in {torch.sparse_csr, torch.sparse_bsr} else 1
+ nof_compressed_indices = (sparse_shape[compressed_dim] // blocksize[compressed_dim] + 1 if blocksize
+ else sparse_shape[compressed_dim] + 1)
+ compressed_indices = torch.empty((*batch_shape, nof_compressed_indices), device='meta', dtype=index_dtype)
+ plain_indices = torch.empty((*batch_shape, nnz), device='meta', dtype=index_dtype)
+
+ values = torch.empty((*batch_shape, nnz, *blocksize, *dense_shape), device='meta', dtype=dtype)
+ r = torch.sparse_compressed_tensor(
+ compressed_indices,
+ plain_indices,
+ values,
+ shape,
+ layout=layout
+ )
+ self.assertTrue(r.is_meta)
+ self.assertEqual(r.device.type, "meta")
+
+ self.assertEqual(r.sparse_dim(), 2)
+ self.assertEqual(r.dense_dim(), len(dense_shape))
+ self.assertEqual(r._nnz(), nnz)
+ batch_dims = r.ndim - r.sparse_dim() - r.dense_dim()
+ r_blocksize = r.values().shape[batch_dims + 1: batch_dims + 1 + len(blocksize)]
+ self.assertEqual(r_blocksize, blocksize)
+
+ r_compressed_indices = r.crow_indices() if layout in {torch.sparse_csr, torch.sparse_bsr} else r.ccol_indices()
+ r_plain_indices = r.col_indices() if layout in {torch.sparse_csr, torch.sparse_bsr} else r.row_indices()
+
+ self.assertEqual(r_compressed_indices,
+ torch.empty((*batch_shape, nof_compressed_indices), device='meta', dtype=index_dtype))
+ self.assertEqual(r_plain_indices, torch.empty((*batch_shape, nnz), device='meta', dtype=index_dtype))
+ self.assertEqual(r.values(), torch.empty((*batch_shape, nnz, *blocksize, *dense_shape), device='meta', dtype=dtype))
+
+ r2 = torch.empty_like(r)
+ self.assertTrue(r2.is_meta)
+ self.assertEqual(r2, r)
+
+ if layout in {torch.sparse_csr, torch.sparse_csc}:
+ r3 = torch.empty((*batch_shape, *sparse_shape), dtype=dtype, layout=layout, device="meta")
+ self.assertTrue(r3.is_meta)
+ if not dense_shape:
+ self.assertEqual(r3, r)
+
+ @all_sparse_layouts('layout', include_strided=False)
+ @parametrize("dtype", [torch.float64])
+ def test_basic(self, dtype, layout):
+ if layout is torch.sparse_coo:
+ self._test_basic_coo(dtype)
+ else:
+ for batch_shape, dense_shape in itertools.product([(), (2,)], [(), (3,)]):
+ self._test_basic_sparse_compressed(dtype, layout, batch_shape, dense_shape)
 
 
 class _SparseDataset(torch.utils.data.Dataset):
@@ -5125,6 +5183,8 @@ def test_invalid_blocksize(self):
 
 instantiate_device_type_tests(TestSparseAny, globals(), except_for='meta')
 
+instantiate_parametrized_tests(TestSparseMeta)
+
 instantiate_parametrized_tests(TestSparseLegacyAndDeprecation)
 
 if __name__ == '__main__':
 
@@ -128,7 +128,7 @@ def __init__(self, tensor):
  with torch.no_grad():
  tensor_view = tensor.reshape(-1)
 
- if not self.floating_dtype:
+ if not self.floating_dtype or tensor.is_meta:
  for value in tensor_view:
  value_str = f"{value}"
  self.max_width = max(self.max_width, len(value_str))
@@ -476,7 +476,8 @@ def _str_intern(inp, *, tensor_contents=None):
  torch.sparse_bsc,
  }:
  suffixes.append("size=" + str(tuple(self.shape)))
- suffixes.append("nnz=" + str(self._nnz()))
+ if not self.is_meta:
+ suffixes.append("nnz=" + str(self._nnz()))
  if not has_default_dtype:
  suffixes.append("dtype=" + str(self.dtype))
  if not custom_contents_provided:
@@ -492,23 +493,34 @@ def _str_intern(inp, *, tensor_contents=None):
  cdimname, pdimname = "column", "row"
  compressed_indices_prefix = f"c{cdimname[:3]}_indices=tensor("
  compressed_indices = compressed_indices_method(self).detach()
- compressed_indices_str = _tensor_str(
- compressed_indices, indent + len(compressed_indices_prefix)
- )
+ if compressed_indices.is_meta:
+ compressed_indices_str = "..."
+ else:
+ compressed_indices_str = _tensor_str(
+ compressed_indices, indent + len(compressed_indices_prefix)
+ )
  if compressed_indices.numel() == 0:
  compressed_indices_str += ", size=" + str(
  tuple(compressed_indices.shape)
  )
+ if compressed_indices.is_meta:
+ compressed_indices_str += ", dtype=" + str(compressed_indices.dtype)
  plain_indices_prefix = f"{pdimname[:3]}_indices=tensor("
  plain_indices = plain_indices_method(self).detach()
- plain_indices_str = _tensor_str(
- plain_indices, indent + len(plain_indices_prefix)
- )
+ if plain_indices.is_meta:
+ plain_indices_str = "..."
+ else:
+ plain_indices_str = _tensor_str(
+ plain_indices, indent + len(plain_indices_prefix)
+ )
  if plain_indices.numel() == 0:
  plain_indices_str += ", size=" + str(tuple(plain_indices.shape))
  values_prefix = "values=tensor("
  values = self.values().detach()
- values_str = _tensor_str(values, indent + len(values_prefix))
+ if values.is_meta:
+ values_str = "..."
+ else:
+ values_str = _tensor_str(values, indent + len(values_prefix))
  if values.numel() == 0:
  values_str += ", size=" + str(tuple(values.shape))
  tensor_str = (