// ---------------------------------------------------------------------------- // - Open3D: www.open3d.org - // ---------------------------------------------------------------------------- // Copyright (c) 2018-2023 www.open3d.org // SPDX-License-Identifier: MIT // ---------------------------------------------------------------------------- // #include "open3d/core/nns/NanoFlannImpl.h" #include "open3d/core/nns/NeighborSearchCommon.h" #include "open3d/ml/pytorch/TorchHelper.h" #include "open3d/ml/pytorch/misc/NeighborSearchAllocator.h" #include "torch/script.h" using namespace open3d::core::nns; template void KnnSearchCPU(const torch::Tensor& points, const torch::Tensor& queries, const int64_t k, const torch::Tensor& points_row_splits, const torch::Tensor& queries_row_splits, const Metric metric, const bool ignore_query_point, const bool return_distances, torch::Tensor& neighbors_index, torch::Tensor& neighbors_row_splits, torch::Tensor& neighbors_distance) { const int batch_size = points_row_splits.size(0) - 1; // run radius search for each batch item std::vector> batch_output_allocators( batch_size, NeighborSearchAllocator( points.device().type(), points.device().index()) ); int64_t last_neighbors_count = 0; for (int i = 0; i < batch_size; ++i) { const T* const points_i = points.data_ptr() + 3 * points_row_splits.data_ptr()[i]; const T* const queries_i = queries.data_ptr() + 3 * queries_row_splits.data_ptr()[i]; size_t num_points_i = points_row_splits.data_ptr()[i + 1] - points_row_splits.data_ptr()[i]; size_t num_queries_i = queries_row_splits.data_ptr()[i + 1] - queries_row_splits.data_ptr()[i]; int64_t* neighbors_row_splits_i = (int64_t*)(neighbors_row_splits.data_ptr() + queries_row_splits.data_ptr()[i]); std::unique_ptr holder = impl::BuildKdTree(num_points_i, points_i, 3, metric); impl::KnnSearchCPU( holder.get(), neighbors_row_splits_i, num_points_i, points_i, num_queries_i, queries_i, 3, k, metric, ignore_query_point, return_distances, batch_output_allocators[i]); if (i > 0) { for (size_t j = 0; j <= num_queries_i; ++j) neighbors_row_splits_i[j] += last_neighbors_count; } last_neighbors_count = neighbors_row_splits_i[num_queries_i]; } if (batch_size == 1) { // no need to combine just return the results from the first batch item neighbors_index = batch_output_allocators[0].NeighborsIndex(); neighbors_distance = batch_output_allocators[0].NeighborsDistance(); return; } NeighborSearchAllocator output_allocator( points.device().type(), points.device().index()); // combine results int64_t neighbors_index_size = 0; int64_t neighbors_distance_size = 0; for (const auto& a : batch_output_allocators) { neighbors_index_size += a.NeighborsIndex().size(0); neighbors_distance_size += a.NeighborsDistance().size(0); } TIndex* neighbors_index_data_ptr; T* neighbors_distance_data_ptr; output_allocator.AllocIndices(&neighbors_index_data_ptr, neighbors_index_size); output_allocator.AllocDistances(&neighbors_distance_data_ptr, neighbors_distance_size); for (int i = 0; i < batch_size; ++i) { auto& a = batch_output_allocators[i]; if (a.NeighborsIndex().size(0)) { for (int64_t j = 0; j < a.NeighborsIndex().size(0); ++j) { neighbors_index_data_ptr[0] = a.IndicesPtr()[j] + points_row_splits.data_ptr()[i]; ++neighbors_index_data_ptr; } } if (a.NeighborsDistance().size(0)) { memcpy(neighbors_distance_data_ptr, a.DistancesPtr(), a.NeighborsDistance().size(0) * sizeof(T)); neighbors_distance_data_ptr += a.NeighborsDistance().size(0); } } neighbors_index = output_allocator.NeighborsIndex(); neighbors_distance = output_allocator.NeighborsDistance(); } #define INSTANTIATE(T, TIndex) \ template void KnnSearchCPU( \ const torch::Tensor& points, const torch::Tensor& queries, \ const int64_t k, const torch::Tensor& points_row_splits, \ const torch::Tensor& queries_row_splits, const Metric metric, \ const bool ignore_query_point, const bool return_distances, \ torch::Tensor& neighbors_index, \ torch::Tensor& neighbors_row_splits, \ torch::Tensor& neighbors_distance); INSTANTIATE(float, int32_t) INSTANTIATE(float, int64_t) INSTANTIATE(double, int32_t) INSTANTIATE(double, int64_t)