chore: remove unused code

XuehaiPan · XuehaiPan · commit e9a260a4bed8 · 2022-11-02T17:28:06.000+08:00
diff --git a/src/adam_op/adam_op_impl_cpu.cpp b/src/adam_op/adam_op_impl_cpu.cpp
@@ -27,34 +27,6 @@ using std::size_t;
 
 namespace adam_op {
 
-template <typename scalar_t, typename other_t>
-void adamForwardInplaceCPUKernel(const other_t b1,
-                                 const other_t inv_one_minus_pow_b1,
-                                 const other_t b2,
-                                 const other_t inv_one_minus_pow_b2,
-                                 const other_t eps,
-                                 const other_t eps_root,
-                                 const size_t n,
-                                 scalar_t *__restrict__ updates_ptr,
-                                 scalar_t *__restrict__ mu_ptr,
-                                 scalar_t *__restrict__ nu_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t updates = updates_ptr[tid];
-    const scalar_t mu = mu_ptr[tid];
-    const scalar_t nu = nu_ptr[tid];
-
-    const scalar_t mu_out = b1 * mu + (1 - b1) * updates;
-    const scalar_t nu_out = b2 * nu + (1 - b2) * updates * updates;
-    const scalar_t updates_out =
-        mu_out * inv_one_minus_pow_b1 / (sqrt(nu_out * inv_one_minus_pow_b2 + eps_root) + eps);
-
-    mu_ptr[tid] = mu_out;
-    nu_ptr[tid] = nu_out;
-    updates_ptr[tid] = updates_out;
-  }
-}
-
 TensorArray<3> adamForwardInplaceCPU(const torch::Tensor &updates,
                                      const torch::Tensor &mu,
                                      const torch::Tensor &nu,
@@ -82,21 +54,6 @@ TensorArray<3> adamForwardInplaceCPU(const torch::Tensor &updates,
   return TensorArray<3>{updates, mu, nu};
 }
 
-template <typename scalar_t, typename other_t>
-void adamForwardMuCPUKernel(const scalar_t *__restrict__ updates_ptr,
-                            const scalar_t *__restrict__ mu_ptr,
-                            const other_t b1,
-                            const size_t n,
-                            scalar_t *__restrict__ mu_out_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t updates = updates_ptr[tid];
-    const scalar_t mu = mu_ptr[tid];
-    const scalar_t mu_out = b1 * mu + (1 - b1) * updates;
-    mu_out_ptr[tid] = mu_out;
-  }
-}
-
 torch::Tensor adamForwardMuCPU(const torch::Tensor &updates,
                                const torch::Tensor &mu,
                                const pyfloat_t b1) {
@@ -108,22 +65,6 @@ torch::Tensor adamForwardMuCPU(const torch::Tensor &updates,
   return mu_out;
 }
 
-template <typename scalar_t, typename other_t>
-void adamForwardNuCPUKernel(const scalar_t *__restrict__ updates_ptr,
-                            const scalar_t *__restrict__ nu_ptr,
-                            const other_t b2,
-                            const size_t n,
-                            scalar_t *__restrict__ nu_out_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t updates = updates_ptr[tid];
-    const scalar_t nu = nu_ptr[tid];
-
-    const scalar_t nu_out = b2 * nu + (1 - b2) * pow(updates, 2);
-    nu_out_ptr[tid] = nu_out;
-  }
-}
-
 torch::Tensor adamForwardNuCPU(const torch::Tensor &updates,
                                const torch::Tensor &nu,
                                const pyfloat_t b2) {
@@ -136,25 +77,6 @@ torch::Tensor adamForwardNuCPU(const torch::Tensor &updates,
   return nu_out;
 }
 
-template <typename scalar_t, typename other_t>
-void adamForwardUpdatesCPUKernel(const scalar_t *__restrict__ new_mu_ptr,
-                                 const scalar_t *__restrict__ new_nu_ptr,
-                                 const other_t inv_one_minus_pow_b1,
-                                 const other_t inv_one_minus_pow_b2,
-                                 const other_t eps,
-                                 const other_t eps_root,
-                                 const size_t n,
-                                 scalar_t *__restrict__ updates_out_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t new_mu = new_mu_ptr[tid];
-    const scalar_t new_nu = new_nu_ptr[tid];
-    const scalar_t mu_hat = new_mu * inv_one_minus_pow_b1;
-    const scalar_t nu_hat = new_nu * inv_one_minus_pow_b2;
-    updates_out_ptr[tid] = mu_hat / (sqrt(nu_hat + eps_root) + eps);
-  }
-}
-
 torch::Tensor adamForwardUpdatesCPU(const torch::Tensor &new_mu,
                                     const torch::Tensor &new_nu,
                                     const pyfloat_t b1,
@@ -181,21 +103,6 @@ torch::Tensor adamForwardUpdatesCPU(const torch::Tensor &new_mu,
   return updates_out;
 }
 
-template <typename scalar_t, typename other_t>
-void adamBackwardMuCPUKernel(const scalar_t *__restrict__ dmu_ptr,
-                             const other_t b1,
-                             const size_t n,
-                             scalar_t *__restrict__ dupdates_out_ptr,
-                             scalar_t *__restrict__ dmu_out_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t dmu = dmu_ptr[tid];
-
-    dupdates_out_ptr[tid] = (1 - b1) * dmu;
-    dmu_out_ptr[tid] = b1 * dmu;
-  }
-}
-
 TensorArray<2> adamBackwardMuCPU(const torch::Tensor &dmu,
                                  const torch::Tensor &updates,
                                  const torch::Tensor &mu,
@@ -210,23 +117,6 @@ TensorArray<2> adamBackwardMuCPU(const torch::Tensor &dmu,
   return TensorArray<2>{std::move(dupdates_out), std::move(dmu_out)};
 }
 
-template <typename scalar_t, typename other_t>
-void adamBackwardNuCPUKernel(const scalar_t *__restrict__ dnu_ptr,
-                             const scalar_t *__restrict__ updates_ptr,
-                             const other_t b2,
-                             const size_t n,
-                             scalar_t *__restrict__ dupdates_out_ptr,
-                             scalar_t *__restrict__ dnu_out_ptr) {
-#pragma omp parallel for num_threads(omp_get_num_procs())
-  for (size_t tid = 0; tid < n; ++tid) {
-    const scalar_t dnu = dnu_ptr[tid];
-    const scalar_t updates = updates_ptr[tid];
-
-    dupdates_out_ptr[tid] = 2 * (1 - b2) * updates * dnu;
-    dnu_out_ptr[tid] = b2 * dnu;
-  }
-}
-
 TensorArray<2> adamBackwardNuCPU(const torch::Tensor &dnu,
                                  const torch::Tensor &updates,
                                  const torch::Tensor &nu,