DD-AVX_v3/scale_8cpp_source.html

 #include<DD-AVX_internal.hpp>

 using namespace ddavx_core;


 namespace dd_avx{

     void scale(const dd_real& alpha, dd_real_vector& x){

         registers regs;


 #pragma omp parallel private(regs)

         {

             int i=0, is=0, ie=0;

             get_isie(x.size(), is, ie);

             reg alpha_hi = broadcast(alpha.x[0]);

             reg alpha_lo = broadcast(alpha.x[1]);

             for(i = is; i < (ie-SIMD_Length+1); i += SIMD_Length){


                 reg x_hi = load(x.hi[i]);

                 reg x_lo = load(x.lo[i]);


                 Mul(x_hi, x_lo, alpha_hi, alpha_lo, x_hi, x_lo, regs);


                 store(x.hi[i], x_hi);

                 store(x.lo[i], x_lo);

             }

             for(;i<ie;i++){

                 Mul(x.hi[i], x.lo[i], alpha.x[0], alpha.x[1], x.hi[i], x.lo[i]);

             }

         }

     }


     void scale(const d_real& alpha, dd_real_vector& x){

         registers regs;


 #pragma omp parallel private(regs)

         {

             int i=0, is=0, ie=0;

             get_isie(x.size(), is, ie);

             reg alpha_hi = broadcast(alpha);

             reg alpha_lo = regs.zeros;

             for(i = is; i < (ie-SIMD_Length+1); i += SIMD_Length){


                 reg x_hi = load(x.hi[i]);

                 reg x_lo = load(x.lo[i]);


                 Mul(x_hi, x_lo, alpha_hi, alpha_lo, x_hi, x_lo, regs);


                 store(x.hi[i], x_hi);

                 store(x.lo[i], x_lo);

             }

             for(;i<ie;i++){

                 Mul(x.hi[i], x.lo[i], alpha, 0.0, x.hi[i], x.lo[i]);

             }

         }

     }


     void scale(const dd_real& alpha, d_real_vector& x){

         registers regs;


 #pragma omp parallel private(regs)

         {

             int i=0, is=0, ie=0;

             get_isie(x.size(), is, ie);

             reg alpha_hi = broadcast(alpha.x[0]);

             reg alpha_lo = broadcast(alpha.x[1]);

             for(i = is; i < (ie-SIMD_Length+1); i += SIMD_Length){


                 reg x_hi = load(x.data()[i]);

                 reg x_lo = regs.zeros;


                 Mul(x_hi, x_lo, alpha_hi, alpha_lo, x_hi, x_lo, regs);


                 store(x.data()[i], x_hi);

             }

             for(;i<ie;i++){

                 Mul(x.data()[i],  alpha.x[0], alpha.x[1], x.data()[i], 0.0);

             }

         }

     }


     void scale(const d_real& alpha, d_real_vector& x){

         registers regs;


 #pragma omp parallel private(regs)

         {

             int i=0, is=0, ie=0;

             get_isie(x.size(), is, ie);

             reg alpha_hi = broadcast(alpha);

             reg alpha_lo = regs.zeros;

             for(i = is; i < (ie-SIMD_Length+1); i += SIMD_Length){


                 reg x_hi = load(x.data()[i]);

                 reg x_lo = regs.zeros;


                 Mul(x_hi, x_lo, alpha_hi, alpha_lo, x_hi, x_lo, regs);


                 store(x.data()[i], x_hi);

             }

             for(;i<ie;i++){

                 Mul(x.data()[i],  alpha, 0.0, x.data()[i], 0.0);

             }

         }

     }

 }

d_real
double d_real
Definition: DD-AVX.hpp:22

d_real_vector
Double precision vector class, This class is almost same as std::vector<double>
Definition: DD-AVX_d_vector.hpp:9

dd_real_vector
Double-double precision vector class.
Definition: DD-AVX_dd_vector.hpp:66

dd_real_vector::lo
std::vector< double > lo
Definition: DD-AVX_dd_vector.hpp:73

dd_real_vector::size
int size() const
get size
Definition: DD-AVX_dd_vector.hpp:113

dd_real_vector::hi
std::vector< double > hi
Definition: DD-AVX_dd_vector.hpp:72

dd_avx
Definition: DD-AVX.hpp:31

dd_avx::scale
void scale(const dd_real &alpha, dd_real_vector &x)
scale: x = ax
Definition: scale.cpp:5