amrex/doxygen/AMReX__NeighborParticlesCPUImpl_8H_source.html

 #ifndef AMREX_NEIGHBORPARTICLESCPUIMPL_H_

 #define AMREX_NEIGHBORPARTICLESCPUIMPL_H_

 #include <AMReX_Config.H>


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>

 ::fillNeighborsCPU () {

     BL_PROFILE("NeighborParticleContainer::fillNeighborsCPU");

     if (!areMasksValid()) {

         BuildMasks();

         GetNeighborCommTags();

     }

     cacheNeighborInfo();

     updateNeighborsCPU(false);

 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>

 ::sumNeighborsCPU (int real_start_comp, int real_num_comp,

                    int int_start_comp,  int int_num_comp)

 {

     BL_PROFILE("NeighborParticleContainer::sumNeighborsCPU");


     if ( ! enableInverse() )

     {

         amrex::Abort("Need to enable inverse to true to use sumNeighbors. \n");

     }


     const int MyProc = ParallelContext::MyProcSub();


     std::map<int, Vector<char> > isend_data;


     for (int lev = 0; lev < this->numLevels(); ++lev)

     {

         for (MyParIter pti(*this, lev); pti.isValid(); ++pti)

         {

             PairIndex src_index(pti.index(), pti.LocalTileIndex());

             const auto& tags = inverse_tags[lev][src_index];

             const auto& neighbs = neighbors[lev][src_index].GetArrayOfStructs();

             AMREX_ASSERT(tags.size() == neighbs.size());


             const int num_neighbs = neighbs.size();

             for (int i = 0; i < num_neighbs; ++i)

             {

                 const auto& neighb = neighbs[i];

                 const auto& tag = tags[i];

                 const int dst_grid = tag.src_grid;

                 const int global_rank = this->ParticleDistributionMap(lev)[dst_grid];

                 const int dst_proc = ParallelContext::global_to_local_rank(global_rank);

                 const int dst_tile = tag.src_tile;

                 const int dst_index = tag.src_index;

                 const int dst_level = tag.src_level;


                 if (dst_proc == MyProc)

                 {

                     auto pair = std::make_pair(dst_grid, dst_tile);

                     auto& dst_ptile = this->GetParticles(dst_level)[pair];

                     auto& dst_parts = dst_ptile.GetArrayOfStructs();

                     auto& p = dst_parts[dst_index];


                     for (int comp = real_start_comp; comp < real_start_comp + real_num_comp; ++comp)

                     {

                         p.rdata(comp) += neighb.rdata(comp);

                     }


                     for (int comp = int_start_comp; comp < int_start_comp + int_num_comp; ++comp)

                     {

                         p.idata(comp) += neighb.idata(comp);

                     }

                 }


                 else

                 {

                     auto& sdata = isend_data[dst_proc];

                     auto old_size = sdata.size();

                     auto new_size = old_size + real_num_comp*sizeof(Real) + int_num_comp*sizeof(int) + 4*sizeof(int);

                     sdata.resize(new_size);

                     char* dst = &sdata[old_size];

                     std::memcpy(dst, &dst_grid, sizeof(int)); dst += sizeof(int);

                     std::memcpy(dst, &dst_tile, sizeof(int)); dst += sizeof(int);

                     std::memcpy(dst, &dst_index, sizeof(int)); dst += sizeof(int);

                     std::memcpy(dst, &dst_level, sizeof(int)); dst += sizeof(int);

                     for (int comp = real_start_comp; comp < real_start_comp + real_num_comp; ++comp)

                     {

                         Real data = neighb.rdata(comp);

                         std::memcpy(dst, &data, sizeof(Real));

                         dst += sizeof(Real);

                     }

                     for (int comp = int_start_comp; comp < int_start_comp + int_num_comp; ++comp)

                     {

                         int data = neighb.idata(comp);

                         std::memcpy(dst, &data, sizeof(int));

                         dst += sizeof(int);

                     }

                 }

             }

         }

     }


     sumNeighborsMPI(isend_data, real_start_comp, real_num_comp, int_start_comp, int_num_comp);

 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>::

 sumNeighborsMPI (std::map<int, Vector<char> >& not_ours,

                  int real_start_comp, int real_num_comp,

                  int int_start_comp, int int_num_comp)

 {

     BL_PROFILE("NeighborParticleContainer::sumNeighborsMPI");


 #ifdef AMREX_USE_MPI

     const int NProcs = ParallelContext::NProcsSub();


     Vector<Long> isnds(NProcs, 0);

     Vector<Long> ircvs(NProcs, 0);

     for (int i = 0; i < NProcs; ++i) {

         ircvs[i] = 0;

     }


     {

         // each proc figures out how many bytes it will send, and how

         // many it will receive


         Long num_isnds = 0;

         for (const auto& kv : not_ours)

         {

             num_isnds      += kv.second.size();

             isnds[kv.first] = kv.second.size();

         }


         ParallelAllReduce::Max(num_isnds, ParallelContext::CommunicatorSub());


         if (num_isnds == 0) { return; }


         const int num_ircvs = neighbor_procs.size();

         Vector<MPI_Status>  stats(num_ircvs);

         Vector<MPI_Request> rreqs(num_ircvs);


         const int SeqNum = ParallelDescriptor::SeqNum();


         // Post receives

         for (int i = 0; i < num_ircvs; ++i)

         {

             const int Who = neighbor_procs[i];

             const Long Cnt = 1;


             AMREX_ASSERT(Who >= 0 && Who < NProcs);


             rreqs[i] = ParallelDescriptor::Arecv(&ircvs[Who], Cnt, Who, SeqNum,

                                                  ParallelContext::CommunicatorSub()).req();

         }


         // Send.

         for (int i = 0; i < num_ircvs; ++i) {

         const int Who = neighbor_procs[i];

         const Long Cnt = 1;


         AMREX_ASSERT(Who >= 0 && Who < NProcs);


         ParallelDescriptor::Send(&isnds[Who], Cnt, Who, SeqNum,

                                  ParallelContext::CommunicatorSub());

         }


         if (num_ircvs > 0) { ParallelDescriptor::Waitall(rreqs, stats); }

     }


     Vector<int> RcvProc;

     Vector<std::size_t> rOffset; // Offset (in bytes) in the receive buffer

     std::size_t TotRcvBytes = 0;

     for (int i = 0; i < NProcs; ++i) {

         if (ircvs[i] > 0) {

             RcvProc.push_back(i);

             rOffset.push_back(TotRcvBytes);

             TotRcvBytes += ircvs[i];

         }

     }


     const auto nrcvs = int(RcvProc.size());

     Vector<MPI_Status>  stats(nrcvs);

     Vector<MPI_Request> rreqs(nrcvs);


     const int SeqNum = ParallelDescriptor::SeqNum();


     // Allocate data for rcvs as one big chunk.

     Vector<char> recvdata(TotRcvBytes);


     // Post receives.

     for (int i = 0; i < nrcvs; ++i) {

         const auto Who    = RcvProc[i];

         const auto offset = rOffset[i];

         const auto Cnt    = ircvs[Who];


         AMREX_ASSERT(Cnt > 0);

         AMREX_ASSERT(Cnt < std::numeric_limits<int>::max());

         AMREX_ASSERT(Who >= 0 && Who < NProcs);


         rreqs[i] = ParallelDescriptor::Arecv(&recvdata[offset], Cnt, Who, SeqNum,

                                              ParallelContext::CommunicatorSub()).req();

     }


     // Send.

     for (const auto& kv : not_ours) {

         const auto Who = kv.first;

         const auto Cnt = kv.second.size();


         AMREX_ASSERT(Cnt > 0);

         AMREX_ASSERT(Who >= 0 && Who < NProcs);

         AMREX_ASSERT(Cnt < std::numeric_limits<int>::max());


         ParallelDescriptor::Send(kv.second.data(), Cnt, Who, SeqNum,

                                  ParallelContext::CommunicatorSub());

     }


     // unpack the received data and put them into the proper neighbor buffers

     if (nrcvs > 0)

     {

         ParallelDescriptor::Waitall(rreqs, stats);


         const size_t data_size = real_num_comp*sizeof(Real) + int_num_comp*sizeof(int) + 4 * sizeof(int);


         if (recvdata.size() % data_size != 0) {

             amrex::Print() << recvdata.size() << " " << data_size << "\n";

             if (this->m_verbose) {

                 amrex::AllPrint() << "NeighborParticles::sumNeighbors: sizes = "

                                   << recvdata.size() << ", " << data_size << "\n";

             }

             amrex::Abort("NeighborParticles::sumNeighbors: How did this happen?");

         }


         auto npart = int(recvdata.size() / data_size);


         char* buffer = recvdata.data();

         for (int j = 0; j < npart; ++j)

         {

             int grid, tile, index, lev;

             std::memcpy(&grid,  buffer, sizeof(int)); buffer += sizeof(int);

             std::memcpy(&tile,  buffer, sizeof(int)); buffer += sizeof(int);

             std::memcpy(&index,  buffer, sizeof(int)); buffer += sizeof(int);

             std::memcpy(&lev, buffer, sizeof(int)); buffer += sizeof(int);


             auto pair = std::make_pair(grid, tile);

             auto& ptile = this->GetParticles(lev)[pair];

             auto& parts = ptile.GetArrayOfStructs();

             auto& p = parts[index];


             for (int comp = real_start_comp; comp < real_start_comp + real_num_comp; ++comp)

             {

                 Real data;

                 std::memcpy(&data, buffer, sizeof(Real));

                 p.rdata(comp) += data;

                 buffer += sizeof(Real);

             }


             for (int comp = int_start_comp; comp < int_start_comp + int_num_comp; ++comp)

             {

                 int data;

                 std::memcpy(&data, buffer, sizeof(int));

                 p.idata(comp) += data;

                 buffer += sizeof(int);

             }

         }

     }

 #else

     amrex::ignore_unused(not_ours, real_start_comp, real_num_comp, int_start_comp, int_num_comp);

 #endif

 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>

 ::updateNeighborsCPU (bool reuse_rcv_counts) {


     BL_PROFILE_VAR("NeighborParticleContainer::updateNeighborsCPU", update);


     const int MyProc = ParallelContext::MyProcSub();


     for (int lev = 0; lev < this->numLevels(); ++lev) {

         const Periodicity& periodicity = this->Geom(lev).periodicity();

         const RealBox& prob_domain = this->Geom(lev).ProbDomain();


         int num_threads = OpenMP::get_max_threads();


         for (MyParIter pti(*this, lev); pti.isValid(); ++pti) {

             PairIndex src_index(pti.index(), pti.LocalTileIndex());

             auto src = pti.GetParticleTile().getParticleTileData();

             for (int j = 0; j < num_threads; ++j) {

                 auto& tags = buffer_tag_cache[lev][src_index][j];

                 int num_tags = tags.size();

 #ifdef AMREX_USE_OMP

 #pragma omp parallel for

 #endif

                 for (int i = 0; i < num_tags; ++i) {

                     const NeighborCopyTag& tag = tags[i];

                     const int global_who = this->ParticleDistributionMap(tag.level)[tag.grid];

                     const int who = ParallelContext::global_to_local_rank(global_who);

                     if (who == MyProc) {

                         PairIndex dst_index(tag.grid, tag.tile);

                         auto dst = neighbors[tag.level][dst_index].getParticleTileData();

                         copyParticle(dst, src, tag.src_index, tag.dst_index);

                         if (periodicity.isAnyPeriodic()) {

                             auto& aos = neighbors[tag.level][dst_index].GetArrayOfStructs();

                             ParticleType& p = aos[tag.dst_index];

                             for (int dir = 0; dir < AMREX_SPACEDIM; ++dir) {

                                 if (! periodicity.isPeriodic(dir)) { continue; }

                                 if (tag.periodic_shift[dir] < 0) {

                                     p.pos(dir) += static_cast<ParticleReal> (prob_domain.length(dir));

                                 } else if (tag.periodic_shift[dir] > 0) {

                                     p.pos(dir) -= static_cast<ParticleReal> (prob_domain.length(dir));

                                 }

                             }

                         }


                         if ( enableInverse() )

                         {

                             auto& itags = inverse_tags[tag.level][dst_index];

                             AMREX_ASSERT(tag.dst_index < itags.size());

                             itags[tag.dst_index].src_grid = src_index.first;

                             itags[tag.dst_index].src_tile = src_index.second;

                             itags[tag.dst_index].src_index = tag.src_index;

                             itags[tag.dst_index].src_level = lev;

                         }

                     } else {

                         auto& aos = pti.GetArrayOfStructs();

                         auto& soa = pti.GetStructOfArrays();

                         ParticleType p = aos[tag.src_index];  // copy

                         if (periodicity.isAnyPeriodic()) {

                             for (int dir = 0; dir < AMREX_SPACEDIM; ++dir) {

                                 if (! periodicity.isPeriodic(dir)) { continue; }

                                 if (tag.periodic_shift[dir] < 0) {

                                     p.pos(dir) += static_cast<ParticleReal> (prob_domain.length(dir));

                                 } else if (tag.periodic_shift[dir] > 0) {

                                     p.pos(dir) -= static_cast<ParticleReal> (prob_domain.length(dir));

                                 }

                             }

                         }


                         char* dst_ptr = &send_data[who][tag.dst_index];

                         char* src_ptr = (char *) &p;

                         for (int ii = 0; ii < AMREX_SPACEDIM + NStructReal; ++ii) {

                             if (ghost_real_comp[ii]) {

                                 std::memcpy(dst_ptr, src_ptr, sizeof(typename ParticleType::RealType));

                                 dst_ptr += sizeof(typename ParticleType::RealType);

                             }

                             src_ptr += sizeof(typename ParticleType::RealType);

                         }

                         for (int ii = 0; ii < this->NumRealComps(); ++ii) {

                             if (ghost_real_comp[ii+AMREX_SPACEDIM+NStructReal])

                             {

                                 std::memcpy(dst_ptr, &(soa.GetRealData(ii)[tag.src_index]),

                                             sizeof(typename ParticleType::RealType));

                                 dst_ptr += sizeof(typename ParticleType::RealType);

                             }

                         }

                         for (int ii = 0; ii < 2 + NStructInt; ++ii) {

                             if (ghost_int_comp[ii]) {

                                 std::memcpy(dst_ptr, src_ptr, sizeof(int));

                                 dst_ptr += sizeof(int);

                             }

                             src_ptr += sizeof(int);

                         }

                         for (int ii = 0; ii < this->NumIntComps(); ++ii) {

                             if (ghost_int_comp[ii+2+NStructInt])

                             {

                                 std::memcpy(dst_ptr, &(soa.GetIntData(ii)[tag.src_index]),

                                             sizeof(int));

                                 dst_ptr += sizeof(int);

                             }

                         }

                         if ( enableInverse() )

                         {

                             std::memcpy(dst_ptr,&(src_index.first),sizeof(int)); dst_ptr += sizeof(int);

                             std::memcpy(dst_ptr,&(src_index.second),sizeof(int)); dst_ptr += sizeof(int);

                             std::memcpy(dst_ptr,&(tag.src_index),sizeof(int)); dst_ptr += sizeof(int);

                             std::memcpy(dst_ptr,&(lev),sizeof(int)); dst_ptr += sizeof(int);

                         }

                     }

                 }

             }

         }


 #ifdef AMREX_USE_OMP

 #pragma omp parallel

 #endif

         for (MFIter mfi = this->MakeMFIter(lev); mfi.isValid(); ++mfi) {

             const int grid = mfi.index();

             const int tile = mfi.LocalTileIndex();

             PairIndex dst_index(grid, tile);

             neighbors[lev][dst_index].resize(local_neighbor_sizes[lev][dst_index]);

             if ( enableInverse() ) {

                inverse_tags[lev][dst_index].resize(local_neighbor_sizes[lev][dst_index]);

             }

         }

     }

     BL_PROFILE_VAR_STOP(update);


     fillNeighborsMPI(reuse_rcv_counts);


     for (int lev = 0; lev < this->numLevels(); ++lev)

     {

         for(MFIter mfi = this->MakeMFIter(lev); mfi.isValid(); ++mfi)

         {

             int src_grid = mfi.index();

             int src_tile = mfi.LocalTileIndex();

             auto index = std::make_pair(src_grid, src_tile);

             auto& ptile = this->GetParticles(lev)[index];

             ptile.setNumNeighbors(neighbors[lev][index].size());

             amrex::copyParticles(ptile, neighbors[lev][index], 0,

                                  ptile.numRealParticles(), ptile.numNeighborParticles());

         }

     }


 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>

 ::clearNeighborsCPU ()

 {

     BL_PROFILE("NeighborParticleContainer::clearNeighborsCPU");


     resizeContainers(this->numLevels());

     for (int lev = 0; lev < this->numLevels(); ++lev) {

         neighbors[lev].clear();

         if ( enableInverse() ) { inverse_tags[lev].clear(); }

         buffer_tag_cache[lev].clear();


         for(MFIter mfi = this->MakeMFIter(lev); mfi.isValid(); ++mfi)

         {

             int src_grid = mfi.index();

             int src_tile = mfi.LocalTileIndex();

             auto index = std::make_pair(src_grid, src_tile);

             auto& ptile = this->GetParticles(lev)[index];

             ptile.setNumNeighbors(0);

         }

     }


     send_data.clear();

 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>::

 getRcvCountsMPI () {


     BL_PROFILE("NeighborParticleContainer::getRcvCountsMPI");


 #ifdef AMREX_USE_MPI

     const int NProcs = ParallelContext::NProcsSub();


     // each proc figures out how many bytes it will send, and how

     // many it will receive

     Vector<Long> snds(NProcs, 0);

     rcvs.resize(NProcs);

     for (int i = 0; i < NProcs; ++i) {

         rcvs[i] = 0;

     }


     num_snds = 0;

     for (const auto& kv : send_data) {

         num_snds      += kv.second.size();

         snds[kv.first] = kv.second.size();

     }


     ParallelAllReduce::Max(num_snds, ParallelContext::CommunicatorSub());


     if (num_snds == 0) { return; }


     const int num_rcvs = neighbor_procs.size();

     Vector<MPI_Status>  stats(num_rcvs);

     Vector<MPI_Request> rreqs(num_rcvs);


     const int SeqNum = ParallelDescriptor::SeqNum();


     // Post receives

     for (int i = 0; i < num_rcvs; ++i) {

         const int Who = neighbor_procs[i];

         const Long Cnt = 1;


         AMREX_ASSERT(Who >= 0 && Who < NProcs);


         rreqs[i] = ParallelDescriptor::Arecv(&rcvs[Who], Cnt, Who, SeqNum,

                                              ParallelContext::CommunicatorSub()).req();

     }


     // Send.

     for (int i = 0; i < num_rcvs; ++i) {

         const int Who = neighbor_procs[i];

         const Long Cnt = 1;


         AMREX_ASSERT(Who >= 0 && Who < NProcs);


         ParallelDescriptor::Send(&snds[Who], Cnt, Who, SeqNum,

                                  ParallelContext::CommunicatorSub());

     }


     if (num_rcvs > 0) { ParallelDescriptor::Waitall(rreqs, stats); }


 #endif // AMREX_USE_MPI

 }


 template <int NStructReal, int NStructInt, int NArrayReal, int NArrayInt>

 void

 NeighborParticleContainer<NStructReal, NStructInt, NArrayReal, NArrayInt>::

 fillNeighborsMPI (bool reuse_rcv_counts) {


     BL_PROFILE("NeighborParticleContainer::fillNeighborsMPI");


 #ifdef AMREX_USE_MPI

     const int NProcs = ParallelContext::NProcsSub();


     // each proc figures out how many bytes it will send, and how

     // many it will receive

     if (!reuse_rcv_counts) { getRcvCountsMPI(); }

     if (num_snds == 0) { return; }


     Vector<int> RcvProc;

     Vector<std::size_t> rOffset; // Offset (in bytes) in the receive buffer

     std::size_t TotRcvBytes = 0;

     for (int i = 0; i < NProcs; ++i) {

         if (rcvs[i] > 0) {

             RcvProc.push_back(i);

             rOffset.push_back(TotRcvBytes);

             TotRcvBytes += rcvs[i];

         }

     }


     const auto nrcvs = int(RcvProc.size());

     Vector<MPI_Status>  stats(nrcvs);

     Vector<MPI_Request> rreqs(nrcvs);


     const int SeqNum = ParallelDescriptor::SeqNum();


     // Allocate data for rcvs as one big chunk.

     Vector<char> recvdata(TotRcvBytes);


     // Post receives.

     for (int i = 0; i < nrcvs; ++i) {

         const auto Who    = RcvProc[i];

         const auto offset = rOffset[i];

         const auto Cnt    = rcvs[Who];


         AMREX_ASSERT(Cnt > 0);

         AMREX_ASSERT(Cnt < std::numeric_limits<int>::max());

         AMREX_ASSERT(Who >= 0 && Who < NProcs);


         rreqs[i] = ParallelDescriptor::Arecv(&recvdata[offset], Cnt, Who, SeqNum,

                                              ParallelContext::CommunicatorSub()).req();

     }


     // Send.

     for (const auto& kv : send_data) {

         const auto Who = kv.first;

         const auto Cnt = kv.second.size();


         AMREX_ASSERT(Cnt > 0);

         AMREX_ASSERT(Who >= 0 && Who < NProcs);

         AMREX_ASSERT(Cnt < std::numeric_limits<int>::max());


         ParallelDescriptor::Send(kv.second.data(), Cnt, Who, SeqNum);

     }


     // unpack the received data and put them into the proper neighbor buffers

     if (nrcvs > 0) {

         ParallelDescriptor::Waitall(rreqs, stats);

         for (int i = 0; i < nrcvs; ++i) {

             const auto offset = int(rOffset[i]);

             char* buffer = &recvdata[offset];

             int num_tiles, lev, gid, tid, size, np;

             std::memcpy(&num_tiles, buffer, sizeof(int)); buffer += sizeof(int);

             for (int j = 0; j < num_tiles; ++j) {

                 std::memcpy(&lev,  buffer, sizeof(int)); buffer += sizeof(int);

                 std::memcpy(&gid,  buffer, sizeof(int)); buffer += sizeof(int);

                 std::memcpy(&tid,  buffer, sizeof(int)); buffer += sizeof(int);

                 std::memcpy(&size, buffer, sizeof(int)); buffer += sizeof(int);


                 if (size == 0) { continue; }


                 np = size / cdata_size;


                 AMREX_ASSERT(size % cdata_size == 0);


                 PairIndex dst_index(gid, tid);

                 size_t old_size = neighbors[lev][dst_index].size();

                 size_t new_size = neighbors[lev][dst_index].size() + np;

                 if ( enableInverse() )

                 {

                     AMREX_ASSERT(neighbors[lev][dst_index].size() ==

                                  size_t(inverse_tags[lev][dst_index].size()));

                     inverse_tags[lev][dst_index].resize(new_size);

                 }

                 neighbors[lev][dst_index].resize(new_size);


                 char* src = buffer;

                 for (int n = 0; n < np; ++n) {

                     char* dst_aos = (char*) &neighbors[lev][dst_index].GetArrayOfStructs()[old_size+n];

                     auto& dst_soa = neighbors[lev][dst_index].GetStructOfArrays();

                     for (int ii = 0; ii < AMREX_SPACEDIM + NStructReal; ++ii) {

                         if (ghost_real_comp[ii]) {

                             std::memcpy(dst_aos, src, sizeof(typename ParticleType::RealType));

                             src += sizeof(typename ParticleType::RealType);

                         }

                         dst_aos += sizeof(typename ParticleType::RealType);

                     }

                     for (int ii = 0; ii < this->NumRealComps(); ++ii) {

                         if (ghost_real_comp[ii+AMREX_SPACEDIM+NStructReal])

                         {

                             std::memcpy(&(dst_soa.GetRealData(ii)[old_size+n]),

                                         src, sizeof(typename ParticleType::RealType));

                             src += sizeof(typename ParticleType::RealType);

                         }

                     }

                     for (int ii = 0; ii < 2 + NStructInt; ++ii) {

                         if (ghost_int_comp[ii]) {

                             std::memcpy(dst_aos, src, sizeof(int));

                             src += sizeof(int);

                         }

                         dst_aos += sizeof(int);

                     }

                     for (int ii = 0; ii < this->NumIntComps(); ++ii) {

                         if (ghost_int_comp[ii+2+NStructInt])

                         {

                             std::memcpy(&(dst_soa.GetIntData(ii)[old_size+n]),

                                         src, sizeof(int));

                             src += sizeof(int);

                         }

                     }


                     if ( enableInverse() )

                     {

                         auto& tag = inverse_tags[lev][dst_index][old_size+n];

                         std::memcpy(&(tag.src_grid),src,sizeof(int));

                         src += sizeof(int);


                         std::memcpy(&(tag.src_tile),src,sizeof(int));

                         src += sizeof(int);


                         std::memcpy(&(tag.src_index),src,sizeof(int));

                         src += sizeof(int);


                         std::memcpy(&(tag.src_level),src,sizeof(int));

                         src += sizeof(int);

                     }

                 }

                 buffer += size;

             }

         }

     }

 #else

     amrex::ignore_unused(reuse_rcv_counts);

 #endif

 }


 #endif

BL_PROFILE
#define BL_PROFILE(a)
Definition: AMReX_BLProfiler.H:551

BL_PROFILE_VAR_STOP
#define BL_PROFILE_VAR_STOP(vname)
Definition: AMReX_BLProfiler.H:563

BL_PROFILE_VAR
#define BL_PROFILE_VAR(fname, vname)
Definition: AMReX_BLProfiler.H:560

AMREX_ASSERT
#define AMREX_ASSERT(EX)
Definition: AMReX_BLassert.H:38

offset
Array4< int const  > offset
Definition: AMReX_HypreMLABecLap.cpp:1089

amrex::AllPrint
Print on all processors of the default communicator.
Definition: AMReX_Print.H:117

amrex::NeighborParticleContainer
Definition: AMReX_NeighborParticles.H:35

amrex::NeighborParticleContainer::PairIndex
std::pair< int, int > PairIndex
Definition: AMReX_NeighborParticles.H:196

amrex::ParallelDescriptor::Message::req
MPI_Request req() const
Definition: AMReX_ParallelDescriptor.H:74

amrex::Periodicity
This provides length of period for periodic domains. 0 means it is not periodic in that direction....
Definition: AMReX_Periodicity.H:17

amrex::Periodicity::isAnyPeriodic
bool isAnyPeriodic() const noexcept
Definition: AMReX_Periodicity.H:22

amrex::Periodicity::isPeriodic
bool isPeriodic(int dir) const noexcept
Definition: AMReX_Periodicity.H:26

amrex::Print
This class provides the user with a few print options.
Definition: AMReX_Print.H:35

amrex::RealBox
A Box with real dimensions. A RealBox is OK iff volume >= 0.
Definition: AMReX_RealBox.H:21

amrex::RealBox::length
AMREX_GPU_HOST_DEVICE Real length(int dir) const noexcept
Returns length in specified direction.
Definition: AMReX_RealBox.H:62

amrex::Vector< char >

amrex::Vector::size
Long size() const noexcept
Definition: AMReX_Vector.H:50

amrex::Gpu::Atomic::Max
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Max(T *const m, T const value) noexcept
Definition: AMReX_GpuAtomic.H:417

amrex::Gpu::range_detail::size
AMREX_GPU_HOST_DEVICE Long size(T const &b) noexcept
integer version
Definition: AMReX_GpuRange.H:26

amrex::Gpu::memcpy
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void * memcpy(void *dest, const void *src, std::size_t count)
Definition: AMReX_GpuUtility.H:214

amrex::MPMD::NProcs
int NProcs()
Process ID in MPI_COMM_WORLD.
Definition: AMReX_MPMD.cpp:122

amrex::MPMD::MyProc
int MyProc()
Definition: AMReX_MPMD.cpp:117

amrex::OpenMP::get_max_threads
constexpr int get_max_threads()
Definition: AMReX_OpenMP.H:36

amrex::ParallelContext::CommunicatorSub
MPI_Comm CommunicatorSub() noexcept
sub-communicator for current frame
Definition: AMReX_ParallelContext.H:70

amrex::ParallelContext::MyProcSub
int MyProcSub() noexcept
my sub-rank in current frame
Definition: AMReX_ParallelContext.H:76

amrex::ParallelContext::global_to_local_rank
int global_to_local_rank(int rank) noexcept
Definition: AMReX_ParallelContext.H:98

amrex::ParallelContext::NProcsSub
int NProcsSub() noexcept
number of ranks in current frame
Definition: AMReX_ParallelContext.H:74

amrex::ParallelDescriptor::Waitall
void Waitall(Vector< MPI_Request > &, Vector< MPI_Status > &)
Definition: AMReX_ParallelDescriptor.cpp:1295

amrex::ParallelDescriptor::Send
Message Send(const T *buf, size_t n, int dst_pid, int tag)
Definition: AMReX_ParallelDescriptor.H:1109

amrex::ParallelDescriptor::SeqNum
int SeqNum() noexcept
Returns sequential message sequence numbers, usually used as tags for send/recv.
Definition: AMReX_ParallelDescriptor.H:613

amrex::ParallelDescriptor::Arecv
Message Arecv(T *, size_t n, int pid, int tag)
Definition: AMReX_ParallelDescriptor.H:1130

amrex::detail::max
@ max
Definition: AMReX_ParallelReduce.H:17

amrex::copyParticles
void copyParticles(DstTile &dst, const SrcTile &src) noexcept
Copy particles from src to dst. This version copies all the particles, writing them to the beginning ...
Definition: AMReX_ParticleTransformation.H:158

amrex::ignore_unused
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void ignore_unused(const Ts &...)
This shuts up the compiler about unused variables.
Definition: AMReX.H:111

amrex::Abort
void Abort(const std::string &msg)
Print out message to cerr and exit via abort().
Definition: AMReX.cpp:225

amrex::int
const int[]
Definition: AMReX_BLProfiler.cpp:1664

amrex::copyParticle
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void copyParticle(const ParticleTileData< T_ParticleType, NAR, NAI > &dst, const ConstParticleTileData< T_ParticleType, NAR, NAI > &src, int src_i, int dst_i) noexcept
A general single particle copying routine that can run on the GPU.
Definition: AMReX_ParticleTransformation.H:31