amrex/doxygen/AMReX__MPMD_8H_source.html

#ifndef AMREX_MPMD_H_

#define AMREX_MPMD_H_

#include <AMReX_Config.H>


#ifdef AMREX_USE_MPI


#include <AMReX_FabArray.H>


#include <mpi.h>


namespace amrex::MPMD {


void Initialize_without_split (int argc, char* argv[]);


MPI_Comm Initialize (int argc, char* argv[]);


void Finalize ();


bool Initialized ();


int MyProc ();

int NProcs ();

int AppNum ();

int MyProgId ();


class Copier

{

public:

    explicit Copier (bool);


    Copier (BoxArray const& ba, DistributionMapping const& dm,

            bool send_ba = false);


    template <typename FAB>

    void send (FabArray<FAB> const& mf, int icomp, int ncomp) const;


    template <typename FAB>

    void recv (FabArray<FAB>& mf, int icomp, int ncomp) const;


    [[nodiscard]] BoxArray const& boxArray () const;


    [[nodiscard]] DistributionMapping const& DistributionMap () const;


private:

    std::map<int,FabArrayBase::CopyComTagsContainer> m_SndTags;

    std::map<int,FabArrayBase::CopyComTagsContainer> m_RcvTags;

    bool m_is_thread_safe;

    BoxArray m_ba;

    DistributionMapping m_dm;

};


template <typename FAB>


void Copier::send (FabArray<FAB> const& mf, int icomp, int ncomp) const

{

    const auto N_snds = static_cast<int>(m_SndTags.size());


    if (N_snds == 0) { return; }


    // Prepare buffer


    Vector<char*>       send_data;

    Vector<std::size_t> send_size;

    Vector<int>         send_rank;

    Vector<MPI_Request> send_reqs;

    Vector<FabArrayBase::CopyComTagsContainer const*> send_cctc;


    Vector<std::size_t> offset;

    std::size_t total_volume = 0;

    for (auto const& kv : m_SndTags) {

        auto const& cctc = kv.second;


        std::size_t nbytes = 0;

        for (auto const& cct : cctc) {

            nbytes += cct.sbox.numPts() * ncomp * sizeof(typename FAB::value_type);

        }


        std::size_t acd = ParallelDescriptor::sizeof_selected_comm_data_type(nbytes);

        nbytes = amrex::aligned_size(acd, nbytes); // so that bytes are aligned


        // Also need to align the offset properly

        total_volume = amrex::aligned_size(std::max(alignof(typename FAB::value_type),

                                                    acd), total_volume);


        offset.push_back(total_volume);

        total_volume += nbytes;


        send_data.push_back(nullptr);

        send_size.push_back(nbytes);

        send_rank.push_back(kv.first);

        send_reqs.push_back(MPI_REQUEST_NULL);

        send_cctc.push_back(&cctc);

    }


    Gpu::PinnedVector<char> send_buffer(total_volume);

    char* the_send_data = send_buffer.data();

    for (int i = 0; i < N_snds; ++i) {

        send_data[i] = the_send_data + offset[i];

    }


    // Pack buffer

#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion() && (mf.arena()->isDevice() || mf.arena()->isManaged())) {

        mf.pack_send_buffer_gpu(mf, icomp, ncomp, send_data, send_size, send_cctc);

    } else

#endif

    {

        mf.pack_send_buffer_cpu(mf, icomp, ncomp, send_data, send_size, send_cctc);

    }


    // Send

    for (int i = 0; i < N_snds; ++i) {

        send_reqs[i] = ParallelDescriptor::Asend

            (send_data[i], send_size[i], send_rank[i], 100, MPI_COMM_WORLD).req();

    }

    Vector<MPI_Status> stats(N_snds);

    ParallelDescriptor::Waitall(send_reqs, stats);

}


template <typename FAB>


void Copier::recv (FabArray<FAB>& mf, int icomp, int ncomp) const

{

    const auto N_rcvs = static_cast<int>(m_RcvTags.size());


    if (N_rcvs == 0) { return; }


    // Prepare buffer


    Vector<char*>       recv_data;

    Vector<std::size_t> recv_size;

    Vector<int>         recv_from;

    Vector<MPI_Request> recv_reqs;


    Vector<std::size_t> offset;

    std::size_t TotalRcvsVolume = 0;

    for (auto const& kv : m_RcvTags) {

        std::size_t nbytes = 0;

        for (auto const& cct : kv.second) {

            nbytes += cct.dbox.numPts() * ncomp * sizeof(typename FAB::value_type);

        }


        std::size_t acd = ParallelDescriptor::sizeof_selected_comm_data_type(nbytes);

        nbytes = amrex::aligned_size(acd, nbytes); // so that nbytes are aligned


        // Also need to align the offset properly

        TotalRcvsVolume = amrex::aligned_size(std::max(alignof(typename FAB::value_type),

                                                       acd), TotalRcvsVolume);


        offset.push_back(TotalRcvsVolume);

        TotalRcvsVolume += nbytes;


        recv_data.push_back(nullptr);

        recv_size.push_back(nbytes);

        recv_from.push_back(kv.first);

        recv_reqs.push_back(MPI_REQUEST_NULL);

    }


    Gpu::PinnedVector<char> recv_buffer(TotalRcvsVolume);

    char* the_recv_data = recv_buffer.data();


    // Recv

    for (int i = 0; i < N_rcvs; ++i) {

        recv_data[i] = the_recv_data + offset[i];

        recv_reqs[i] = ParallelDescriptor::Arecv

            (recv_data[i], recv_size[i], recv_from[i], 100, MPI_COMM_WORLD).req();

    }


    Vector<FabArrayBase::CopyComTagsContainer const*> recv_cctc(N_rcvs, nullptr);

    for (int i = 0; i < N_rcvs; ++i) {

        recv_cctc[i] = &(m_RcvTags.at(recv_from[i]));

    }


    Vector<MPI_Status> stats(N_rcvs);

    ParallelDescriptor::Waitall(recv_reqs, stats);


    // Unpack buffer

#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion() && (mf.arena()->isDevice() || mf.arena()->isManaged())) {

        mf.unpack_recv_buffer_gpu(mf, icomp, ncomp, recv_data, recv_size, recv_cctc,

                                  FabArrayBase::COPY, m_is_thread_safe);

    } else

#endif

    {

        mf.unpack_recv_buffer_cpu(mf, icomp, ncomp, recv_data, recv_size, recv_cctc,

                                  FabArrayBase::COPY, m_is_thread_safe);

    }

}


}


#endif

#endif

AMReX_FabArray.H

offset
Array4< int const  > offset
Definition AMReX_HypreMLABecLap.cpp:1089

MPI_Comm
int MPI_Comm
Definition AMReX_ccse-mpi.H:47

MPI_COMM_WORLD
static constexpr int MPI_COMM_WORLD
Definition AMReX_ccse-mpi.H:54

MPI_REQUEST_NULL
static constexpr int MPI_REQUEST_NULL
Definition AMReX_ccse-mpi.H:53

amrex::Arena::isManaged
virtual bool isManaged() const
Definition AMReX_Arena.cpp:79

amrex::Arena::isDevice
virtual bool isDevice() const
Definition AMReX_Arena.cpp:91

amrex::BoxArray
A collection of Boxes stored in an Array.
Definition AMReX_BoxArray.H:550

amrex::DistributionMapping
Calculates the distribution of FABs to MPI processes.
Definition AMReX_DistributionMapping.H:41

amrex::FabArrayBase::COPY
@ COPY
Definition AMReX_FabArrayBase.H:393

amrex::FabArray
An Array of FortranArrayBox(FAB)-like Objects.
Definition AMReX_FabArray.H:344

amrex::FabArray::pack_send_buffer_gpu
static void pack_send_buffer_gpu(FabArray< FAB > const &src, int scomp, int ncomp, Vector< char * > const &send_data, Vector< std::size_t > const &send_size, Vector< const CopyComTagsContainer * > const &send_cctc)

amrex::FabArray::unpack_recv_buffer_cpu
static void unpack_recv_buffer_cpu(FabArray< FAB > &dst, int dcomp, int ncomp, Vector< char * > const &recv_data, Vector< std::size_t > const &recv_size, Vector< const CopyComTagsContainer * > const &recv_cctc, CpOp op, bool is_thread_safe)

amrex::FabArray::arena
Arena * arena() const noexcept
Definition AMReX_FabArray.H:445

amrex::FabArray::unpack_recv_buffer_gpu
static void unpack_recv_buffer_gpu(FabArray< FAB > &dst, int dcomp, int ncomp, Vector< char * > const &recv_data, Vector< std::size_t > const &recv_size, Vector< const CopyComTagsContainer * > const &recv_cctc, CpOp op, bool is_thread_safe)

amrex::FabArray::pack_send_buffer_cpu
static void pack_send_buffer_cpu(FabArray< FAB > const &src, int scomp, int ncomp, Vector< char * > const &send_data, Vector< std::size_t > const &send_size, Vector< const CopyComTagsContainer * > const &send_cctc)

amrex::MPMD::Copier
Program ID.
Definition AMReX_MPMD.H:27

amrex::MPMD::Copier::m_is_thread_safe
bool m_is_thread_safe
Definition AMReX_MPMD.H:47

amrex::MPMD::Copier::m_dm
DistributionMapping m_dm
Definition AMReX_MPMD.H:49

amrex::MPMD::Copier::DistributionMap
DistributionMapping const & DistributionMap() const
Definition AMReX_MPMD.cpp:370

amrex::MPMD::Copier::recv
void recv(FabArray< FAB > &mf, int icomp, int ncomp) const
Definition AMReX_MPMD.H:120

amrex::MPMD::Copier::m_ba
BoxArray m_ba
Definition AMReX_MPMD.H:48

amrex::MPMD::Copier::boxArray
BoxArray const & boxArray() const
Definition AMReX_MPMD.cpp:365

amrex::MPMD::Copier::m_SndTags
std::map< int, FabArrayBase::CopyComTagsContainer > m_SndTags
Definition AMReX_MPMD.H:45

amrex::MPMD::Copier::m_RcvTags
std::map< int, FabArrayBase::CopyComTagsContainer > m_RcvTags
Definition AMReX_MPMD.H:46

amrex::MPMD::Copier::send
void send(FabArray< FAB > const &mf, int icomp, int ncomp) const
Definition AMReX_MPMD.H:53

amrex::PODVector
Definition AMReX_PODVector.H:262

amrex::PODVector::data
T * data() noexcept
Definition AMReX_PODVector.H:609

amrex::ParallelDescriptor::Message::req
MPI_Request req() const
Definition AMReX_ParallelDescriptor.H:74

amrex::Vector
This class is a thin wrapper around std::vector. Unlike vector, Vector::operator[] provides bound che...
Definition AMReX_Vector.H:27

amrex::Gpu::inLaunchRegion
bool inLaunchRegion() noexcept
Definition AMReX_GpuControl.H:86

amrex::MPMD
Definition AMReX_MPMD.cpp:12

amrex::MPMD::Initialize_without_split
void Initialize_without_split(int argc, char *argv[])
Definition AMReX_MPMD.cpp:44

amrex::MPMD::Initialized
bool Initialized()
Definition AMReX_MPMD.cpp:115

amrex::MPMD::NProcs
int NProcs()
Process ID in MPI_COMM_WORLD.
Definition AMReX_MPMD.cpp:122

amrex::MPMD::Finalize
void Finalize()
Definition AMReX_MPMD.cpp:105

amrex::MPMD::MyProc
int MyProc()
Definition AMReX_MPMD.cpp:117

amrex::MPMD::MyProgId
int MyProgId()
Get the appnum (color) required for MPI_Comm_split.
Definition AMReX_MPMD.cpp:137

amrex::MPMD::AppNum
int AppNum()
Number of processes in MPI_COMM_WORLD.
Definition AMReX_MPMD.cpp:132

amrex::MPMD::Initialize
MPI_Comm Initialize(int argc, char *argv[])
Definition AMReX_MPMD.cpp:97

amrex::ParallelDescriptor::Asend
Message Asend(const T *, size_t n, int pid, int tag)
Definition AMReX_ParallelDescriptor.H:1088

amrex::ParallelDescriptor::Waitall
void Waitall(Vector< MPI_Request > &, Vector< MPI_Status > &)
Definition AMReX_ParallelDescriptor.cpp:1298

amrex::ParallelDescriptor::Arecv
Message Arecv(T *, size_t n, int pid, int tag)
Definition AMReX_ParallelDescriptor.H:1130

amrex::aligned_size
std::size_t aligned_size(std::size_t align_requirement, std::size_t size) noexcept
Given a minimum required size of size bytes, this returns the next largest arena size that will align...
Definition AMReX_Arena.H:30