amrex/doxygen/AMReX__PCI_8H_source.html

#ifndef AMREX_PCI_H_

#define AMREX_PCI_H_


template <class FAB>

void


FabArray<FAB>::PC_local_cpu (const CPC& thecpc, FabArray<FAB> const& src,

                             int scomp, int dcomp, int ncomp, CpOp op)

{

    auto const N_locs = static_cast<int>(thecpc.m_LocTags->size());

    if (N_locs == 0) { return; }

    bool is_thread_safe = thecpc.m_threadsafe_loc;


    if (is_thread_safe)

    {

#ifdef AMREX_USE_OMP

#pragma omp parallel for

#endif

        for (int i = 0; i < N_locs; ++i)

        {

            const CopyComTag& tag = (*thecpc.m_LocTags)[i];

            if (this != &src || tag.dstIndex != tag.srcIndex || tag.sbox != tag.dbox) {

                // avoid self copy or plus

                const FAB* sfab = &(src[tag.srcIndex]);

                      FAB* dfab = &(get(tag.dstIndex));

                if (op == FabArrayBase::COPY)

                {

                    dfab->template copy<RunOn::Host>(*sfab, tag.sbox, scomp, tag.dbox, dcomp, ncomp);

                }

                else

                {

                    dfab->template plus<RunOn::Host>(*sfab, tag.sbox, tag.dbox, scomp, dcomp, ncomp);

                }

            }

        }

    }

    else

    {

        LayoutData<Vector<FabCopyTag<FAB> > > loc_copy_tags(boxArray(),DistributionMap());

        for (int i = 0; i < N_locs; ++i)

        {

            const CopyComTag& tag = (*thecpc.m_LocTags)[i];

            if (this != &src || tag.dstIndex != tag.srcIndex || tag.sbox != tag.dbox) {

                loc_copy_tags[tag.dstIndex].push_back

                    ({src.fabPtr(tag.srcIndex), tag.dbox, tag.sbox.smallEnd()-tag.dbox.smallEnd()});

            }

        }


#ifdef AMREX_USE_OMP

#pragma omp parallel

#endif

        for (MFIter mfi(*this); mfi.isValid(); ++mfi)

        {

            const auto& tags = loc_copy_tags[mfi];

            auto dfab = this->array(mfi);

            if (op == FabArrayBase::COPY)

            {

                for (auto const & tag : tags)

                {

                    auto const sfab = tag.sfab->array();

                    Dim3 offset = tag.offset.dim3();

                    amrex::LoopConcurrentOnCpu (tag.dbox, ncomp,

                    [=] (int i, int j, int k, int n) noexcept

                    {

                        dfab(i,j,k,dcomp+n) = sfab(i+offset.x,j+offset.y,k+offset.z,scomp+n);

                    });

                }

            }

            else

            {

                for (auto const & tag : tags)

                {

                    auto const sfab = tag.sfab->array();

                    Dim3 offset = tag.offset.dim3();

                    amrex::LoopConcurrentOnCpu (tag.dbox, ncomp,

                    [=] (int i, int j, int k, int n) noexcept

                    {

                        dfab(i,j,k,dcomp+n) += sfab(i+offset.x,j+offset.y,k+offset.z,scomp+n);

                    });

                }

            }

        }

    }

}


#ifdef AMREX_USE_GPU

template <class FAB>

void


FabArray<FAB>::PC_local_gpu (const CPC& thecpc, FabArray<FAB> const& src,

                             int scomp, int dcomp, int ncomp, CpOp op)

{

    int N_locs = thecpc.m_LocTags->size();

    if (N_locs == 0) { return; }

    bool is_thread_safe = thecpc.m_threadsafe_loc;


    using TagType = Array4CopyTag<value_type>;

    Vector<TagType> loc_copy_tags;

    loc_copy_tags.reserve(N_locs);


    Vector<BaseFab<int> > maskfabs;

    Vector<Array4Tag<int> > masks;

    if (!is_thread_safe)

    {

        if ((op == FabArrayBase::COPY && !amrex::IsStoreAtomic<value_type>::value) ||

            (op == FabArrayBase::ADD  && !amrex::HasAtomicAdd <value_type>::value))

        {

            maskfabs.resize(this->local_size());

            masks.reserve(N_locs);

        }

    }


    for (int i = 0; i < N_locs; ++i)

    {

        const CopyComTag& tag = (*thecpc.m_LocTags)[i];

        if (this != &src || tag.dstIndex != tag.srcIndex || tag.sbox != tag.dbox) {

            int li = this->localindex(tag.dstIndex);

            loc_copy_tags.push_back

                ({this->atLocalIdx(li).array(),

                  src.fabPtr(tag.srcIndex)->const_array(),

                  tag.dbox,

                  (tag.sbox.smallEnd()-tag.dbox.smallEnd()).dim3()});


            if (maskfabs.size() > 0) {

                if (!maskfabs[li].isAllocated()) {

                    maskfabs[li].resize(this->atLocalIdx(li).box());

                }

                masks.emplace_back(Array4Tag<int>{maskfabs[li].array()});

            }

        }

    }


    if (maskfabs.size() > 0) {

        amrex::ParallelFor(masks,

        [=] AMREX_GPU_DEVICE (int i, int j, int k, Array4Tag<int> const& msk) noexcept

        {

            msk.dfab(i,j,k) = 0;

        });

    }


    if (op == FabArrayBase::COPY)

    {

        if (is_thread_safe) {

            detail::fab_to_fab<value_type, value_type>(loc_copy_tags, scomp,

                dcomp, ncomp, detail::CellStore<value_type, value_type>());

        } else {

            detail::fab_to_fab_atomic_cpy<value_type, value_type>(

                loc_copy_tags, scomp, dcomp, ncomp, masks);

        }

    }

    else

    {

        if (is_thread_safe) {

            detail::fab_to_fab<value_type, value_type>(loc_copy_tags, scomp,

                dcomp, ncomp, detail::CellAdd<value_type, value_type>());

        } else {

            detail::fab_to_fab_atomic_add<value_type, value_type>(

                loc_copy_tags, scomp, dcomp, ncomp, masks);

        }

    }

}


#endif


#endif

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

offset
Array4< int const  > offset
Definition AMReX_HypreMLABecLap.cpp:1089

amrex::BoxND::smallEnd
AMREX_GPU_HOST_DEVICE const IntVectND< dim > & smallEnd() const &noexcept
Get the smallend of the BoxND.
Definition AMReX_Box.H:105

amrex::FabArrayBase::CpOp
CpOp
parallel copy or add
Definition AMReX_FabArrayBase.H:393

amrex::FabArray
An Array of FortranArrayBox(FAB)-like Objects.
Definition AMReX_FabArray.H:344

amrex::FabArray::fabPtr
FAB * fabPtr(const MFIter &mfi) noexcept
Return pointer to FAB.
Definition AMReX_FabArray.H:1560

amrex::LayoutData
a one-thingy-per-box distributed object
Definition AMReX_LayoutData.H:13

amrex::MFIter
Definition AMReX_MFIter.H:57

amrex::MFIter::isValid
bool isValid() const noexcept
Is the iterator valid i.e. is it associated with a FAB?
Definition AMReX_MFIter.H:141

amrex::Vector
This class is a thin wrapper around std::vector. Unlike vector, Vector::operator[] provides bound che...
Definition AMReX_Vector.H:27

amrex::Vector::size
Long size() const noexcept
Definition AMReX_Vector.H:50

amrex::ParallelFor
std::enable_if_t< std::is_integral_v< T > > ParallelFor(TypeList< CTOs... > ctos, std::array< int, sizeof...(CTOs)> const &runtime_options, T N, F &&f)
Definition AMReX_CTOParallelForImpl.H:191

amrex::DistributionMap
DistributionMapping const & DistributionMap(FabArrayBase const &fa)

amrex::LoopConcurrentOnCpu
AMREX_ATTRIBUTE_FLATTEN_FOR void LoopConcurrentOnCpu(Dim3 lo, Dim3 hi, F const &f) noexcept
Definition AMReX_Loop.H:378

amrex::get
AMREX_GPU_HOST_DEVICE constexpr GpuTupleElement< I, GpuTuple< Ts... > >::type & get(GpuTuple< Ts... > &tup) noexcept
Definition AMReX_Tuple.H:179

amrex::boxArray
BoxArray const & boxArray(FabArrayBase const &fa)

amrex::Array4CopyTag
Definition AMReX_TagParallelFor.H:26

amrex::Array4Tag
Definition AMReX_TagParallelFor.H:49

amrex::Array4Tag::dfab
Array4< T > dfab
Definition AMReX_TagParallelFor.H:50

amrex::Dim3
Definition AMReX_Dim3.H:12

amrex::FabArrayBase::CPC
parallel copy or add
Definition AMReX_FabArrayBase.H:536

amrex::FabArrayBase::CommMetaData::m_threadsafe_loc
bool m_threadsafe_loc
Definition AMReX_FabArrayBase.H:473

amrex::FabArrayBase::CommMetaData::m_LocTags
std::unique_ptr< CopyComTagsContainer > m_LocTags
Definition AMReX_FabArrayBase.H:475

amrex::FabArrayBase::CopyComTag
Used by a bunch of routines when communicating via MPI.
Definition AMReX_FabArrayBase.H:194

amrex::FabArrayBase::CopyComTag::sbox
Box sbox
Definition AMReX_FabArrayBase.H:196

amrex::FabArrayBase::CopyComTag::srcIndex
int srcIndex
Definition AMReX_FabArrayBase.H:198

amrex::FabArrayBase::CopyComTag::dbox
Box dbox
Definition AMReX_FabArrayBase.H:195

amrex::FabArrayBase::CopyComTag::dstIndex
int dstIndex
Definition AMReX_FabArrayBase.H:197

amrex::IsStoreAtomic
Definition AMReX_TypeTraits.H:266

detail::CellAdd
Definition AMReX_FBI.H:32

detail::CellStore
Definition AMReX_FBI.H:22