amrex/doxygen/AMReX__ParticleReduce_8H_source.html

#ifndef AMREX_PARTICLEREDUCE_H_

#define AMREX_PARTICLEREDUCE_H_

#include <AMReX_Config.H>


#include <AMReX_IntVect.H>

#include <AMReX_Box.H>

#include <AMReX_Gpu.H>

#include <AMReX_Print.H>

#include <AMReX_GpuUtility.H>

#include <AMReX_TypeTraits.H>

#include <AMReX_ParticleUtil.H>

#include <AMReX_Vector.H>


#include <limits>

#include <type_traits>


namespace amrex {


namespace particle_detail {


template <typename F, typename T_ParticleType, int NAR, int NAI>

AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


auto call_f (F const& f,

             const ConstParticleTileData<T_ParticleType, NAR, NAI>& p,

             const int i) noexcept

{

    if constexpr ( ! T_ParticleType::is_soa_particle &&

                   IsCallable<F, T_ParticleType const&>::value) {

        return f(p.m_aos[i]);

    } else if constexpr (IsCallable<F, decltype(p.getSuperParticle(i))>::value) {

        return f(p.getSuperParticle(i));

    } else {

        return f(p, i);

    }

}


}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceSum (PC const& pc, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceSum(pc, 0, pc.finestLevel(), std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceSum (PC const& pc, int lev, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceSum(pc, lev, lev, std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceSum (PC const& pc, int lev_min, int lev_max, F const& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    using value_type = decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()));

    value_type sm = 0;


#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion())

    {

        ReduceOps<ReduceOpSum> reduce_op;

        ReduceData<value_type> reduce_data(reduce_op);

        using ReduceTuple = typename decltype(reduce_data)::Type;


        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            for (const auto& kv : plev)

            {

                const auto& tile = plev.at(kv.first);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                reduce_op.eval(np, reduce_data,

                               [=] AMREX_GPU_DEVICE (const int i) -> ReduceTuple {

                                   return particle_detail::call_f(f, ptd, i);

                               });

            }

        }


        ReduceTuple hv = reduce_data.value(reduce_op);

        sm = amrex::get<0>(hv);

    }

    else

#endif

    {

        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            Vector<std::pair<int, int> > grid_tile_ids;

            Vector<const typename PC::ParticleTileType*> ptile_ptrs;

            for (auto& kv : plev)

            {

                grid_tile_ids.push_back(kv.first);

                ptile_ptrs.push_back(&(kv.second));

            }

#ifdef AMREX_USE_OMP

#pragma omp parallel for if (!system::regtest_reduction) reduction(+:sm)

#endif

            for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

            {

                const auto& tile = plev.at(grid_tile_ids[pmap_it]);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                for (int i = 0; i < np; ++i) {

                    sm += particle_detail::call_f(f, ptd, i);

                }

            }

        }

    }


    return sm;

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMax (PC const& pc, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceMax(pc, 0, pc.finestLevel(), std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMax (PC const& pc, int lev, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceMax(pc, lev, lev, std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMax (PC const& pc, int lev_min, int lev_max, F const& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    using value_type = decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()));

    constexpr value_type value_lowest = std::numeric_limits<value_type>::lowest();

    value_type r = value_lowest;


#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion())

    {

        ReduceOps<ReduceOpMax> reduce_op;

        ReduceData<value_type> reduce_data(reduce_op);

        using ReduceTuple = typename decltype(reduce_data)::Type;


        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            for (const auto& kv : plev)

            {

                const auto& tile = plev.at(kv.first);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                reduce_op.eval(np, reduce_data,

                               [=] AMREX_GPU_DEVICE (const int i) -> ReduceTuple {

                                   return particle_detail::call_f(f, ptd, i);

                               });

            }

        }


        ReduceTuple hv = reduce_data.value(reduce_op);

        r = amrex::get<0>(hv);

    }

    else

#endif

    {

        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            Vector<std::pair<int, int> > grid_tile_ids;

            Vector<const typename PC::ParticleTileType*> ptile_ptrs;

            for (auto& kv : plev)

            {

                grid_tile_ids.push_back(kv.first);

                ptile_ptrs.push_back(&(kv.second));

            }

#ifdef AMREX_USE_OMP

#pragma omp parallel for if (!system::regtest_reduction) reduction(max:r)

#endif

            for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

            {

                const auto& tile = plev.at(grid_tile_ids[pmap_it]);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                for (int i = 0; i < np; ++i) {

                    r = std::max(r, particle_detail::call_f(f, ptd, i));

                }

            }

        }

    }


    return r;

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMin (PC const& pc, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceMin(pc, 0, pc.finestLevel(), std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMin (PC const& pc, int lev, F&& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    return ReduceMin(pc, lev, lev, std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

auto


ReduceMin (PC const& pc, int lev_min, int lev_max, F const& f)

    -> decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()))

{

    using value_type = decltype(particle_detail::call_f(f, typename PC::ParticleTileType::ConstParticleTileDataType(), int()));

    constexpr value_type value_max = std::numeric_limits<value_type>::max();

    value_type r = value_max;


#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion())

    {

        ReduceOps<ReduceOpMin> reduce_op;

        ReduceData<value_type> reduce_data(reduce_op);

        using ReduceTuple = typename decltype(reduce_data)::Type;


        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            for (const auto& kv : plev)

            {

                const auto& tile = plev.at(kv.first);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                reduce_op.eval(np, reduce_data,

                               [=] AMREX_GPU_DEVICE (const int i) -> ReduceTuple {

                                   return particle_detail::call_f(f, ptd, i);

                               });

            }

        }


        ReduceTuple hv = reduce_data.value(reduce_op);

        r = amrex::get<0>(hv);

    }

    else

#endif

    {

        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            Vector<std::pair<int, int> > grid_tile_ids;

            Vector<const typename PC::ParticleTileType*> ptile_ptrs;

            for (auto& kv : plev)

            {

                grid_tile_ids.push_back(kv.first);

                ptile_ptrs.push_back(&(kv.second));

            }

#ifdef AMREX_USE_OMP

#pragma omp parallel for if (!system::regtest_reduction) reduction(min:r)

#endif

            for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

            {

                const auto& tile = plev.at(grid_tile_ids[pmap_it]);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                for (int i = 0; i < np; ++i) {

                    r = std::min(r, particle_detail::call_f(f, ptd, i));

                }

            }

        }

    }


    return r;

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalAnd (PC const& pc, F&& f)

{

    return ReduceLogicalAnd(pc, 0, pc.finestLevel(), std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalAnd (PC const& pc, int lev, F&& f)

{

    return ReduceLogicalAnd(pc, lev, lev, std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalAnd (PC const& pc, int lev_min, int lev_max, F const& f)

{

    int r = true;


#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion())

    {

        ReduceOps<ReduceOpLogicalAnd> reduce_op;

        ReduceData<int> reduce_data(reduce_op);

        using ReduceTuple = typename decltype(reduce_data)::Type;


        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            for (const auto& kv : plev)

            {

                const auto& tile = plev.at(kv.first);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                reduce_op.eval(np, reduce_data,

                               [=] AMREX_GPU_DEVICE (const int i) -> ReduceTuple {

                                   return particle_detail::call_f(f, ptd, i);

                               });

            }

        }


        ReduceTuple hv = reduce_data.value(reduce_op);

        r = amrex::get<0>(hv);

    }

    else

#endif

    {

        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            Vector<std::pair<int, int> > grid_tile_ids;

            Vector<const typename PC::ParticleTileType*> ptile_ptrs;

            for (auto& kv : plev)

            {

                grid_tile_ids.push_back(kv.first);

                ptile_ptrs.push_back(&(kv.second));

            }

#ifdef AMREX_USE_OMP

#pragma omp parallel for if (!system::regtest_reduction) reduction(&&:r)

#endif

            for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

            {

                const auto& tile = plev.at(grid_tile_ids[pmap_it]);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                for (int i = 0; i < np; ++i) {

                    r = r && particle_detail::call_f(f, ptd, i);

                }

            }

        }

    }


    return r;

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalOr (PC const& pc, F&& f)

{

    return ReduceLogicalOr(pc, 0, pc.finestLevel(), std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalOr (PC const& pc, int lev, F&& f)

{

    return ReduceLogicalOr(pc, lev, lev, std::forward<F>(f));

}


template <class PC, class F, std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

bool


ReduceLogicalOr (PC const& pc, int lev_min, int lev_max, F const& f)

{

    int r = false;


#ifdef AMREX_USE_GPU

    if (Gpu::inLaunchRegion())

    {

        ReduceOps<ReduceOpLogicalOr> reduce_op;

        ReduceData<int> reduce_data(reduce_op);

        using ReduceTuple = typename decltype(reduce_data)::Type;


        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            for (const auto& kv : plev)

            {

                const auto& tile = plev.at(kv.first);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                reduce_op.eval(np, reduce_data,

                               [=] AMREX_GPU_DEVICE (const int i) -> ReduceTuple

                               {

                                   return particle_detail::call_f(f, ptd, i);

                               });

            }

        }


        ReduceTuple hv = reduce_data.value(reduce_op);

        r = amrex::get<0>(hv);

    }

    else

#endif

    {

        for (int lev = lev_min; lev <= lev_max; ++lev)

        {

            const auto& plev = pc.GetParticles(lev);

            Vector<std::pair<int, int> > grid_tile_ids;

            Vector<const typename PC::ParticleTileType*> ptile_ptrs;

            for (auto& kv : plev)

            {

                grid_tile_ids.push_back(kv.first);

                ptile_ptrs.push_back(&(kv.second));

            }

#ifdef AMREX_USE_OMP

#pragma omp parallel for if (!system::regtest_reduction) reduction(||:r)

#endif

            for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

            {

                const auto& tile = plev.at(grid_tile_ids[pmap_it]);

                const auto np = tile.numParticles();

                const auto& ptd = tile.getConstParticleTileData();

                for (int i = 0; i < np; ++i) {

                    r = r || particle_detail::call_f(f, ptd, i);

                }

            }

        }

    }


    return r;

}


template <class RD, class PC, class F, class ReduceOps,

          std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

typename RD::Type


ParticleReduce (PC const& pc, F&& f, ReduceOps& reduce_ops)

{

    return ParticleReduce<RD>(pc, 0, pc.finestLevel(), std::forward<F>(f), reduce_ops);

}


template <class RD, class PC, class F, class ReduceOps,

          std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

typename RD::Type


ParticleReduce (PC const& pc, int lev, F&& f, ReduceOps& reduce_ops)

{

    return ParticleReduce<RD>(pc, lev, lev, std::forward<F>(f), reduce_ops);

}


template <class RD, class PC, class F, class ReduceOps,

          std::enable_if_t<IsParticleContainer<PC>::value, int> foo = 0>

typename RD::Type


ParticleReduce (PC const& pc, int lev_min, int lev_max, F const& f, ReduceOps& reduce_ops)

{

    RD reduce_data(reduce_ops);

    for (int lev = lev_min; lev <= lev_max; ++lev) {

        const auto& plev = pc.GetParticles(lev);

        Vector<std::pair<int, int> > grid_tile_ids;

        Vector<const typename PC::ParticleTileType*> ptile_ptrs;

        for (auto& kv : plev)

        {

            grid_tile_ids.push_back(kv.first);

            ptile_ptrs.push_back(&(kv.second));

        }

#if !defined(AMREX_USE_GPU) && defined(AMREX_USE_OMP)

#pragma omp parallel for

#endif

        for (int pmap_it = 0; pmap_it < static_cast<int>(ptile_ptrs.size()); ++pmap_it)

        {

            const auto& tile = plev.at(grid_tile_ids[pmap_it]);

            const auto np = tile.numParticles();

            const auto& ptd = tile.getConstParticleTileData();

            reduce_ops.eval(np, reduce_data,

                            [=] AMREX_GPU_DEVICE (const int i) noexcept

                            {

                                return particle_detail::call_f(f, ptd, i);

                            });

        }

    }

    return reduce_data.value(reduce_ops);

}


}

#endif

AMReX_Box.H

AMREX_FORCE_INLINE
#define AMREX_FORCE_INLINE
Definition AMReX_Extension.H:119

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

AMREX_GPU_HOST_DEVICE
#define AMREX_GPU_HOST_DEVICE
Definition AMReX_GpuQualifiers.H:20

AMReX_GpuUtility.H

AMReX_Gpu.H

AMReX_IntVect.H

AMReX_ParticleUtil.H

AMReX_Print.H

AMReX_TypeTraits.H

AMReX_Vector.H

amrex::ReduceData
Definition AMReX_Reduce.H:249

amrex::ReduceData::value
Type value()
Definition AMReX_Reduce.H:281

amrex::ReduceOps
Definition AMReX_Reduce.H:364

amrex::ReduceOps::eval
std::enable_if_t< IsFabArray< MF >::value > eval(MF const &mf, IntVect const &nghost, D &reduce_data, F &&f)
Definition AMReX_Reduce.H:441

amrex::Vector
This class is a thin wrapper around std::vector. Unlike vector, Vector::operator[] provides bound che...
Definition AMReX_Vector.H:27

amrex::Vector::size
Long size() const noexcept
Definition AMReX_Vector.H:50

amrex::Gpu::inLaunchRegion
bool inLaunchRegion() noexcept
Definition AMReX_GpuControl.H:86

amrex::particle_detail::call_f
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE auto call_f(F const &f, const PTDType< T_ParticleType, NAR, NAI > &p, const int i, Array4< T > const &fabarr, GpuArray< Real, AMREX_SPACEDIM > const &plo, GpuArray< Real, AMREX_SPACEDIM > const &dxi) noexcept
Definition AMReX_ParticleMesh.H:16

amrex
Definition AMReX_Amr.cpp:49

amrex::ReduceMax
FAB::value_type ReduceMax(FabArray< FAB > const &fa, int nghost, F &&f)
Definition AMReX_FabArrayUtility.H:531

amrex::Order::F
@ F

amrex::CurlCurlStateType::r
@ r

amrex::ReduceLogicalAnd
bool ReduceLogicalAnd(FabArray< FAB > const &fa, int nghost, F &&f)
Definition AMReX_FabArrayUtility.H:758

amrex::ReduceLogicalOr
bool ReduceLogicalOr(FabArray< FAB > const &fa, int nghost, F &&f)
Definition AMReX_FabArrayUtility.H:905

amrex::ParticleReduce
RD::Type ParticleReduce(PC const &pc, F &&f, ReduceOps &reduce_ops)
A general reduction method for the particles in a ParticleContainer that can run on either CPUs or GP...
Definition AMReX_ParticleReduce.H:1097

amrex::ReduceMin
FAB::value_type ReduceMin(FabArray< FAB > const &fa, int nghost, F &&f)
Definition AMReX_FabArrayUtility.H:305

amrex::ReduceSum
FAB::value_type ReduceSum(FabArray< FAB > const &fa, int nghost, F &&f)
Definition AMReX_FabArrayUtility.H:16

amrex::ConstParticleTileData
Definition AMReX_ParticleTile.H:501

amrex::IsCallable
Test if a given type T is callable with arguments of type Args...
Definition AMReX_TypeTraits.H:201