amrex/doxygen/AMReX__GpuAtomic_8H_source.html

#ifndef AMREX_GPU_ATOMIC_H_

#define AMREX_GPU_ATOMIC_H_

#include <AMReX_Config.H>


#include <AMReX_GpuQualifiers.H>

#include <AMReX_Functional.H>

#include <AMReX_INT.H>


#include <utility>


namespace amrex {


namespace Gpu::Atomic {


// For Add, Min and Max, we support int, unsigned int, long, unsigned long long, float and double.

// For Multiply and Divide, we support generic types provided they are the same size as int or unsigned long long

// and have *= and /= operators.

// For LogicalOr and LogicalAnd, the data type is int.

// For Exch and CAS, the data type is generic.

// All these functions are non-atomic in host code!!!

// If one needs them to be atomic in host code, use HostDevice::Atomic::*.  Currently only

// HostDevice::Atomic::Add is supported.  We could certainly add more.


namespace detail {


#ifdef AMREX_USE_SYCL


    template <typename R, typename I, typename F>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    R atomic_op (R* const address, R const val, F const f) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        static_assert(sizeof(R) == sizeof(I), "sizeof R != sizeof I");

        I* const add_as_I = reinterpret_cast<I*>(address);

        sycl::atomic_ref<I,mo,ms,as> a{*add_as_I};

        I old_I = a.load(), new_I;

        do {

            R const new_R = f(*(reinterpret_cast<R const*>(&old_I)), val);

            new_I = *(reinterpret_cast<I const*>(&new_R));

        } while (! a.compare_exchange_strong(old_I, new_I));

        return *(reinterpret_cast<R const*>(&old_I));

#else

        R old = *address;

        *address = f(*address, val);

        return old;

#endif

    }


    template <typename R, typename I, typename Op, typename Cond>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    bool atomic_op_if (R* const address, R const val, Op&& op, Cond&& cond) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        static_assert(sizeof(R) == sizeof(I), "sizeof R != sizeof I");

        I* const add_as_I = reinterpret_cast<I*>(address);

        sycl::atomic_ref<I,mo,ms,as> a{*add_as_I};

        I old_I = a.load(), new_I;

        bool test_success;

        do {

            R const tmp = op(*(reinterpret_cast<R const*>(&old_I)), val);

            new_I = *(reinterpret_cast<I const*>(&tmp));

            test_success = cond(tmp);

        } while (test_success && ! a.compare_exchange_strong(old_I, new_I));

        return test_success;

#else

        R old = *address;

        R const tmp = op(*(reinterpret_cast<R const*>(&old)), val);

        if (cond(tmp)) {

            *address = tmp;

            return true;

        } else {

            return false;

        }

#endif

    }


#elif defined(AMREX_USE_CUDA) || defined(AMREX_USE_HIP)


    template <typename R, typename I, typename F>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    R atomic_op (R* const address, R const val, F const f) noexcept

    {

        static_assert(sizeof(R) == sizeof(I), "sizeof R != sizeof I");

        I* const add_as_I = reinterpret_cast<I*>(address);

        I old_I = *add_as_I, assumed_I;

        do {

            assumed_I = old_I;

            R const new_R = f(*(reinterpret_cast<R const*>(&assumed_I)), val);

            old_I = atomicCAS(add_as_I, assumed_I, *(reinterpret_cast<I const*>(&new_R)));

        } while (assumed_I != old_I);

        return *(reinterpret_cast<R const*>(&old_I));

    }


    template <typename R, typename I, typename Op, typename Cond>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    bool atomic_op_if (R* const address, R const val, Op&& op, Cond&& cond) noexcept

    {

        static_assert(sizeof(R) == sizeof(I), "sizeof R != sizeof I");

        I* const add_as_I = reinterpret_cast<I*>(address);

        I old_I = *add_as_I, assumed_I;

        bool test_success;

        do {

            assumed_I = old_I;

            R const new_R = op(*(reinterpret_cast<R const*>(&assumed_I)), val);

            test_success = cond(new_R);

            if (test_success) {

                old_I = atomicCAS(add_as_I, assumed_I, *(reinterpret_cast<I const*>(&new_R)));

            }

        } while (test_success && assumed_I != old_I);

        return test_success;

    }


#endif


}


//  Add


#ifdef AMREX_USE_GPU


#ifdef AMREX_USE_SYCL

    template<class T, sycl::access::address_space AS = sycl::access::address_space::global_space>

#else

    template<class T>

#endif

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    T Add_device (T* const sum, T const value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        sycl::atomic_ref<T,mo,ms,AS> a{*sum};

        return a.fetch_add(value);

#else

        AMREX_IF_ON_DEVICE(( return atomicAdd(sum, value); ))

        AMREX_IF_ON_HOST((

            amrex::ignore_unused(sum, value);

            return T(); // should never get here, but have to return something

        ))

#endif

    }


#if defined(AMREX_USE_HIP) && defined(__gfx90a__)

    // https://github.com/ROCm-Developer-Tools/hipamd/blob/rocm-4.5.x/include/hip/amd_detail/amd_hip_unsafe_atomics.h

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    float Add_device (float* const sum, float const value) noexcept

    {

        return unsafeAtomicAdd(sum, value);

    }


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    double Add_device (double* const sum, double const value) noexcept

    {

        return unsafeAtomicAdd(sum, value);

    }

#endif


#if defined(AMREX_USE_CUDA) || defined(AMREX_USE_HIP)


    // https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#atomicadd

    // https://rocmdocs.amd.com/en/latest/Programming_Guides/Kernel_language.html?#atomic-functions

    // CUDA and HIP support int, unsigned int, and unsigned long long.


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    Long Add_device (Long* const sum, Long const value) noexcept

    {

        return detail::atomic_op<Long, unsigned long long>(sum, value, amrex::Plus<Long>());

    }


#endif


#if defined(AMREX_USE_CUDA) && defined(__CUDA_ARCH__) && (__CUDA_ARCH__ < 600)


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    double Add_device (double* const sum, double const value) noexcept

    {

        return detail::atomic_op<double, unsigned long long>(sum, value, amrex::Plus<double>());

    }


#endif


#endif


#ifdef AMREX_USE_SYCL

    template<class T, sycl::access::address_space AS = sycl::access::address_space::global_space>

#else

    template<class T>

#endif

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Add (T* sum, T value) noexcept

    {

#ifdef AMREX_USE_SYCL

        AMREX_IF_ON_DEVICE((return Add_device<T,AS>(sum, value);))

#else

        AMREX_IF_ON_DEVICE((return Add_device(sum, value);))

#endif

        AMREX_IF_ON_HOST((

            auto old = *sum;

            *sum += value;

            return old;

        ))

    }


//  If


#if defined(AMREX_USE_CUDA) || defined(AMREX_USE_HIP) || defined(AMREX_USE_SYCL)

    template <typename T, typename Op, typename Cond,

              std::enable_if_t<sizeof(T) == sizeof(unsigned int), int> foo = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    bool If_device (T* const sum, T const value, Op&& op, Cond&& cond) noexcept

    {

        return detail::atomic_op_if<T, unsigned int>(sum, value,

                   std::forward<Op>(op), std::forward<Cond>(cond));

    }


    template <typename T, typename Op, typename Cond,

              std::enable_if_t<sizeof(T) == sizeof(unsigned long long), int> foo = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    bool If_device (T* const sum, T const value, Op&& op, Cond&& cond) noexcept

    {

        return detail::atomic_op_if<T, unsigned long long>(sum, value,

                   std::forward<Op>(op), std::forward<Cond>(cond));

    }

#endif


    template<class T, class Op, class Cond>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    bool If (T* const add, T const value, Op&& op, Cond&& cond) noexcept

    {

        AMREX_IF_ON_DEVICE((

            return If_device(add, value, std::forward<Op>(op), std::forward<Cond>(cond));

        ))

        AMREX_IF_ON_HOST((

            T old = *add;

            T const tmp = std::forward<Op>(op)(old, value);

            if (std::forward<Cond>(cond)(tmp)) {

                *add = tmp;

                return true;

            } else {

                return false;

            }

        ))

    }


//  AddNoRet


#ifdef AMREX_USE_SYCL

    template<class T, sycl::access::address_space AS = sycl::access::address_space::global_space>

#else

    template<class T>

#endif

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    void AddNoRet (T* sum, T value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        Add_device<T,AS>(sum, value);

#else

        AMREX_IF_ON_DEVICE((Add_device(sum, value);))

        AMREX_IF_ON_HOST((*sum += value;))

#endif

    }


#if defined(AMREX_USE_HIP) && defined(HIP_VERSION_MAJOR) && (HIP_VERSION_MAJOR < 5)

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

    void AddNoRet (float* const sum, float const value) noexcept

    {

#pragma clang diagnostic push

#pragma clang diagnostic ignored "-Wdeprecated-declarations"

        AMREX_IF_ON_DEVICE((atomicAddNoRet(sum, value);))

#pragma clang diagnostic pop

        AMREX_IF_ON_HOST((*sum += value;))

    }

#endif


//  Min


#ifdef AMREX_USE_GPU


    template<class T>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    T Min_device (T* const m, T const value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<T,mo,ms,as> a{*m};

        return a.fetch_min(value);

#else

        AMREX_IF_ON_DEVICE(( return atomicMin(m, value); ))

        AMREX_IF_ON_HOST((

            amrex::ignore_unused(m,value);

            return T(); // should never get here, but have to return something

        ))

#endif

    }


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    float Min_device (float* const m, float const value) noexcept

    {

        return detail::atomic_op<float,int>(m,value,amrex::Minimum<float>());

    }


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    double Min_device (double* const m, double const value) noexcept

    {

        return detail::atomic_op<double, unsigned long long int>(m,value,amrex::Minimum<double>());

    }


#if defined(AMREX_USE_CUDA) || defined(AMREX_USE_HIP)


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    Long Min_device (Long* const m, Long const value) noexcept

    {

        return detail::atomic_op<Long, unsigned long long int>(m,value,amrex::Minimum<Long>());

    }


#endif


#endif


    template<class T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Min (T* const m, T const value) noexcept

    {

        AMREX_IF_ON_DEVICE((

            return Min_device(m, value);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *m;

            *m = (*m) < value ? (*m) : value;

            return old;

        ))

    }


//  Max


#ifdef AMREX_USE_GPU


    template<class T>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    T Max_device (T* const m, T const value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<T,mo,ms,as> a{*m};

        return a.fetch_max(value);

#else

        AMREX_IF_ON_DEVICE(( return atomicMax(m, value); ))

        AMREX_IF_ON_HOST((

            amrex::ignore_unused(m,value);

            return T(); // should never get here, but have to return something

        ))

#endif

    }


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    float Max_device (float* const m, float const value) noexcept

    {

        return detail::atomic_op<float,int>(m,value,amrex::Maximum<float>());

    }


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    double Max_device (double* const m, double const value) noexcept

    {

        return detail::atomic_op<double, unsigned long long int>(m,value,amrex::Maximum<double>());

    }


#if defined(AMREX_USE_CUDA) || defined(AMREX_USE_HIP)


    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    Long Max_device (Long* const m, Long const value) noexcept

    {

        return detail::atomic_op<Long, unsigned long long int>(m,value,amrex::Maximum<Long>());

    }


#endif


#endif


    template<class T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Max (T* const m, T const value) noexcept

    {

        AMREX_IF_ON_DEVICE((

            return Max_device(m, value);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *m;

            *m = (*m) > value ? (*m) : value;

            return old;

        ))

    }


//  LogicalOr


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    int LogicalOr (int* const m, int const value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<int,mo,ms,as> a{*m};

        return a.fetch_or(value);

#else

        AMREX_IF_ON_DEVICE((

            return atomicOr(m, value);

        ))

        AMREX_IF_ON_HOST((

            int const old = *m;

            *m = (*m) || value;

            return old;

        ))

#endif

    }


//  LogicalAnd


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    int LogicalAnd (int* const m, int const value) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<int,mo,ms,as> a{*m};

        return a.fetch_and(value ? ~0x0 : 0);

#else

        AMREX_IF_ON_DEVICE((

            return atomicAnd(m, value ? ~0x0 : 0);

        ))

        AMREX_IF_ON_HOST((

            int const old = *m;

            *m = (*m) && value;

            return old;

        ))

#endif

    }


//  Exch


    template <typename T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Exch (T* address, T val) noexcept

    {

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<T,mo,ms,as> a{*address};

        return a.exchange(val);

#else

        AMREX_IF_ON_DEVICE((

            return atomicExch(address, val);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *address;

            *address = val;

            return old;

        ))

#endif

    }


//  CAS


    template <typename T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T CAS (T* const address, T compare, T const val) noexcept

    {           // cannot be T const compare because of compare_exchange_strong

#if defined(__SYCL_DEVICE_ONLY__)

        constexpr auto mo = sycl::memory_order::relaxed;

        constexpr auto ms = sycl::memory_scope::device;

        constexpr auto as = sycl::access::address_space::global_space;

        sycl::atomic_ref<T,mo,ms,as> a{*address};

        a.compare_exchange_strong(compare, val);

        return compare;

#else

        AMREX_IF_ON_DEVICE((

            return atomicCAS(address, compare, val);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *address;

            *address = (old == compare ? val : old);

            return old;

        ))

#endif

    }


//  Multiply


#ifdef AMREX_USE_GPU


    template <typename T, std::enable_if_t<sizeof(T) == sizeof(int), int> = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    T Multiply_device (T* const prod, T const value) noexcept

    {

        return detail::atomic_op<T, int>(prod,value,amrex::Multiplies<T>());

    }


    template <typename T, std::enable_if_t<sizeof(T) == sizeof(unsigned long long), int> = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    T Multiply_device (T* const prod, T const value) noexcept

    {

        return detail::atomic_op<T, unsigned long long>(prod,value,amrex::Multiplies<T>());

    }


#endif


    template<class T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Multiply (T* const prod, T const value) noexcept

    {

        AMREX_IF_ON_DEVICE((

            return Multiply_device(prod, value);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *prod;

            *prod *= value;

            return old;

        ))

    }


//  Divide


#ifdef AMREX_USE_GPU


    template <typename T, std::enable_if_t<sizeof(T) == sizeof(int), int> = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE


    T Divide_device (T* const quot, T const value) noexcept

    {

        return detail::atomic_op<T, int>(quot,value,amrex::Divides<T>());

    }


    template <typename T, std::enable_if_t<sizeof(T) == sizeof(unsigned long long), int> = 0>

    AMREX_GPU_DEVICE AMREX_FORCE_INLINE

    T Divide_device (T* const quot, T const value) noexcept

    {

        return detail::atomic_op<T, unsigned long long>(quot,value,amrex::Divides<T>());

    }


#endif


    template<class T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    T Divide (T* const quot, T const value) noexcept

    {

        AMREX_IF_ON_DEVICE((

            return Divide_device(quot, value);

        ))

        AMREX_IF_ON_HOST((

            auto const old = *quot;

            *quot /= value;

            return old;

        ))

    }


}


namespace HostDevice::Atomic {


    template <class T>

    AMREX_FORCE_INLINE


    void Add_Host (T* const sum, T const value) noexcept

    {

#ifdef AMREX_USE_OMP

#pragma omp atomic update

#endif

        *sum += value;

    }


    template <class T>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    void Add (T* const sum, T const value) noexcept

    {

        AMREX_IF_ON_DEVICE((Gpu::Atomic::AddNoRet(sum,value);))

        AMREX_IF_ON_HOST((Add_Host(sum,value);))

    }


}


#ifdef AMREX_USE_GPU

// functors

namespace Gpu {

    template <typename T>


    struct AtomicAdd

    {


        AMREX_GPU_DEVICE void operator() (T* const dest, T const source) noexcept {

            Gpu::Atomic::AddNoRet(dest, source);

        }


    };


    template <typename T>


    struct AtomicMin

    {


        AMREX_GPU_DEVICE void operator() (T* const dest, T const source) noexcept {

            Gpu::Atomic::Min(dest, source);

        }


    };


    template <typename T>


    struct AtomicMax

    {


        AMREX_GPU_DEVICE void operator() (T* const dest, T const source) noexcept {

            Gpu::Atomic::Max(dest, source);

        }


    };


    template <typename T>


    struct AtomicLogicalAnd

    {


        AMREX_GPU_DEVICE void operator() (T* const dest, T const source) noexcept {

            Gpu::Atomic::LogicalAnd(dest, source);

        }


    };


    template <typename T>


    struct AtomicLogicalOr

    {


        AMREX_GPU_DEVICE void operator() (T* const dest, T const source) noexcept {

            Gpu::Atomic::LogicalOr(dest, source);

        }


    };


}

#endif


}

#endif

AMREX_FORCE_INLINE
#define AMREX_FORCE_INLINE
Definition AMReX_Extension.H:119

AMReX_Functional.H

AMReX_GpuQualifiers.H

AMREX_IF_ON_DEVICE
#define AMREX_IF_ON_DEVICE(CODE)
Definition AMReX_GpuQualifiers.H:56

AMREX_IF_ON_HOST
#define AMREX_IF_ON_HOST(CODE)
Definition AMReX_GpuQualifiers.H:58

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

AMREX_GPU_HOST_DEVICE
#define AMREX_GPU_HOST_DEVICE
Definition AMReX_GpuQualifiers.H:20

AMReX_INT.H

amrex::Gpu::Atomic::detail::atomic_op
AMREX_GPU_DEVICE AMREX_FORCE_INLINE R atomic_op(R *const address, R const val, F const f) noexcept
Definition AMReX_GpuAtomic.H:87

amrex::Gpu::Atomic::detail::atomic_op_if
AMREX_GPU_DEVICE AMREX_FORCE_INLINE bool atomic_op_if(R *const address, R const val, Op &&op, Cond &&cond) noexcept
Definition AMReX_GpuAtomic.H:102

amrex::Gpu::Atomic::Exch
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Exch(T *address, T val) noexcept
Definition AMReX_GpuAtomic.H:485

amrex::Gpu::Atomic::If_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE bool If_device(T *const sum, T const value, Op &&op, Cond &&cond) noexcept
Definition AMReX_GpuAtomic.H:220

amrex::Gpu::Atomic::CAS
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T CAS(T *const address, T compare, T const val) noexcept
Definition AMReX_GpuAtomic.H:511

amrex::Gpu::Atomic::Add
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Add(T *sum, T value) noexcept
Definition AMReX_GpuAtomic.H:198

amrex::Gpu::Atomic::Max
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Max(T *const m, T const value) noexcept
Definition AMReX_GpuAtomic.H:417

amrex::Gpu::Atomic::LogicalOr
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE int LogicalOr(int *const m, int const value) noexcept
Definition AMReX_GpuAtomic.H:434

amrex::Gpu::Atomic::Multiply
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Multiply(T *const prod, T const value) noexcept
Definition AMReX_GpuAtomic.H:556

amrex::Gpu::Atomic::Divide_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE T Divide_device(T *const quot, T const value) noexcept
Definition AMReX_GpuAtomic.H:576

amrex::Gpu::Atomic::LogicalAnd
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE int LogicalAnd(int *const m, int const value) noexcept
Definition AMReX_GpuAtomic.H:459

amrex::Gpu::Atomic::Min
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Min(T *const m, T const value) noexcept
Definition AMReX_GpuAtomic.H:354

amrex::Gpu::Atomic::Divide
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE T Divide(T *const quot, T const value) noexcept
Definition AMReX_GpuAtomic.H:592

amrex::Gpu::Atomic::Add_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE T Add_device(T *const sum, T const value) noexcept
Definition AMReX_GpuAtomic.H:135

amrex::Gpu::Atomic::AddNoRet
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void AddNoRet(T *sum, T value) noexcept
Definition AMReX_GpuAtomic.H:281

amrex::Gpu::Atomic::If
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE bool If(T *const add, T const value, Op &&op, Cond &&cond) noexcept
Conditionally perform an atomic operation.
Definition AMReX_GpuAtomic.H:254

amrex::Gpu::Atomic::Min_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE T Min_device(T *const m, T const value) noexcept
Definition AMReX_GpuAtomic.H:311

amrex::Gpu::Atomic::Max_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE T Max_device(T *const m, T const value) noexcept
Definition AMReX_GpuAtomic.H:374

amrex::Gpu::Atomic::Multiply_device
AMREX_GPU_DEVICE AMREX_FORCE_INLINE T Multiply_device(T *const prod, T const value) noexcept
Definition AMReX_GpuAtomic.H:540

amrex::HostDevice::Atomic::Add
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void Add(T *const sum, T const value) noexcept
Definition AMReX_GpuAtomic.H:619

amrex::HostDevice::Atomic::Add_Host
AMREX_FORCE_INLINE void Add_Host(T *const sum, T const value) noexcept
Definition AMReX_GpuAtomic.H:609

amrex
Definition AMReX_Amr.cpp:49

amrex::Order::F
@ F

amrex::RunOn::Gpu
@ Gpu

amrex::ignore_unused
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void ignore_unused(const Ts &...)
This shuts up the compiler about unused variables.
Definition AMReX.H:127

detail
Definition AMReX_FabArrayCommI.H:896

amrex::Divides
Definition AMReX_Functional.H:77

amrex::Gpu::AtomicAdd
Definition AMReX_GpuAtomic.H:632

amrex::Gpu::AtomicAdd::operator()
AMREX_GPU_DEVICE void operator()(T *const dest, T const source) noexcept
Definition AMReX_GpuAtomic.H:633

amrex::Gpu::AtomicLogicalAnd
Definition AMReX_GpuAtomic.H:656

amrex::Gpu::AtomicLogicalAnd::operator()
AMREX_GPU_DEVICE void operator()(T *const dest, T const source) noexcept
Definition AMReX_GpuAtomic.H:657

amrex::Gpu::AtomicLogicalOr
Definition AMReX_GpuAtomic.H:664

amrex::Gpu::AtomicLogicalOr::operator()
AMREX_GPU_DEVICE void operator()(T *const dest, T const source) noexcept
Definition AMReX_GpuAtomic.H:665

amrex::Gpu::AtomicMax
Definition AMReX_GpuAtomic.H:648

amrex::Gpu::AtomicMax::operator()
AMREX_GPU_DEVICE void operator()(T *const dest, T const source) noexcept
Definition AMReX_GpuAtomic.H:649

amrex::Gpu::AtomicMin
Definition AMReX_GpuAtomic.H:640

amrex::Gpu::AtomicMin::operator()
AMREX_GPU_DEVICE void operator()(T *const dest, T const source) noexcept
Definition AMReX_GpuAtomic.H:641

amrex::LogicalAnd
Definition AMReX_Functional.H:50

amrex::LogicalOr
Definition AMReX_Functional.H:59

amrex::Maximum
Definition AMReX_Functional.H:41

amrex::Minimum
Definition AMReX_Functional.H:32

amrex::Multiplies
Definition AMReX_Functional.H:68

amrex::Plus
Definition AMReX_Functional.H:14