docs_html/doxygen/AMReX__RungeKutta_8H_source.html

#ifndef AMREX_RUNGE_KUTTA_H_

#define AMREX_RUNGE_KUTTA_H_

#include <AMReX_Config.H>


#include <AMReX_Concepts.H>

#include <AMReX_FabArray.H>


namespace amrex::RungeKutta {


struct PostStageNoOp {

    template <FabArrayType MF>

    void operator() (int, MF&) const {}

};


namespace detail {

template <typename MF>

void rk_update (MF& Unew, MF const& Uold, MF const& dUdt, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot = dUdt.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

            snew[bi](i,j,k,n) = sold[bi](i,j,k,n) + dt*sdot[bi](i,j,k,n);

    });

    if (!Gpu::inNoSyncRegion()) {

        Gpu::streamSynchronize();

    }

}


template <typename MF>

void rk_update (MF& Unew, MF const& Uold, MF const& dUdt1, MF const& dUdt2, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot1 = dUdt1.const_arrays();

    auto const& sdot2 = dUdt2.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

            snew[bi](i,j,k,n) = sold[bi](i,j,k,n) + dt*(sdot1[bi](i,j,k,n) +

                                                        sdot2[bi](i,j,k,n));

    });

    if (!Gpu::inNoSyncRegion()) {

        Gpu::streamSynchronize();

    }

}


template <typename MF>

void rk2_update_2 (MF& Unew, MF const& Uold, MF const& dUdt, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot = dUdt.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = Real(0.5)*(snew[bi](i,j,k,n) +

                                       sold[bi](i,j,k,n) +

                                       sdot[bi](i,j,k,n) * dt);

    });

    if (!Gpu::inNoSyncRegion()) {

        Gpu::streamSynchronize();

    }

}


template <typename MF>

void rk3_update_3 (MF& Unew, MF const& Uold, Array<MF,3> const& rkk, Real dt6)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& k1 = rkk[0].const_arrays();

    auto const& k2 = rkk[1].const_arrays();

    auto const& k3 = rkk[2].const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = sold[bi](i,j,k,n)

            + dt6 * (k1[bi](i,j,k,n) + k2[bi](i,j,k,n)

                     +      Real(4.) * k3[bi](i,j,k,n));

    });

    if (!Gpu::inNoSyncRegion()) {

        Gpu::streamSynchronize();

    }

}


template <typename MF>

void rk4_update_4 (MF& Unew, MF const& Uold, Array<MF,4> const& rkk, Real dt6)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& k1 = rkk[0].const_arrays();

    auto const& k2 = rkk[1].const_arrays();

    auto const& k3 = rkk[2].const_arrays();

    auto const& k4 = rkk[3].const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = sold[bi](i,j,k,n)

            + dt6 * (            k1[bi](i,j,k,n) + k4[bi](i,j,k,n)

                     + Real(2.)*(k2[bi](i,j,k,n) + k3[bi](i,j,k,n)));

    });

    if (!Gpu::inNoSyncRegion()) {

        Gpu::streamSynchronize();

    }

}

}


template <typename MF, typename F, typename FB, typename P = PostStageNoOp>


void RK2 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta2");


    MF dUdt(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

            MFInfo().SetArena(The_Async_Arena()), Unew.Factory());


    // RK2 stage 1

    fillbndry(1, Uold, time);

    frhs(1, dUdt, Uold, time, Real(0.5)*dt);

    // Unew = Uold + dt * dUdt

    detail::rk_update(Unew, Uold, dUdt, dt);

    post_stage(1, Unew);


    // RK2 stage 2

    fillbndry(2, Unew, time+dt);

    frhs(2, dUdt, Unew, time+dt, Real(0.5)*dt);

    // Unew = (Uold+Unew)/2 + dUdt_2 * dt/2,

    // which is Unew = Uold + dt/2 * (dUdt_1 + dUdt_2)

    detail::rk2_update_2(Unew, Uold, dUdt, dt);

    post_stage(2, Unew);

}


template <typename MF, typename F, typename FB, typename R,

          typename P = PostStageNoOp>


void RK3 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          R const& store_crse_data, P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta3");


    Array<MF,3> rkk;

    for (auto& mf : rkk) {

        mf.define(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

                  MFInfo().SetArena(The_Async_Arena()), Unew.Factory());

    }


    // RK3 stage 1

    fillbndry(1, Uold, time);

    frhs(1, rkk[0], Uold, time, dt/Real(6.));

    // Unew = Uold + k1 * dt

    detail::rk_update(Unew, Uold, rkk[0], dt);

    post_stage(1, Unew);


    // RK3 stage 2

    fillbndry(2, Unew, time+dt);

    frhs(2, rkk[1], Unew, time+dt, dt/Real(6.));

    // Unew = Uold + (k1+k2) * dt/4

    detail::rk_update(Unew, Uold, rkk[0], rkk[1], Real(0.25)*dt);

    post_stage(2, Unew);


    // RK3 stage 3

    Real t_half = time + Real(0.5)*dt;

    fillbndry(3, Unew, t_half);

    frhs(3, rkk[2], Unew, t_half, dt*Real(2./3.));

    // Unew = Uold + (k1/6 + k2/6 + k3*(2/3)) * dt

    detail::rk3_update_3(Unew, Uold, rkk, Real(1./6.)*dt);

    post_stage(3, Unew);


    store_crse_data(rkk);

}


template <typename MF, typename F, typename FB, typename R,

          typename P = PostStageNoOp>


void RK4 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          R const& store_crse_data, P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta4");


    Array<MF,4> rkk;

    for (auto& mf : rkk) {

        mf.define(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

                  MFInfo().SetArena(The_Async_Arena()), Unew.Factory());

    }


    // RK4 stage 1

    fillbndry(1, Uold, time);

    frhs(1, rkk[0], Uold, time, dt/Real(6.));

    // Unew = Uold + k1 * dt/2

    detail::rk_update(Unew, Uold, rkk[0], Real(0.5)*dt);

    post_stage(1, Unew);


    // RK4 stage 2

    Real t_half = time + Real(0.5)*dt;

    fillbndry(2, Unew, t_half);

    frhs(2, rkk[1], Unew, t_half, dt/Real(3.));

    // Unew = Uold + k2 * dt/2

    detail::rk_update(Unew, Uold, rkk[1], Real(0.5)*dt);

    post_stage(2, Unew);


    // RK4 stage 3

    fillbndry(3, Unew, t_half);

    frhs(3, rkk[2], Unew, t_half, dt/Real(3.));

    // Unew = Uold + k3 * dt;

    detail::rk_update(Unew, Uold, rkk[2], dt);

    post_stage(3, Unew);


    // RK4 stage 4

    fillbndry(4, Unew, time+dt);

    frhs(4, rkk[3], Unew, time+dt, dt/Real(6.));

    // Unew = Uold + (k1/6 + k2/3 + k3/3 + k4/6) * dt

    detail::rk4_update_4(Unew, Uold, rkk, Real(1./6.)*dt);

    post_stage(4, Unew);


    store_crse_data(rkk);

}


}


#endif

BL_PROFILE
#define BL_PROFILE(a)
Definition AMReX_BLProfiler.H:551

AMReX_Concepts.H

AMReX_FabArray.H

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

amrex::IntVectND< 3 >

amrex::Real
amrex_real Real
Floating Point Type for Fields.
Definition AMReX_REAL.H:79

amrex::Array
std::array< T, N > Array
Definition AMReX_Array.H:31

amrex::The_Async_Arena
Arena * The_Async_Arena()
Definition AMReX_Arena.cpp:830

amrex::RungeKutta
Functions for Runge-Kutta methods.
Definition AMReX_RungeKutta.H:50

amrex::RungeKutta::RK2
void RK2(MF &Uold, MF &Unew, Real time, Real dt, F const &frhs, FB const &fillbndry, P const &post_stage=PostStageNoOp())
Time stepping with RK2.
Definition AMReX_RungeKutta.H:171

amrex::RungeKutta::RK3
void RK3(MF &Uold, MF &Unew, Real time, Real dt, F const &frhs, FB const &fillbndry, R const &store_crse_data, P const &post_stage=PostStageNoOp())
Time stepping with RK3.
Definition AMReX_RungeKutta.H:210

amrex::Order::F
@ F

amrex::ParallelFor
void ParallelFor(TypeList< CTOs... > ctos, std::array< int, sizeof...(CTOs)> const &runtime_options, T N, F &&f)
Definition AMReX_CTOParallelForImpl.H:202

amrex::IntVect
IntVectND< 3 > IntVect
IntVect is an alias for amrex::IntVectND instantiated with AMREX_SPACEDIM.
Definition AMReX_BaseFwd.H:38

amrex::ButcherTableauTypes::RK4
@ RK4

amrex::MFInfo
FabArray memory allocation information.
Definition AMReX_FabArray.H:68

amrex::MFInfo::SetArena
MFInfo & SetArena(Arena *ar) noexcept
Definition AMReX_FabArray.H:79

amrex::RungeKutta::PostStageNoOp
Definition AMReX_RungeKutta.H:52

amrex::RungeKutta::PostStageNoOp::operator()
void operator()(int, MF &) const
Definition AMReX_RungeKutta.H:54