amrex/doxygen/AMReX__RungeKutta_8H_source.html

#ifndef AMREX_RUNGE_KUTTA_H_

#define AMREX_RUNGE_KUTTA_H_

#include <AMReX_Config.H>


#include <AMReX_FabArray.H>


namespace amrex::RungeKutta {


struct PostStageNoOp {

    template <typename MF>

    std::enable_if_t<IsFabArray<MF>::value> operator() (int, MF&) const {}

};


namespace detail {

template <typename MF>


void rk_update (MF& Unew, MF const& Uold, MF const& dUdt, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot = dUdt.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

            snew[bi](i,j,k,n) = sold[bi](i,j,k,n) + dt*sdot[bi](i,j,k,n);

    });

    Gpu::streamSynchronize();

}


template <typename MF>


void rk_update (MF& Unew, MF const& Uold, MF const& dUdt1, MF const& dUdt2, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot1 = dUdt1.const_arrays();

    auto const& sdot2 = dUdt2.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

            snew[bi](i,j,k,n) = sold[bi](i,j,k,n) + dt*(sdot1[bi](i,j,k,n) +

                                                        sdot2[bi](i,j,k,n));

    });

    Gpu::streamSynchronize();

}


template <typename MF>


void rk2_update_2 (MF& Unew, MF const& Uold, MF const& dUdt, Real dt)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& sdot = dUdt.const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = Real(0.5)*(snew[bi](i,j,k,n) +

                                       sold[bi](i,j,k,n) +

                                       sdot[bi](i,j,k,n) * dt);

    });

    Gpu::streamSynchronize();

}


template <typename MF>


void rk3_update_3 (MF& Unew, MF const& Uold, Array<MF,3> const& rkk, Real dt6)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& k1 = rkk[0].const_arrays();

    auto const& k2 = rkk[1].const_arrays();

    auto const& k3 = rkk[2].const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = sold[bi](i,j,k,n)

            + dt6 * (k1[bi](i,j,k,n) + k2[bi](i,j,k,n)

                     +      Real(4.) * k3[bi](i,j,k,n));

    });

    Gpu::streamSynchronize();

}


template <typename MF>


void rk4_update_4 (MF& Unew, MF const& Uold, Array<MF,4> const& rkk, Real dt6)

{

    auto const& snew = Unew.arrays();

    auto const& sold = Uold.const_arrays();

    auto const& k1 = rkk[0].const_arrays();

    auto const& k2 = rkk[1].const_arrays();

    auto const& k3 = rkk[2].const_arrays();

    auto const& k4 = rkk[3].const_arrays();

    amrex::ParallelFor(Unew, IntVect(0), Unew.nComp(), [=] AMREX_GPU_DEVICE

                       (int bi, int i, int j, int k, int n) noexcept

    {

        snew[bi](i,j,k,n) = sold[bi](i,j,k,n)

            + dt6 * (            k1[bi](i,j,k,n) + k4[bi](i,j,k,n)

                     + Real(2.)*(k2[bi](i,j,k,n) + k3[bi](i,j,k,n)));

    });

    Gpu::streamSynchronize();

}


}


template <typename MF, typename F, typename FB, typename P = PostStageNoOp>


void RK2 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta2");


    MF dUdt(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

            MFInfo(), Unew.Factory());


    // RK2 stage 1

    fillbndry(1, Uold, time);

    frhs(1, dUdt, Uold, time, Real(0.5)*dt);

    // Unew = Uold + dt * dUdt

    detail::rk_update(Unew, Uold, dUdt, dt);

    post_stage(1, Unew);


    // RK2 stage 2

    fillbndry(2, Unew, time+dt);

    frhs(2, dUdt, Unew, time, Real(0.5)*dt);

    // Unew = (Uold+Unew)/2 + dUdt_2 * dt/2,

    // which is Unew = Uold + dt/2 * (dUdt_1 + dUdt_2)

    detail::rk2_update_2(Unew, Uold, dUdt, dt);

    post_stage(2, Unew);

}


template <typename MF, typename F, typename FB, typename R,

          typename P = PostStageNoOp>


void RK3 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          R const& store_crse_data, P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta3");


    Array<MF,3> rkk;

    for (auto& mf : rkk) {

        mf.define(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

                  MFInfo(), Unew.Factory());

    }


    // RK3 stage 1

    fillbndry(1, Uold, time);

    frhs(1, rkk[0], Uold, time, dt/Real(6.));

    // Unew = Uold + k1 * dt

    detail::rk_update(Unew, Uold, rkk[0], dt);

    post_stage(1, Unew);


    // RK3 stage 2

    fillbndry(2, Unew, time+dt);

    frhs(2, rkk[1], Unew, time+dt, dt/Real(6.));

    // Unew = Uold + (k1+k2) * dt/4

    detail::rk_update(Unew, Uold, rkk[0], rkk[1], Real(0.25)*dt);

    post_stage(2, Unew);


    // RK3 stage 3

    Real t_half = time + Real(0.5)*dt;

    fillbndry(3, Unew, t_half);

    frhs(3, rkk[2], Unew, t_half, dt*Real(2./3.));

    // Unew = Uold + (k1/6 + k2/6 + k3*(2/3)) * dt

    detail::rk3_update_3(Unew, Uold, rkk, Real(1./6.)*dt);

    post_stage(3, Unew);


    store_crse_data(rkk);

}


template <typename MF, typename F, typename FB, typename R,

          typename P = PostStageNoOp>


void RK4 (MF& Uold, MF& Unew, Real time, Real dt, F const& frhs, FB const& fillbndry,

          R const& store_crse_data, P const& post_stage = PostStageNoOp())

{

    BL_PROFILE("RungeKutta4");


    Array<MF,4> rkk;

    for (auto& mf : rkk) {

        mf.define(Unew.boxArray(), Unew.DistributionMap(), Unew.nComp(), 0,

                  MFInfo(), Unew.Factory());

    }


    // RK4 stage 1

    fillbndry(1, Uold, time);

    frhs(1, rkk[0], Uold, time, dt/Real(6.));

    // Unew = Uold + k1 * dt/2

    detail::rk_update(Unew, Uold, rkk[0], Real(0.5)*dt);

    post_stage(1, Unew);


    // RK4 stage 2

    Real t_half = time + Real(0.5)*dt;

    fillbndry(2, Unew, t_half);

    frhs(2, rkk[1], Unew, t_half, dt/Real(3.));

    // Unew = Uold + k2 * dt/2

    detail::rk_update(Unew, Uold, rkk[1], Real(0.5)*dt);

    post_stage(2, Unew);


    // RK4 stage 3

    fillbndry(3, Unew, t_half);

    frhs(3, rkk[2], Unew, t_half, dt/Real(3.));

    // Unew = Uold + k3 * dt;

    detail::rk_update(Unew, Uold, rkk[2], dt);

    post_stage(3, Unew);


    // RK4 stage 4

    fillbndry(4, Unew, time+dt);

    frhs(4, rkk[3], Unew, time+dt, dt/Real(6.));

    // Unew = Uold + (k1/6 + k2/3 + k3/3 + k4/6) * dt

    detail::rk4_update_4(Unew, Uold, rkk, Real(1./6.)*dt);

    post_stage(4, Unew);


    store_crse_data(rkk);

}


}


#endif

BL_PROFILE
#define BL_PROFILE(a)
Definition AMReX_BLProfiler.H:551

AMReX_FabArray.H

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

amrex::Gpu::streamSynchronize
void streamSynchronize() noexcept
Definition AMReX_GpuDevice.H:237

amrex::RungeKutta::detail::rk3_update_3
void rk3_update_3(MF &Unew, MF const &Uold, Array< MF, 3 > const &rkk, Real dt6)
Unew = Uold + (k1 + k2 + 4*k3) * dt6, where dt6 = dt/6.
Definition AMReX_RungeKutta.H:108

amrex::RungeKutta::detail::rk2_update_2
void rk2_update_2(MF &Unew, MF const &Uold, MF const &dUdt, Real dt)
Unew = (Uold+Unew)/2 + dUdt * dt/2.
Definition AMReX_RungeKutta.H:91

amrex::RungeKutta::detail::rk4_update_4
void rk4_update_4(MF &Unew, MF const &Uold, Array< MF, 4 > const &rkk, Real dt6)
Unew = Uold + (k1+k4+2*(k2+k3))*dt6, where dt6 = dt/6.
Definition AMReX_RungeKutta.H:127

amrex::RungeKutta::detail::rk_update
void rk_update(MF &Unew, MF const &Uold, MF const &dUdt, Real dt)
Unew = Uold + dUdt * dt.
Definition AMReX_RungeKutta.H:59

amrex::RungeKutta
Functions for Runge-Kutta methods.
Definition AMReX_RungeKutta.H:49

amrex::RungeKutta::RK2
void RK2(MF &Uold, MF &Unew, Real time, Real dt, F const &frhs, FB const &fillbndry, P const &post_stage=PostStageNoOp())
Time stepping with RK2.
Definition AMReX_RungeKutta.H:158

amrex::RungeKutta::RK3
void RK3(MF &Uold, MF &Unew, Real time, Real dt, F const &frhs, FB const &fillbndry, R const &store_crse_data, P const &post_stage=PostStageNoOp())
Time stepping with RK3.
Definition AMReX_RungeKutta.H:196

amrex::Order::F
@ F

amrex::ParallelFor
std::enable_if_t< std::is_integral_v< T > > ParallelFor(TypeList< CTOs... > ctos, std::array< int, sizeof...(CTOs)> const &runtime_options, T N, F &&f)
Definition AMReX_CTOParallelForImpl.H:191

amrex::IntVect
IntVectND< AMREX_SPACEDIM > IntVect
Definition AMReX_BaseFwd.H:30

amrex::ButcherTableauTypes::RK4
@ RK4

amrex::Array
std::array< T, N > Array
Definition AMReX_Array.H:24

detail
Definition AMReX_FabArrayCommI.H:896

amrex::MFInfo
FabArray memory allocation information.
Definition AMReX_FabArray.H:66

amrex::RungeKutta::PostStageNoOp
Definition AMReX_RungeKutta.H:51

amrex::RungeKutta::PostStageNoOp::operator()
std::enable_if_t< IsFabArray< MF >::value > operator()(int, MF &) const
Definition AMReX_RungeKutta.H:53