amrex/doxygen/AMReX__MLNodeLap__2D__K_8H_source.html

#ifndef AMREX_MLNODELAP_2D_K_H_

#define AMREX_MLNODELAP_2D_K_H_

#include <AMReX_Config.H>


namespace amrex {


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_zero_fine (int i, int j, int, Array4<Real> const& phi,

                        Array4<int const> const& msk, int fine_flag) noexcept

{

    // Testing if the node is covered by a fine level in computing

    // coarse sync residual

    if (msk(i-1,j-1,0) == fine_flag &&

        msk(i  ,j-1,0) == fine_flag &&

        msk(i-1,j  ,0) == fine_flag &&

        msk(i  ,j  ,0) == fine_flag)

    {

        phi(i,j,0) = Real(0.0);

    }

}


//

// coeffs

//


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_avgdown_coeff_x (int i, int j, int k, Array4<Real> const& crse,

                              Array4<Real const> const& fine) noexcept

{

    Real a = fine(2*i  ,2*j,k) + fine(2*i  ,2*j+1,k);

    Real b = fine(2*i+1,2*j,k) + fine(2*i+1,2*j+1,k);

    crse(i,j,k) = a*b/(a+b);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_avgdown_coeff_y (int i, int j, int k, Array4<Real> const& crse,

                              Array4<Real const> const& fine) noexcept

{

    Real a = fine(2*i,2*j  ,k) + fine(2*i+1,2*j  ,k);

    Real b = fine(2*i,2*j+1,k) + fine(2*i+1,2*j+1,k);

    crse(i,j,k) = a*b/(a+b);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_semi_avgdown_coeff (int i, int j, int k, Array4<Real> const& crse,

                              Array4<Real const> const& fine, int idir) noexcept

{

    if (idir == 1) {

        Real a = fine(2*i  ,j,k);

        Real b = fine(2*i+1,j,k);

        crse(i,j,k) = Real(2.0)*a*b/(a+b);

    } else {

        Real a = fine(i,2*j  ,k);

        Real b = fine(i,2*j+1,k);

        crse(i,j,k) = Real(2.0)*a*b/(a+b);

    }

}


//

// operator

//


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


Real mlndlap_adotx_ha (int i, int j, int k, Array4<Real const> const& x,

                       Array4<Real const> const& sx, Array4<Real const> const& sy,

                       Array4<int const> const& msk, bool is_rz,

                       GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    if (msk(i,j,k)) {

        return Real(0.0);

    } else {

        Real facx = Real(1./6.)*dxinv[0]*dxinv[0];

        Real facy = Real(1./6.)*dxinv[1]*dxinv[1];

        Real y   = x(i-1,j-1,k)*(facx*sx(i-1,j-1,k)+facy*sy(i-1,j-1,k))

               +   x(i+1,j-1,k)*(facx*sx(i  ,j-1,k)+facy*sy(i  ,j-1,k))

               +   x(i-1,j+1,k)*(facx*sx(i-1,j  ,k)+facy*sy(i-1,j  ,k))

               +   x(i+1,j+1,k)*(facx*sx(i  ,j  ,k)+facy*sy(i  ,j  ,k))

               +   x(i-1,j,k)*(Real(2.0)*facx*(sx(i-1,j-1,k)+sx(i-1,j,k))

                                   -     facy*(sy(i-1,j-1,k)+sy(i-1,j,k)))

               +   x(i+1,j,k)*(Real(2.0)*facx*(sx(i  ,j-1,k)+sx(i  ,j,k))

                                   -     facy*(sy(i  ,j-1,k)+sy(i  ,j,k)))

               +   x(i,j-1,k)*(   -facx*(sx(i-1,j-1,k)+sx(i,j-1,k))

                        +Real(2.0)*facy*(sy(i-1,j-1,k)+sy(i,j-1,k)))

               +   x(i,j+1,k)*(   -facx*(sx(i-1,j  ,k)+sx(i,j  ,k))

                        +Real(2.0)*facy*(sy(i-1,j  ,k)+sy(i,j  ,k)))

               +   x(i,j,k)*(-Real(2.0))*(facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

                                         +facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));

        if (is_rz) {

            Real fp = facy / static_cast<Real>(2*i+1);

            Real fm = facy / static_cast<Real>(2*i-1);

            y += (fm*sy(i-1,j  ,k)-fp*sy(i,j  ,k))*(x(i,j+1,k)-x(i,j,k))

               + (fm*sy(i-1,j-1,k)-fp*sy(i,j-1,k))*(x(i,j-1,k)-x(i,j,k));

        }

        return y;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


Real mlndlap_adotx_aa (int i, int j, int k, Array4<Real const> const& x,

                       Array4<Real const> const& sig, Array4<int const> const& msk,

                       bool is_rz, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    if (msk(i,j,k)) {

        return Real(0.0);

    } else {

        Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

        Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

        Real fxy = facx + facy;

        Real f2xmy = Real(2.0)*facx - facy;

        Real fmx2y = Real(2.0)*facy - facx;

        Real y   = x(i-1,j-1,k)*fxy*sig(i-1,j-1,k)

               +   x(i+1,j-1,k)*fxy*sig(i  ,j-1,k)

               +   x(i-1,j+1,k)*fxy*sig(i-1,j  ,k)

               +   x(i+1,j+1,k)*fxy*sig(i  ,j  ,k)

               +   x(i-1,j,k)*f2xmy*(sig(i-1,j-1,k)+sig(i-1,j,k))

               +   x(i+1,j,k)*f2xmy*(sig(i  ,j-1,k)+sig(i  ,j,k))

               +   x(i,j-1,k)*fmx2y*(sig(i-1,j-1,k)+sig(i,j-1,k))

               +   x(i,j+1,k)*fmx2y*(sig(i-1,j  ,k)+sig(i,j  ,k))

               +   x(i,j,k)*(-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)

                                             +sig(i-1,j,k)+sig(i,j,k));

        if (is_rz) {

            Real fp = facy / static_cast<Real>(2*i+1);

            Real fm = facy / static_cast<Real>(2*i-1);

            y += (fm*sig(i-1,j  ,k)-fp*sig(i,j  ,k))*(x(i,j+1,k)-x(i,j,k))

               + (fm*sig(i-1,j-1,k)-fp*sig(i,j-1,k))*(x(i,j-1,k)-x(i,j,k));

        }

        return y;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


Real mlndlap_adotx_c (int i, int j, int k, Array4<Real const> const& x,

                      Real sigma, Array4<int const> const& msk,

                      bool is_rz, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    if (msk(i,j,k)) {

        return Real(0.0);

    } else {

        Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

        Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

        Real fxy = facx + facy;

        Real f2xmy = Real(2.0)*facx - facy;

        Real fmx2y = Real(2.0)*facy - facx;

        Real y  = (x(i-1,j-1,k)*fxy

               +   x(i+1,j-1,k)*fxy

               +   x(i-1,j+1,k)*fxy

               +   x(i+1,j+1,k)*fxy

               +   x(i-1,j,k)*f2xmy*Real(2.)

               +   x(i+1,j,k)*f2xmy*Real(2.)

               +   x(i,j-1,k)*fmx2y*Real(2.)

               +   x(i,j+1,k)*fmx2y*Real(2.)

               +   x(i,j,k)*(-Real(2.0))*fxy*Real(4.));

        if (is_rz) {

            Real fp = facy / static_cast<Real>(2*i+1);

            Real fm = facy / static_cast<Real>(2*i-1);

            y += ((fm-fp)*(x(i,j+1,k)-x(i,j,k))

               +  (fm-fp)*(x(i,j-1,k)-x(i,j,k)));

        }

        return y * sigma;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_normalize_ha (int i, int j, int k, Array4<Real> const& x, Array4<Real const> const& sx,

                           Array4<Real const> const& sy, Array4<int const> const& msk,

                           GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];


    if (!msk(i,j,k)) {

        x(i,j,k) /= (-Real(2.0))*(facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

                                 +facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_normalize_aa (int i, int j, int k, Array4<Real> const& x, Array4<Real const> const& sig,

                           Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;


    if (!msk(i,j,k)) {

        x(i,j,k) /= (-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k));

    }

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE


void mlndlap_jacobi_ha (int i, int j, int k, Array4<Real> const& sol, Real Ax,

                        Array4<Real const> const& rhs, Array4<Real const> const& sx,

                        Array4<Real const> const& sy, Array4<int const> const& msk,

                        GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = -Real(2.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = -Real(2.0/6.0)*dxinv[1]*dxinv[1];


    if (msk(i,j,k)) {

        sol(i,j,k) = Real(0.0);

    } else {

        sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax)

            / (facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

            +  facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));

    }

}


inline


void mlndlap_jacobi_ha (Box const& bx, Array4<Real> const& sol, Array4<Real const> const& Ax,

                        Array4<Real const> const& rhs, Array4<Real const> const& sx,

                        Array4<Real const> const& sy, Array4<int const> const& msk,

                        GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = -Real(2.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = -Real(2.0/6.0)*dxinv[1]*dxinv[1];


    amrex::LoopConcurrentOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax(i,j,k))

                / (facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

                +  facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));

        }

    });

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_jacobi_aa (int i, int j, int k, Array4<Real> const& sol, Real Ax,

                        Array4<Real const> const& rhs, Array4<Real const> const& sig,

                        Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real fac = -Real(2.0/6.0)*(dxinv[0]*dxinv[0] + dxinv[1]*dxinv[1]);


    if (msk(i,j,k)) {

        sol(i,j,k) = Real(0.0);

    } else {

        sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax)

            / (fac*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k)));

    }

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_jacobi_c (int i, int j, int k, Array4<Real> const& sol, Real Ax,

                       Array4<Real const> const& rhs, Real sig,

                       Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real fac = -Real(2.0/6.0)*(dxinv[0]*dxinv[0] + dxinv[1]*dxinv[1]);


    if (msk(i,j,k)) {

        sol(i,j,k) = Real(0.0);

    } else {

        sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax)

            / (fac*Real(4.)*sig);

    }

}


inline

void mlndlap_jacobi_aa (Box const& bx, Array4<Real> const& sol, Array4<Real const> const& Ax,

                        Array4<Real const> const& rhs, Array4<Real const> const& sig,

                        Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real fac = -Real(2.0/6.0)*(dxinv[0]*dxinv[0] + dxinv[1]*dxinv[1]);


    amrex::LoopConcurrentOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax(i,j,k))

                / (fac*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k)));

        }

    });

}


inline

void mlndlap_jacobi_c (Box const& bx, Array4<Real> const& sol, Array4<Real const> const& Ax,

                       Array4<Real const> const& rhs, Real sig,

                       Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real fac = -Real(2.0/6.0)*(dxinv[0]*dxinv[0] + dxinv[1]*dxinv[1]);


    amrex::LoopConcurrentOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            sol(i,j,k) += Real(2.0/3.0) * (rhs(i,j,k) - Ax(i,j,k))

                / (fac*Real(4.)*sig);

        }

    });

}


inline


void mlndlap_gauss_seidel_ha (Box const& bx, Array4<Real> const& sol,

                              Array4<Real const> const& rhs, Array4<Real const> const& sx,

                              Array4<Real const> const& sy, Array4<int const> const& msk,

                              GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                              bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];


    amrex::LoopOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real s0 = Real(-2.0)*(facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

                                 +facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));


            Real Ax = sol(i-1,j-1,k)*(facx*sx(i-1,j-1,k)+facy*sy(i-1,j-1,k))

                    + sol(i+1,j-1,k)*(facx*sx(i  ,j-1,k)+facy*sy(i  ,j-1,k))

                    + sol(i-1,j+1,k)*(facx*sx(i-1,j  ,k)+facy*sy(i-1,j  ,k))

                    + sol(i+1,j+1,k)*(facx*sx(i  ,j  ,k)+facy*sy(i  ,j  ,k))

                    + sol(i-1,j,k)*(Real(2.0)*facx*(sx(i-1,j-1,k)+sx(i-1,j,k))

                                        -     facy*(sy(i-1,j-1,k)+sy(i-1,j,k)))

                    + sol(i+1,j,k)*(Real(2.0)*facx*(sx(i  ,j-1,k)+sx(i  ,j,k))

                                        -     facy*(sy(i  ,j-1,k)+sy(i  ,j,k)))

                    + sol(i,j-1,k)*(   -facx*(sx(i-1,j-1,k)+sx(i,j-1,k))

                             +Real(2.0)*facy*(sy(i-1,j-1,k)+sy(i,j-1,k)))

                    + sol(i,j+1,k)*(   -facx*(sx(i-1,j  ,k)+sx(i,j  ,k))

                             +Real(2.0)*facy*(sy(i-1,j  ,k)+sy(i,j  ,k)))

                    + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm*sy(i-1,j-1,k)-fp*sy(i,j-1,k);

                Real frzhi = fm*sy(i-1,j  ,k)-fp*sy(i,j  ,k);

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax) / s0;

        }

    });

}


inline


void mlndlap_gauss_seidel_aa (Box const& bx, Array4<Real> const& sol,

                              Array4<Real const> const& rhs, Array4<Real const> const& sig,

                              Array4<int const> const& msk,

                              GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                              bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    amrex::LoopOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real s0 = (-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k));

            Real Ax =   sol(i-1,j-1,k)*fxy*sig(i-1,j-1,k)

                      + sol(i+1,j-1,k)*fxy*sig(i  ,j-1,k)

                      + sol(i-1,j+1,k)*fxy*sig(i-1,j  ,k)

                      + sol(i+1,j+1,k)*fxy*sig(i  ,j  ,k)

                      + sol(i-1,j,k)*f2xmy*(sig(i-1,j-1,k)+sig(i-1,j,k))

                      + sol(i+1,j,k)*f2xmy*(sig(i  ,j-1,k)+sig(i  ,j,k))

                      + sol(i,j-1,k)*fmx2y*(sig(i-1,j-1,k)+sig(i,j-1,k))

                      + sol(i,j+1,k)*fmx2y*(sig(i-1,j  ,k)+sig(i,j  ,k))

                      + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm*sig(i-1,j-1,k)-fp*sig(i,j-1,k);

                Real frzhi = fm*sig(i-1,j  ,k)-fp*sig(i,j  ,k);

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax) / s0;

        }

    });

}


inline


void mlndlap_gauss_seidel_c (Box const& bx, Array4<Real> const& sol,

                             Array4<Real const> const& rhs, Real sig,

                             Array4<int const> const& msk,

                             GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                             bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    amrex::LoopOnCpu(bx, [&] (int i, int j, int k) noexcept

    {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real s0 = (-Real(2.0))*fxy*Real(4.);

            Real Ax =   sol(i-1,j-1,k)*fxy

                      + sol(i+1,j-1,k)*fxy

                      + sol(i-1,j+1,k)*fxy

                      + sol(i+1,j+1,k)*fxy

                      + sol(i-1,j,k)*f2xmy*Real(2.)

                      + sol(i+1,j,k)*f2xmy*Real(2.)

                      + sol(i,j-1,k)*fmx2y*Real(2.)

                      + sol(i,j+1,k)*fmx2y*Real(2.)

                      + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm-fp;

                Real frzhi = fm-fp;

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax*sig) / (s0*sig);

        }

    });

}


AMREX_FORCE_INLINE


void tridiagonal_solve (Array1D<Real,0,31>& a_ls, Array1D<Real,0,31>& b_ls, Array1D<Real,0,31>& c_ls,

                        Array1D<Real,0,31>& r_ls, Array1D<Real,0,31>& u_ls, Array1D<Real,0,31>& gam,

                        int ilen ) noexcept

{

    Real bet = b_ls(0);

    u_ls(0) = r_ls(0) / bet;


    for (int i = 1; i <= ilen - 1; i++) {

        gam(i) = c_ls(i-1) / bet;

        bet = b_ls(i) - a_ls(i)*gam(i);

        if (bet == 0) { amrex::Abort(">>>TRIDIAG FAILED"); }

        u_ls(i) = (r_ls(i)-a_ls(i)*u_ls(i-1)) / bet;

    }

    for (int i = ilen-2; i >= 0; i--) {

        u_ls(i) = u_ls(i) - gam(i+1)*u_ls(i+1);

    }

}


inline


void mlndlap_gauss_seidel_with_line_solve_aa (Box const& bx, Array4<Real> const& sol,

                              Array4<Real const> const& rhs, Array4<Real const> const& sig,

                              Array4<int const> const& msk,

                              GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                              bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    if (is_rz) {

        amrex::Abort("mlndlap_gauss_seidel_with_line_solve_aa is not implemented in r-z 2D ");

    }


    const auto lo = amrex::lbound(bx);

    const auto hi = amrex::ubound(bx);


    int idir = -1;

    int ilen = 33;

    int k = 0;

    if (dxinv[0] <= dxinv[1])  {

        idir = 1;

        ilen = hi.y - lo.y + 1;

    }

    if (dxinv[1] <= dxinv[0]) {

        idir = 0;

        ilen = hi.x - lo.x + 1;

    }


    if (ilen > 32) {

        amrex::Abort("mlndlap_gauss_seidel_with_line_solve_aa is hard-wired to be no longer than 32");

    }


    Array1D<Real,0,31> a_ls,b_ls,c_ls,u_ls,r_ls,gam;


    if (idir == 1) {

        for (int i = lo.x; i <= hi.x; ++i)

        {

            for (int j = lo.y; j <= hi.y; ++j)

            {

                if (msk(i,j,k)) {

                    a_ls(j-lo.y) = 0.;

                    b_ls(j-lo.y) = 1.;

                    c_ls(j-lo.y) = 0.;

                    u_ls(j-lo.y) = 0.;

                    r_ls(j-lo.y) = 0.;

                }

                else

                {

                    Real s0 = (-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k));


                    Real Ax = sol(i-1,j-1,k)*fxy*sig(i-1,j-1,k)

                            + sol(i+1,j-1,k)*fxy*sig(i  ,j-1,k)

                            + sol(i-1,j+1,k)*fxy*sig(i-1,j  ,k)

                            + sol(i+1,j+1,k)*fxy*sig(i  ,j  ,k)

                            + sol(i-1,j,k)*f2xmy*(sig(i-1,j-1,k)+sig(i-1,j,k))

                            + sol(i+1,j,k)*f2xmy*(sig(i  ,j-1,k)+sig(i  ,j,k));


                    a_ls(j-lo.y) = fmx2y*(sig(i-1,j-1,k)+sig(i,j-1,k));

                    b_ls(j-lo.y) = s0;

                    c_ls(j-lo.y) = fmx2y*(sig(i-1,j  ,k)+sig(i,j  ,k));

                    u_ls(j-lo.y) = 0.;

                    r_ls(j-lo.y) = rhs(i,j,k) - Ax;

                }

            }

            tridiagonal_solve(a_ls, b_ls, c_ls, r_ls, u_ls, gam, ilen);


            for (int j = lo.y; j <= hi.y; ++j)

            {

                sol(i,j,k) = u_ls(j-lo.y);

            }

        }

    } else if (idir == 0) {

        for (int j = lo.y ;j <= hi.y; ++j)

        {

            for (int i = lo.x; i <= hi.x; ++i)

            {

                if (msk(i,j,k)) {

                    a_ls(i-lo.x) = 0.;

                    b_ls(i-lo.x) = 1.;

                    c_ls(i-lo.x) = 0.;

                    u_ls(i-lo.x) = 0.;

                    r_ls(i-lo.x) = 0.;

                }

                else

                {

                    Real s0 = (-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k));


                    Real Ax = sol(i-1,j-1,k)*fxy*sig(i-1,j-1,k)

                            + sol(i+1,j-1,k)*fxy*sig(i  ,j-1,k)

                            + sol(i-1,j+1,k)*fxy*sig(i-1,j  ,k)

                            + sol(i+1,j+1,k)*fxy*sig(i  ,j  ,k)

                            + sol(i,j-1,k)*fmx2y*(sig(i-1,j-1,k)+sig(i,j-1,k))

                            + sol(i,j+1,k)*fmx2y*(sig(i-1,j  ,k)+sig(i,j  ,k));


                    a_ls(i-lo.x) = f2xmy*(sig(i-1,j-1,k)+sig(i-1,j,k));

                    b_ls(i-lo.x) = s0;

                    c_ls(i-lo.x) = f2xmy*(sig(i  ,j-1,k)+sig(i  ,j,k));

                    u_ls(i-lo.x) = 0.;

                    r_ls(i-lo.x) = rhs(i,j,k) - Ax;


                }

            }

            tridiagonal_solve(a_ls, b_ls, c_ls, r_ls, u_ls, gam, ilen);


            for (int i = lo.x; i <= hi.x; ++i)

            {

                sol(i,j,k) = u_ls(i-lo.x);

            }

        }

    } else {

        amrex::Abort("mlndlap_gauss_seidel_with_line_solve_aa is wrong direction.");

    }


}


//

// interpolation

//


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real aa_interp_line_x (Array4<Real const> const& crse, Array4<Real const> const& sig,

                           int i, int j, int ic, int jc) noexcept

    {

        Real w1 = sig(i-1,j-1,0) + sig(i-1,j,0);

        Real w2 = sig(i  ,j-1,0) + sig(i  ,j,0);

        return (w1*crse(ic,jc,0)+w2*crse(ic+1,jc,0))/(w1+w2);

    }


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real aa_interp_line_y (Array4<Real const> const& crse, Array4<Real const> const& sig,

                           int i, int j, int ic, int jc) noexcept

    {

        Real w1 = sig(i-1,j-1,0) + sig(i,j-1,0);

        Real w2 = sig(i-1,j  ,0) + sig(i,j  ,0);

        return (w1*crse(ic,jc,0)+w2*crse(ic,jc+1,0))/(w1+w2);

    }


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real aa_interp_face_xy (Array4<Real const> const& crse, Array4<Real const> const& sig,

                            int i, int j, int ic, int jc) noexcept

    {

        Real w1 = sig(i-1,j-1,0) + sig(i-1,j,0);

        Real w2 = sig(i  ,j-1,0) + sig(i  ,j,0);

        Real w3 = sig(i-1,j-1,0) + sig(i,j-1,0);

        Real w4 = sig(i-1,j  ,0) + sig(i,j  ,0);

        return (w1 * aa_interp_line_y(crse,sig,i-1,j  ,ic  ,jc  ) +

                w2 * aa_interp_line_y(crse,sig,i+1,j  ,ic+1,jc  ) +

                w3 * aa_interp_line_x(crse,sig,i  ,j-1,ic  ,jc  ) +

                w4 * aa_interp_line_x(crse,sig,i  ,j+1,ic  ,jc+1)) / (w1+w2+w3+w4);

    }


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_interpadd_c (int i, int j, int, Array4<Real> const& fine,

                          Array4<Real const> const& crse,

                           Array4<int const> const& msk) noexcept

{

    if (!msk(i,j,0)) {

        int ic = amrex::coarsen(i,2);

        int jc = amrex::coarsen(j,2);

        bool i_is_odd = (ic*2 != i);

        bool j_is_odd = (jc*2 != j);

        if (i_is_odd && j_is_odd) {

            // Node on a X-Y face

            fine(i,j,0) += Real(0.25) * (crse(ic  ,jc  ,0) +

                                         crse(ic+1,jc  ,0) +

                                         crse(ic  ,jc+1,0) +

                                         crse(ic+1,jc+1,0));

        } else if (i_is_odd) {

            // Node on X line

            fine(i,j,0) += Real(0.5) * (crse(ic,jc,0)+crse(ic+1,jc,0));

        } else if (j_is_odd) {

            // Node on Y line

            fine(i,j,0) += Real(0.5) * (crse(ic,jc,0)+crse(ic,jc+1,0));

        } else {

            // Node coincident with coarse node

            fine(i,j,0) += crse(ic,jc,0);

        }

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_interpadd_aa (int i, int j, int, Array4<Real> const& fine,

                           Array4<Real const> const& crse, Array4<Real const> const& sig,

                           Array4<int const> const& msk) noexcept

{

    if (!msk(i,j,0)) {

        int ic = amrex::coarsen(i,2);

        int jc = amrex::coarsen(j,2);

        bool i_is_odd = (ic*2 != i);

        bool j_is_odd = (jc*2 != j);

        if (i_is_odd && j_is_odd) {

            // Node on a X-Y face

            fine(i,j,0) += aa_interp_face_xy(crse,sig,i,j,ic,jc);

        } else if (i_is_odd) {

            // Node on X line

            fine(i,j,0) += aa_interp_line_x(crse,sig,i,j,ic,jc);

        } else if (j_is_odd) {

            // Node on Y line

            fine(i,j,0) += aa_interp_line_y(crse,sig,i,j,ic,jc);

        } else {

            // Node coincident with coarse node

            fine(i,j,0) += crse(ic,jc,0);

        }

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_semi_interpadd_aa (int i, int j, int, Array4<Real> const& fine,

                           Array4<Real const> const& crse, Array4<Real const> const& sig,

                           Array4<int const> const& msk, int idir) noexcept

{

    if (idir == 1) {

        if (!msk(i,j,0)) {

            int ic = amrex::coarsen(i,2);

            int jc = j;

            bool i_is_odd = (ic*2 != i);

            if (i_is_odd) {

                // Node on X line

                fine(i,j,0) += aa_interp_line_x(crse,sig,i,j,ic,jc);

            } else {

                //Node coincident with coarse node

                fine(i,j,0) += crse(ic,jc,0);

            }

        }

    } else if (idir == 0 ) {

        if (!msk(i,j,0)) {

            int ic = i;

            int jc = amrex::coarsen(j,2);

            bool j_is_odd = (ic*2 != i);

            if (j_is_odd) {

                // Node on Y line

                fine(i,j,0) += aa_interp_line_y(crse,sig,i,j,ic,jc);

            } else {

                //Node coincident with coarse node

                fine(i,j,0) += crse(ic,jc,0);

            }

        }

    }

}


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real ha_interp_face_xy (Array4<Real const> const& crse,

                            Array4<Real const> const& sigx, Array4<Real const> const& sigy,

                            int i, int j, int ic, int jc) noexcept

    {

        Real w1 = sigx(i-1,j-1,0) + sigx(i-1,j,0);

        Real w2 = sigx(i  ,j-1,0) + sigx(i  ,j,0);

        Real w3 = sigy(i-1,j-1,0) + sigy(i,j-1,0);

        Real w4 = sigy(i-1,j  ,0) + sigy(i,j  ,0);

        return (w1 * aa_interp_line_y(crse,sigy,i-1,j  ,ic  ,jc  ) +

                w2 * aa_interp_line_y(crse,sigy,i+1,j  ,ic+1,jc  ) +

                w3 * aa_interp_line_x(crse,sigx,i  ,j-1,ic  ,jc  ) +

                w4 * aa_interp_line_x(crse,sigx,i  ,j+1,ic  ,jc+1)) / (w1+w2+w3+w4);

    }


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_interpadd_ha (int i, int j, int,

                           Array4<Real> const& fine, Array4<Real const> const& crse,

                           Array4<Real const> const& sigx, Array4<Real const> const& sigy,

                           Array4<int const> const& msk) noexcept

{

    if (!msk(i,j,0)) {

        int ic = amrex::coarsen(i,2);

        int jc = amrex::coarsen(j,2);

        bool i_is_odd = (ic*2 != i);

        bool j_is_odd = (jc*2 != j);

        if (i_is_odd && j_is_odd) {

            // Node on a X-Y face

            fine(i,j,0) += ha_interp_face_xy(crse,sigx,sigy,i,j,ic,jc);

        } else if (i_is_odd) {

            // Node on X line

            fine(i,j,0) += aa_interp_line_x(crse,sigx,i,j,ic,jc);

        } else if (j_is_odd) {

            // Node on Y line

            fine(i,j,0) += aa_interp_line_y(crse,sigy,i,j,ic,jc);

        } else {

            // Node coincident with coarse node

            fine(i,j,0) += crse(ic,jc,0);

        }

    }

}


//

// rhs & u

//


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_divu (int i, int j, int k, Array4<Real> const& rhs, Array4<Real const> const& vel,

                   Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                   Box const& nodal_domain,

                   GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bclo,

                   GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bchi,

                   bool is_rz) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];


    const auto domlo = amrex::lbound(nodal_domain);

    const auto domhi = amrex::ubound(nodal_domain);


    if (msk(i,j,k)) {

        rhs(i,j,k) = Real(0.0);

    } else {


        Real zero_ilo = Real(1.0);

        Real zero_ihi = Real(1.0);

        Real zero_jlo = Real(1.0);

        Real zero_jhi = Real(1.0);


        // The nodal divergence operator should not see the tangential velocity

        //     at an inflow face

        if ((bclo[0] == LinOpBCType::Neumann || bclo[0] == LinOpBCType::inflow)

            && i == domlo.x)

        {

            zero_ilo = Real(0.0);

        }

        if ((bchi[0] == LinOpBCType::Neumann || bchi[0] == LinOpBCType::inflow)

            && i == domhi.x)

        {

            zero_ihi = Real(0.0);

        }

        if ((bclo[1] == LinOpBCType::Neumann || bclo[1] == LinOpBCType::inflow)

            && j == domlo.y)

        {

            zero_jlo = Real(0.0);

        }

        if ((bchi[1] == LinOpBCType::Neumann || bchi[1] == LinOpBCType::inflow)

            && j == domhi.y)

        {

            zero_jhi = Real(0.0);

        }


        rhs(i,j,k) = facx*(-vel(i-1,j-1,k,0)*zero_jlo + vel(i,j-1,k,0)*zero_jlo

                           -vel(i-1,j  ,k,0)*zero_jhi + vel(i,j  ,k,0)*zero_jhi)

                   + facy*(-vel(i-1,j-1,k,1)*zero_ilo - vel(i,j-1,k,1)*zero_ihi

                           +vel(i-1,j  ,k,1)*zero_ilo + vel(i,j  ,k,1)*zero_ihi);

        if (is_rz) {

            // Here we assume we can't have inflow in the radial direction

            Real fm = facy / static_cast<Real>(6*i-3);

            Real fp = facy / static_cast<Real>(6*i+3);

            rhs(i,j,k) += fm*(vel(i-1,j,k,1)-vel(i-1,j-1,k,1))

                        - fp*(vel(i  ,j,k,1)-vel(i  ,j-1,k,1));

        }

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

Real mlndlap_rhcc (int i, int j, int k, Array4<Real const> const& rhcc,

                   Array4<int const> const& msk) noexcept

{

    Real r;

    if (msk(i,j,k)) {

        r = Real(0.0);

    } else {

        r = Real(0.25) * (rhcc(i-1,j-1,k)+rhcc(i,j-1,k)+rhcc(i-1,j,k)+rhcc(i,j,k));

    }

    return r;

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_mknewu (int i, int j, int k, Array4<Real> const& u, Array4<Real const> const& p,

                     Array4<Real const> const& sig,  GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                     bool is_rz) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];

    u(i,j,k,0) -= sig(i,j,k)*facx*(-p(i,j,k)+p(i+1,j,k)-p(i,j+1,k)+p(i+1,j+1,k));

    u(i,j,k,1) -= sig(i,j,k)*facy*(-p(i,j,k)-p(i+1,j,k)+p(i,j+1,k)+p(i+1,j+1,k));

    if (is_rz) {

        Real frz = sig(i,j,k)*facy / static_cast<Real>(6*i+3);

        u(i,j,k,1) += frz*(p(i,j,k)-p(i+1,j,k)-p(i,j+1,k)+p(i+1,j+1,k));

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_mknewu_c (int i, int j, int k, Array4<Real> const& u, Array4<Real const> const& p,

                       Real sig,  GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                       bool is_rz) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];

    u(i,j,k,0) -= sig*facx*(-p(i,j,k)+p(i+1,j,k)-p(i,j+1,k)+p(i+1,j+1,k));

    u(i,j,k,1) -= sig*facy*(-p(i,j,k)-p(i+1,j,k)+p(i,j+1,k)+p(i+1,j+1,k));

    if (is_rz) {

        Real frz = sig*facy / static_cast<Real>(6*i+3);

        u(i,j,k,1) += frz*(p(i,j,k)-p(i+1,j,k)-p(i,j+1,k)+p(i+1,j+1,k));

    }

}


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real mlndlap_sum_Df (int ii, int jj, Real facx, Real facy,

                         Array4<Real const> const& vel, Box const& velbx, bool is_rz) noexcept

    {

        Real fm = is_rz ? facy / static_cast<Real>(6*ii-3) : Real(0.0);

        Real fp = is_rz ? facy / static_cast<Real>(6*ii+3) : Real(0.0);


        Real Df = Real(0.0);

        if (velbx.contains(ii-1,jj-1,0)) {

            Df += -facx*vel(ii-1,jj-1,0,0) - (facy+fm)*vel(ii-1,jj-1,0,1);

        }

        if (velbx.contains(ii,jj-1,0)) {

            Df += facx*vel(ii,jj-1,0,0) - (facy-fp)*vel(ii,jj-1,0,1);

        }

        if (velbx.contains(ii-1,jj,0)) {

            Df += -facx*vel(ii-1,jj,0,0) + (facy+fm)*vel(ii-1,jj,0,1);

        }

        if (velbx.contains(ii,jj,0)) {

            Df += facx*vel(ii,jj,0,0) + (facy-fp)*vel(ii,jj,0,1);

        }

        return Df;

    }


template <int rr>

AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_divu_fine_contrib (int i, int j, int /*k*/, Box const& fvbx, Box const& velbx,

                                Array4<Real> const& rhs, Array4<Real const> const& vel,

                                Array4<Real const> const& frhs, Array4<int const> const& msk,

                                GpuArray<Real,AMREX_SPACEDIM> const& dxinv, bool is_rz) noexcept

{

    const int ii = rr*i;

    const int jj = rr*j;

    if (msk(ii,jj,0)) {

        const Real facx = Real(0.5)*dxinv[0];

        const Real facy = Real(0.5)*dxinv[1];


        Real Df = Real(0.0);


        const int ilo = amrex::max(ii-rr+1, fvbx.smallEnd(0));

        const int ihi = amrex::min(ii+rr-1, fvbx.bigEnd  (0));

        const int jlo = amrex::max(jj-rr+1, fvbx.smallEnd(1));

        const int jhi = amrex::min(jj+rr-1, fvbx.bigEnd  (1));


        for (int joff = jlo; joff <= jhi; ++joff) {

        for (int ioff = ilo; ioff <= ihi; ++ioff) {

            Real scale = static_cast<Real>((rr-std::abs(ii-ioff)) *

                                           (rr-std::abs(jj-joff)));

            if (fvbx.strictly_contains(ioff,joff,0)) {

                Df += scale * frhs(ioff,joff,0);

            } else {

                Df += scale * mlndlap_sum_Df(ioff, joff, facx, facy, vel, velbx, is_rz);

            }

        }}


        rhs(i,j,0) = Df * (Real(1.0)/static_cast<Real>(rr*rr*rr*rr));

    } else {

        rhs(i,j,0) = Real(0.0);

    }

}


template <int rr>

AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_rhcc_fine_contrib (int i, int j, int, Box const& ccbx,

                                Array4<Real> const& rhs, Array4<Real const> const& cc,

                                Array4<int const> const& msk) noexcept

{

    const int ii = rr*i;

    const int jj = rr*j;

    if (msk(ii,jj,0)) {

        Real tmp = Real(0.0);


        const int ilo = amrex::max(ii-rr  , ccbx.smallEnd(0));

        const int ihi = amrex::min(ii+rr-1, ccbx.bigEnd  (0));

        const int jlo = amrex::max(jj-rr  , ccbx.smallEnd(1));

        const int jhi = amrex::min(jj+rr-1, ccbx.bigEnd  (1));


        for (int joff = jlo; joff <= jhi; ++joff) {

        for (int ioff = ilo; ioff <= ihi; ++ioff) {

            Real scale = (static_cast<Real>(rr)-std::abs(static_cast<Real>(ioff-ii)+Real(0.5)))

                *        (static_cast<Real>(rr)-std::abs(static_cast<Real>(joff-jj)+Real(0.5)));

            tmp += cc(ioff,joff,0) * scale;

        }}


        rhs(i,j,0) += tmp * (Real(1.0)/Real(rr*rr*rr*rr));

    }

}


    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real neumann_scale (int i, int j, Box const& nddom,

                        GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bclo,

                        GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bchi) noexcept

    {

        Real val = Real(1.0);


        const auto ndlo = amrex::lbound(nddom);

        const auto ndhi = amrex::ubound(nddom);


        if ((i == ndlo.x && ( bclo[0] == LinOpBCType::Neumann ||

                              bclo[0] == LinOpBCType::inflow)) ||

            (i == ndhi.x && ( bchi[0] == LinOpBCType::Neumann ||

                              bchi[0] == LinOpBCType::inflow))) {

            val *= Real(2.0);

        }


        if ((j == ndlo.y && ( bclo[1] == LinOpBCType::Neumann ||

                              bclo[1] == LinOpBCType::inflow)) ||

            (j == ndhi.y && ( bchi[1] == LinOpBCType::Neumann ||

                              bchi[1] == LinOpBCType::inflow))) {

            val *= Real(2.0);

        }


        return val;

    }


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_divu_cf_contrib (int i, int j, int, Array4<Real> const& rhs,

                              Array4<Real const> const& vel, Array4<Real const> const& fc,

                              Array4<Real const> const& rhcc, Array4<int const> const& dmsk,

                              Array4<int const> const& ndmsk, Array4<int const> const& ccmsk,

                              bool is_rz, GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                              Box const& ccdom_p, Box const& veldom, Box const& nddom,

                              GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bclo,

                              GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bchi) noexcept

{

    using namespace nodelap_detail;


    if (!dmsk(i,j,0) && ndmsk(i,j,0) == crse_fine_node) {

        Real facx = Real(0.5) * dxinv[0];

        Real facy = Real(0.5) * dxinv[1];

        Real tmp = fc(i,j,0);


        Real fm = is_rz ? facy / static_cast<Real>(6*i-3) : Real(0.0);

        Real fp = is_rz ? facy / static_cast<Real>(6*i+3) : Real(0.0);


        // Where there is inflow, veldom there is bigger than ccdom_p by one cell.

        // ccdom_p is cc domain grown at periodic boundaries.


        if (ccmsk(i-1,j-1,0) == crse_cell && veldom.contains(i-1,j-1,0)) {

            tmp += -facx*vel(i-1,j-1,0,0) - (facy+fm)*vel(i-1,j-1,0,1);

            if (rhcc && ccdom_p.contains(i-1,j-1,0)) {

                tmp += Real(0.25) * rhcc(i-1,j-1,0);

            }

        }


        if (ccmsk(i,j-1,0) == crse_cell && veldom.contains(i,j-1,0)) {

            tmp += facx*vel(i,j-1,0,0) - (facy-fp)*vel(i,j-1,0,1);

            if (rhcc && ccdom_p.contains(i,j-1,0)) {

                tmp += Real(0.25) * rhcc(i,j-1,0);

            }

        }


        if (ccmsk(i-1,j,0) == crse_cell && veldom.contains(i-1,j,0)) {

            tmp += -facx*vel(i-1,j,0,0) + (facy+fm)*vel(i-1,j,0,1);

            if (rhcc && ccdom_p.contains(i-1,j,0)) {

                tmp += Real(0.25) * rhcc(i-1,j,0);

            }

        }


        if (ccmsk(i,j,0) == crse_cell && veldom.contains(i,j,0)) {

            tmp += facx*vel(i,j,0,0) + (facy-fp)*vel(i,j,0,1);

            if (rhcc && ccdom_p.contains(i,j,0)) {

                tmp += Real(0.25) * rhcc(i,j,0);

            }

        }


        rhs(i,j,0) = tmp * neumann_scale(i, j, nddom, bclo, bchi);

    }

}


//

// residual

//


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_crse_resid (int i, int j, int k, Array4<Real> const& resid,

                         Array4<Real const> const& rhs, Array4<int const> const& msk,

                         Box const& nddom, GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bclo,

                         GpuArray<LinOpBCType,AMREX_SPACEDIM> const& bchi,

                         bool neumann_doubling) noexcept

{

    if ( msk(i-1,j-1,k  ) == 0 ||

         msk(i  ,j-1,k  ) == 0 ||

         msk(i-1,j  ,k  ) == 0 ||

         msk(i  ,j  ,k  ) == 0 )

    {

        Real fac = Real(1.0);

        if (neumann_doubling) {

            const auto ndlo = amrex::lbound(nddom);

            const auto ndhi = amrex::ubound(nddom);

            if ((i == ndlo.x && ( bclo[0] == LinOpBCType::Neumann ||

                                  bclo[0] == LinOpBCType::inflow)) ||

                (i == ndhi.x && ( bchi[0] == LinOpBCType::Neumann ||

                                  bchi[0] == LinOpBCType::inflow))) {

                fac *= Real(2.);

            }

            if ((j == ndlo.y && ( bclo[1] == LinOpBCType::Neumann ||

                                  bclo[1] == LinOpBCType::inflow)) ||

                (j == ndhi.y && ( bchi[1] == LinOpBCType::Neumann ||

                                  bchi[1] == LinOpBCType::inflow))) {

                fac *= Real(2.);

            }

        }


        resid(i,j,k) = (rhs(i,j,k) - resid(i,j,k)) * fac;

    } else {

        resid(i,j,k) = Real(0.);

    }

}


//

// sync residual

//


    template <typename P, typename S>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    Real mlndlap_sum_Ax (P const& pred, S const& sig, int i, int j, Real facx, Real facy,

                         Array4<Real const> const& phi, bool is_rz) noexcept

    {

        Real Ax = Real(0.0);

        Real fp = Real(0.0), fm = Real(0.0);

        if (is_rz) {

            fp = facy / static_cast<Real>(2*i+1);

            fm = facy / static_cast<Real>(2*i-1);

        }

        if (pred(i-1,j-1)) {

            Ax += sig(i-1,j-1,0)*(facx*(Real(2.)*(phi(i-1,j  ,0)-phi(i  ,j  ,0))

                                           +     (phi(i-1,j-1,0)-phi(i  ,j-1,0)))

                                + facy*(Real(2.)*(phi(i  ,j-1,0)-phi(i  ,j  ,0))

                                           +     (phi(i-1,j-1,0)-phi(i-1,j  ,0)))

                                + fm  *          (phi(i  ,j-1,0)-phi(i  ,j  ,0)));

        }

        if (pred(i,j-1)) {

            Ax += sig(i,j-1,0)*(facx*(Real(2.)*(phi(i+1,j  ,0)-phi(i  ,j  ,0))

                                         +     (phi(i+1,j-1,0)-phi(i  ,j-1,0)))

                              + facy*(Real(2.)*(phi(i  ,j-1,0)-phi(i  ,j  ,0))

                                         +     (phi(i+1,j-1,0)-phi(i+1,j  ,0)))

                              - fp  *          (phi(i  ,j-1,0)-phi(i  ,j  ,0)));

        }

        if (pred(i-1,j)) {

            Ax += sig(i-1,j,0)*(facx*(Real(2.)*(phi(i-1,j  ,0)-phi(i  ,j  ,0))

                                         +     (phi(i-1,j+1,0)-phi(i  ,j+1,0)))

                              + facy*(Real(2.)*(phi(i  ,j+1,0)-phi(i  ,j  ,0))

                                         +     (phi(i-1,j+1,0)-phi(i-1,j  ,0)))

                              + fm  *          (phi(i  ,j+1,0)-phi(i  ,j  ,0)));

        }

        if (pred(i,j)) {

            Ax += sig(i,j,0)*(facx*(Real(2.)*(phi(i+1,j  ,0)-phi(i  ,j  ,0))

                                      +      (phi(i+1,j+1,0)-phi(i  ,j+1,0)))

                            + facy*(Real(2.)*(phi(i  ,j+1,0)-phi(i  ,j  ,0))

                                      +      (phi(i+1,j+1,0)-phi(i+1,j  ,0)))

                            - fp  *          (phi(i  ,j+1,0)-phi(i  ,j  ,0)));

        }

        return Ax;

    }


    template <int rr, typename S>

    AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


    void mlndlap_Ax_fine_contrib_doit (S const& sig, int i, int j, Box const& ndbx, Box const& ccbx,

                                       Array4<Real> const& f, Array4<Real const> const& res,

                                       Array4<Real const> const& rhs,

                                       Array4<Real const> const& phi,

                                       Array4<int const> const& msk, bool is_rz,

                                       GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

    {

        const int ii = rr*i;

        const int jj = rr*j;

        if (msk(ii,jj,0)) {

            Real facx = Real(1./6.)*dxinv[0]*dxinv[0];

            Real facy = Real(1./6.)*dxinv[1]*dxinv[1];


            auto is_fine = [&ccbx] (int ix, int iy) -> bool {

                return ccbx.contains(ix,iy,0);

            };


            Real Df = Real(0.0);


            const int ilo = amrex::max(ii-rr+1, ndbx.smallEnd(0));

            const int ihi = amrex::min(ii+rr-1, ndbx.bigEnd  (0));

            const int jlo = amrex::max(jj-rr+1, ndbx.smallEnd(1));

            const int jhi = amrex::min(jj+rr-1, ndbx.bigEnd  (1));


            for (int joff = jlo; joff <= jhi; ++joff) {

            for (int ioff = ilo; ioff <= ihi; ++ioff) {

                Real scale = static_cast<Real>((rr-std::abs(ii-ioff)) *

                                               (rr-std::abs(jj-joff)));

                if (ndbx.strictly_contains(ioff,joff,0)) {

                    Df += scale * (rhs(ioff,joff,0)-res(ioff,joff,0));

                } else {

                    Df += scale * mlndlap_sum_Ax

                        (is_fine, sig, ioff, joff, facx, facy, phi, is_rz);

                }

            }}


            f(i,j,0) = Df * (Real(1.0)/static_cast<Real>(rr*rr*rr*rr));

        } else {

            f(i,j,0) = Real(0.0);

        }

    }


template <int rr>

AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_Ax_fine_contrib (int i, int j, int /*k*/, Box const& ndbx, Box const& ccbx,

                              Array4<Real> const& f, Array4<Real const> const& res,

                              Array4<Real const> const& rhs, Array4<Real const> const& phi,

                              Array4<Real const> const& sig, Array4<int const> const& msk,

                              bool is_rz,

                              GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    mlndlap_Ax_fine_contrib_doit<rr>

        ([&sig] (int ix, int iy, int) -> Real const& { return sig(ix,iy,0); },

         i,j,ndbx,ccbx,f,res,rhs,phi,msk,is_rz,dxinv);

}


template <int rr>

AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_Ax_fine_contrib_cs (int i, int j, int /*k*/, Box const& ndbx, Box const& ccbx,

                                 Array4<Real> const& f, Array4<Real const> const& res,

                                 Array4<Real const> const& rhs, Array4<Real const> const& phi,

                                 Real const sig, Array4<int const> const& msk,

                                 bool is_rz,

                                 GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    mlndlap_Ax_fine_contrib_doit<rr>

        ([=] (int, int, int) -> Real { return sig; },

         i,j,ndbx,ccbx,f,res,rhs,phi,msk,is_rz,dxinv);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_res_cf_contrib (int i, int j, int, Array4<Real> const& res,

                             Array4<Real const> const& phi, Array4<Real const> const& rhs,

                             Array4<Real const> const& sig, Array4<int const> const& dmsk,

                             Array4<int const> const& ndmsk, Array4<int const> const& ccmsk,

                             Array4<Real const> const& fc,

                             GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                             Box const& ccdom_p, Box const& nddom,

                             bool is_rz,

                             GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bclo,

                             GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bchi,

                             bool neumann_doubling) noexcept

{

    using namespace nodelap_detail;


    if (!dmsk(i,j,0) && ndmsk(i,j,0) == crse_fine_node) {

        Real facx = Real(1./6.)*dxinv[0]*dxinv[0];

        Real facy = Real(1./6.)*dxinv[1]*dxinv[1];


        Real Ax = mlndlap_sum_Ax([&ccmsk, &ccdom_p] (int ix, int iy) -> bool

                                 {

                                     return ccdom_p.contains(ix,iy,0)

                                         && (ccmsk(ix,iy,0) == crse_cell);

                                 },

                                 [&sig] (int ix, int iy, int) -> Real const&

                                 {

                                     return sig(ix,iy,0);

                                 },

                                 i, j, facx, facy, phi, is_rz);

        Ax += fc(i,j,0);

        Real const ns = (neumann_doubling) ? neumann_scale(i,j,nddom,bclo,bchi) : Real(1.0);

        res(i,j,0) = rhs(i,j,0) - Ax*ns;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_res_cf_contrib_cs (int i, int j, int, Array4<Real> const& res,

                                Array4<Real const> const& phi, Array4<Real const> const& rhs,

                                Real const sig, Array4<int const> const& dmsk,

                                Array4<int const> const& ndmsk, Array4<int const> const& ccmsk,

                                Array4<Real const> const& fc,

                                GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                                Box const& ccdom_p, Box const& nddom,

                                bool is_rz,

                                GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bclo,

                                GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bchi,

                                bool neumann_doubling) noexcept

{

    using namespace nodelap_detail;


    if (!dmsk(i,j,0) && ndmsk(i,j,0) == crse_fine_node) {

        Real facx = Real(1./6.)*dxinv[0]*dxinv[0];

        Real facy = Real(1./6.)*dxinv[1]*dxinv[1];


        Real Ax = mlndlap_sum_Ax([&ccmsk, &ccdom_p] (int ix, int iy) -> bool

                                 {

                                     return ccdom_p.contains(ix,iy,0)

                                         && (ccmsk(ix,iy,0) == crse_cell);

                                 },

                                 [=] (int, int, int) -> Real

                                 {

                                     return sig;

                                 },

                                 i, j, facx, facy, phi, is_rz);

        Ax += fc(i,j,0);

        Real const ns = (neumann_doubling) ? neumann_scale(i,j,nddom,bclo,bchi) : Real(1.0);

        res(i,j,0) = rhs(i,j,0) - Ax*ns;

    }

}


//

// RAP

//


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_stencil (Box const& bx, Array4<Real> const& sten,

                          Array4<Real const> const& sigma,

                          GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    amrex::LoopConcurrent(bx, [=] (int i, int j, int k) noexcept

    {

        sten(i,j,k,1) = f2xmy*(sigma(i,j-1,k)+sigma(i,j,k));

        sten(i,j,k,2) = fmx2y*(sigma(i-1,j,k)+sigma(i,j,k));

        sten(i,j,k,3) = fxy*sigma(i,j,k);

    });

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_stencil_s0 (int i, int j, int k, Array4<Real> const& sten) noexcept

{

    using namespace nodelap_detail;


    sten(i,j,k,0) = -(sten(i-1,j  ,k,1) + sten(i  ,j  ,k,1)

                    + sten(i  ,j-1,k,2) + sten(i  ,j  ,k,2)

                    + sten(i-1,j-1,k,3) + sten(i  ,j-1,k,3)

                    + sten(i-1,j  ,k,3) + sten(i  ,j  ,k,3));

    sten(i,j,k,4) = Real(1.0) / (std::abs(sten(i-1,j  ,k,1)) + std::abs(sten(i,j  ,k,1))

                               + std::abs(sten(i  ,j-1,k,2)) + std::abs(sten(i,j  ,k,2))

                               + std::abs(sten(i-1,j-1,k,3)) + std::abs(sten(i,j-1,k,3))

                               + std::abs(sten(i-1,j  ,k,3)) + std::abs(sten(i,j  ,k,3)) + eps);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_stencil_rap (int i, int j, int, Array4<Real> const& csten,

                          Array4<Real const> const& fsten) noexcept

{

    using namespace nodelap_detail;


    constexpr int k = 0;


#if 0

    auto interp_from_mm_to = [&fsten] (int i_, int j_) -> Real {

        Real wxm = std::abs(fsten(i_-1,j_  ,0,1))/(std::abs(fsten(i_-1,j_-1,0,3))+std::abs(fsten(i_-1,j_  ,0,3))+eps);

        Real wym = std::abs(fsten(i_  ,j_-1,0,2))/(std::abs(fsten(i_-1,j_-1,0,3))+std::abs(fsten(i_  ,j_-1,0,3))+eps);

        Real wmm = std::abs(fsten(i_-1,j_-1,0,3)) * (Real(1.) + wxm + wym);

        return wmm * fsten(i_,j_,0,4);

    };

#endif


    auto interp_from_mp_to = [&fsten] (int i_, int j_) -> Real {

        Real wxm = std::abs(fsten(i_-1,j_  ,0,1))/(std::abs(fsten(i_-1,j_-1,0,3))+std::abs(fsten(i_-1,j_  ,0,3))+eps);

        Real wyp = std::abs(fsten(i_  ,j_  ,0,2))/(std::abs(fsten(i_-1,j_  ,0,3))+std::abs(fsten(i_  ,j_  ,0,3))+eps);

        Real wmp = std::abs(fsten(i_-1,j_  ,0,3)) *(Real(1.) + wxm + wyp);

        return wmp * fsten(i_,j_,0,4);

    };


    auto interp_from_pm_to = [&fsten] (int i_, int j_) -> Real {

        Real wxp = std::abs(fsten(i_  ,j_  ,0,1))/(std::abs(fsten(i_  ,j_-1,0,3))+std::abs(fsten(i_  ,j_  ,0,3))+eps);

        Real wym = std::abs(fsten(i_  ,j_-1,0,2))/(std::abs(fsten(i_-1,j_-1,0,3))+std::abs(fsten(i_  ,j_-1,0,3))+eps);

        Real wpm = std::abs(fsten(i_  ,j_-1,0,3)) * (Real(1.) + wxp + wym);

        return wpm * fsten(i_,j_,0,4);

    };


    auto interp_from_pp_to = [&fsten] (int i_, int j_) -> Real {

        Real wxp = std::abs(fsten(i_  ,j_  ,0,1))/(std::abs(fsten(i_  ,j_-1,0,3))+std::abs(fsten(i_  ,j_  ,0,3))+eps);

        Real wyp = std::abs(fsten(i_  ,j_  ,0,2))/(std::abs(fsten(i_-1,j_  ,0,3))+std::abs(fsten(i_  ,j_  ,0,3))+eps);

        Real wpp = std::abs(fsten(i_  ,j_  ,0,3)) * (Real(1.) + wxp + wyp);

        return wpp * fsten(i_,j_,0,4);

    };


    auto interp_from_m0_to = [&fsten] (int i_, int j_) -> Real {

        return std::abs(fsten(i_-1,j_,0,1))/(std::abs(fsten(i_-1,j_,0,1))+std::abs(fsten(i_,j_,0,1))+eps);

    };


    auto interp_from_p0_to = [&fsten] (int i_, int j_) -> Real {

        return std::abs(fsten(i_,j_,0,1))/(std::abs(fsten(i_-1,j_,0,1))+std::abs(fsten(i_,j_,0,1))+eps);

    };


    auto interp_from_0m_to = [&fsten] (int i_, int j_) -> Real {

        return std::abs(fsten(i_,j_-1,0,2))/(std::abs(fsten(i_,j_-1,0,2))+std::abs(fsten(i_,j_,0,2))+eps);

    };


    auto interp_from_0p_to = [&fsten] (int i_, int j_) -> Real {

        return std::abs(fsten(i_,j_,0,2))/(std::abs(fsten(i_,j_-1,0,2))+std::abs(fsten(i_,j_,0,2))+eps);

    };


#if 0

    auto Amm = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_-1,j_-1,0,3);

    };

#endif


    auto A0m = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_-1,0,2);

    };


    auto Apm = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_-1,0,3);

    };


    auto Am0 = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_-1,j_,0,1);

    };


    auto A00 = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_,0,0);

    };


    auto Ap0 = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_,0,1);

    };


    auto Amp = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_-1,j_,0,3);

    };


    auto A0p = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_,0,2);

    };


    auto App = [&fsten] (int i_, int j_) -> Real {

        return fsten(i_,j_,0,3);

    };


#if 0

    auto restrict_from_mm_to = [&fsten] (int ii_, int jj_) -> Real {

        Real wxp = std::abs(fsten(ii_-1,jj_-1,0,1))/(std::abs(fsten(ii_-1,jj_-2,0,3))+std::abs(fsten(ii_-1,jj_-1,0,3))+eps);

        Real wyp = std::abs(fsten(ii_-1,jj_-1,0,2))/(std::abs(fsten(ii_-2,jj_-1,0,3))+std::abs(fsten(ii_-1,jj_-1,0,3))+eps);

        Real wpp = std::abs(fsten(ii_-1,jj_-1,0,3))*(Real(1.)+wxp+wyp);

        return wpp * fsten(ii_-1,jj_-1,0,4);

    };

#endif


    auto restrict_from_0m_to = [&fsten] (int ii_, int jj_) -> Real {

        return std::abs(fsten(ii_,jj_-1,0,2))/(std::abs(fsten(ii_,jj_-2,0,2))+std::abs(fsten(ii_,jj_-1,0,2))+eps);

    };


    auto restrict_from_pm_to = [&fsten] (int ii_, int jj_) -> Real {

        Real wxm = std::abs(fsten(ii_  ,jj_-1,0,1))/(std::abs(fsten(ii_,jj_-2,0,3))+std::abs(fsten(ii_  ,jj_-1,0,3))+eps);

        Real wyp = std::abs(fsten(ii_+1,jj_-1,0,2))/(std::abs(fsten(ii_,jj_-1,0,3))+std::abs(fsten(ii_+1,jj_-1,0,3))+eps);

        Real wmp = std::abs(fsten(ii_  ,jj_-1,0,3)) *(Real(1.) + wxm + wyp);

        return wmp * fsten(ii_+1,jj_-1,0,4);

    };


    auto restrict_from_m0_to = [&fsten] (int ii_, int jj_) -> Real {

        return std::abs(fsten(ii_-1,jj_,0,1))/(std::abs(fsten(ii_-2,jj_,0,1))+std::abs(fsten(ii_-1,jj_,0,1))+eps);

    };


    auto restrict_from_p0_to = [&fsten] (int ii_, int jj_) -> Real {

        return std::abs(fsten(ii_,jj_,0,1))/(std::abs(fsten(ii_,jj_,0,1))+std::abs(fsten(ii_+1,jj_,0,1))+eps);

    };


    auto restrict_from_mp_to = [&fsten] (int ii_, int jj_) -> Real {

        Real wxp = std::abs(fsten(ii_-1,jj_+1,0,1))/(std::abs(fsten(ii_-1,jj_,0,3))+std::abs(fsten(ii_-1,jj_+1,0,3))+eps);

        Real wym = std::abs(fsten(ii_-1,jj_  ,0,2))/(std::abs(fsten(ii_-2,jj_,0,3))+std::abs(fsten(ii_-1,jj_  ,0,3))+eps);

        Real wpm = std::abs(fsten(ii_-1,jj_  ,0,3)) * (Real(1.) + wxp + wym);

        return wpm * fsten(ii_-1,jj_+1,0,4);

    };


    auto restrict_from_0p_to = [&fsten] (int ii_, int jj_) -> Real {

        return std::abs(fsten(ii_,jj_,0,2))/(std::abs(fsten(ii_,jj_,0,2))+std::abs(fsten(ii_,jj_+1,0,2))+eps);

    };


    auto restrict_from_pp_to = [&fsten] (int ii_, int jj_) -> Real {

        Real wxm = std::abs(fsten(ii_  ,jj_+1,0,1))/(std::abs(fsten(ii_  ,jj_  ,0,3))+std::abs(fsten(ii_  ,jj_+1,0,3))+eps);

        Real wym = std::abs(fsten(ii_+1,jj_  ,0,2))/(std::abs(fsten(ii_  ,jj_  ,0,3))+std::abs(fsten(ii_+1,jj_  ,0,3))+eps);

        Real wmm = std::abs(fsten(ii_  ,jj_  ,0,3)) * (Real(1.) + wxm + wym);

        return wmm * fsten(ii_+1,jj_+1,0,4);

    };


    int ii = 2*i;

    int jj = 2*j;

    Array2D<Real,-1,1,-1,1> ap, p;


    // csten(i,j,k,1)

    p(-1,-1) = interp_from_pp_to(ii+1,jj-1);

    p( 0,-1) = interp_from_0p_to(ii+2,jj-1);

    p(-1, 0) = interp_from_p0_to(ii+1,jj  );

    p( 0, 0) = Real(1.);

    p(-1, 1) = interp_from_pm_to(ii+1,jj+1);

    p( 0, 1) = interp_from_0m_to(ii+2,jj+1);


    ap(0,-1) = Ap0(ii,jj-1)*p(-1,-1) + App(ii,jj-1)*p(-1,0);

    ap(1,-1) = A00(ii+1,jj-1)*p(-1,-1) + Ap0(ii+1,jj-1)*p(0,-1)

        +      A0p(ii+1,jj-1)*p(-1,0) + App(ii+1,jj-1)*p(0,0);

    ap(0,0) = Apm(ii,jj)*p(-1,-1) + Ap0(ii,jj)*p(-1,0) + App(ii,jj)*p(-1,1);

    ap(1,0) = A0m(ii+1,jj)*p(-1,-1) + Apm(ii+1,jj)*p(0,-1)

        +     A00(ii+1,jj)*p(-1,0) + Ap0(ii+1,jj)*p(0,0)

        +     A0p(ii+1,jj)*p(-1,1) + App(ii+1,jj)*p(0,1);

    ap(0,1) = Apm(ii,jj+1)*p(-1,0) + Ap0(ii,jj+1)*p(-1,1);

    ap(1,1) = A0m(ii+1,jj+1)*p(-1,0) + Apm(ii+1,jj+1)*p(0,0)

        +     A00(ii+1,jj+1)*p(-1,1) + Ap0(ii+1,jj+1)*p(0,1);


    csten(i,j,k,1) = Real(0.25)*(restrict_from_0m_to(ii,jj)*ap(0,-1)

                               + restrict_from_pm_to(ii,jj)*ap(1,-1)

                               + ap(0,0)

                               + restrict_from_p0_to(ii,jj)*ap(1,0)

                               + restrict_from_0p_to(ii,jj)*ap(0,1)

                               + restrict_from_pp_to(ii,jj)*ap(1,1));


    // csten(i,j,k,2)

    p(-1,-1) = interp_from_pp_to(ii-1,jj+1);

    p( 0,-1) = interp_from_0p_to(ii  ,jj+1);

    p( 1,-1) = interp_from_mp_to(ii+1,jj+1);

    p(-1, 0) = interp_from_p0_to(ii-1,jj+2);

    p( 0, 0) = Real(1.);

    p( 1, 0) = interp_from_m0_to(ii+1,jj+2);


    ap(-1,0) = A0p(ii-1,jj)*p(-1,-1) + App(ii-1,jj)*p(0,-1);

    ap(0,0) = Amp(ii,jj)*p(-1,-1) + A0p(ii,jj)*p(0,-1) + App(ii,jj)*p(1,-1);

    ap(1,0) = Amp(ii+1,jj)*p(0,-1) + A0p(ii+1,jj)*p(1,-1);

    ap(-1,1) = A00(ii-1,jj+1)*p(-1,-1) + Ap0(ii-1,jj+1)*p(0,-1)

        +      A0p(ii-1,jj+1)*p(-1,0) + App(ii-1,jj+1)*p(0,0);

    ap(0,1) = Am0(ii,jj+1)*p(-1,-1) + A00(ii,jj+1)*p(0,-1) + Ap0(ii,jj+1)*p(1,-1)

        +     Amp(ii,jj+1)*p(-1,0) + A0p(ii,jj+1)*p(0,0) + App(ii,jj+1)*p(1,0);

    ap(1,1) = Am0(ii+1,jj+1)*p(0,-1) + A00(ii+1,jj+1)*p(1,-1)

        +     Amp(ii+1,jj+1)*p(0,0) + A0p(ii+1,jj+1)*p(1,0);


    csten(i,j,k,2) = Real(0.25)*(restrict_from_m0_to(ii,jj)*ap(-1,0)

                            + ap(0,0)

                            + restrict_from_p0_to(ii,jj)*ap(1,0)

                            + restrict_from_mp_to(ii,jj)*ap(-1,1)

                            + restrict_from_0p_to(ii,jj)*ap(0,1)

                            + restrict_from_pp_to(ii,jj)*ap(1,1));


    // csten(i,j,k,3)

    p(-1,-1) = interp_from_pp_to(ii+1,jj+1);

    p( 0,-1) = interp_from_0p_to(ii+2,jj+1);

    p(-1, 0) = interp_from_p0_to(ii+1,jj+2);

    p( 0, 0) = Real(1.);


    ap(0,0) = App(ii,jj)*p(-1,-1);

    ap(1,0) = A0p(ii+1,jj)*p(-1,-1) + App(ii+1,jj)*p(0,-1);

    ap(0,1) = Ap0(ii,jj+1)*p(-1,-1) + App(ii,jj+1)*p(-1,0);

    ap(1,1) = A00(ii+1,jj+1)*p(-1,-1) + Ap0(ii+1,jj+1)*p(0,-1)

        +     A0p(ii+1,jj+1)*p(-1,0) + App(ii+1,jj+1)*p(0,0);


    Real cross1 = Real(0.25)*(ap(0,0)

                           + restrict_from_p0_to(ii,jj)*ap(1,0)

                           + restrict_from_0p_to(ii,jj)*ap(0,1)

                           + restrict_from_pp_to(ii,jj)*ap(1,1));


    p(0,-1) = interp_from_0p_to(ii,jj+1);

    p(1,-1) = interp_from_mp_to(ii+1,jj+1);

    p(0, 0) = Real(1.);

    p(1, 0) = interp_from_m0_to(ii+1,jj+2);


    ap(-1,0) = Amp(ii+1,jj)*p(0,-1) + A0p(ii+1,jj)*p(1,-1);

    ap( 0,0) = Amp(ii+2,jj)*p(1,-1);

    ap(-1,1) = Am0(ii+1,jj+1)*p(0,-1) + A00(ii+1,jj+1)*p(1,-1) + Amp(ii+1,jj+1)*p(0,0)

        + A0p(ii+1,jj+1)*p(1,0);

    ap( 0,1) = Am0(ii+2,jj+1)*p(1,-1) + Amp(ii+2,jj+1)*p(1,0);


    Real cross2 = Real(0.25)*(ap(0,0)

                           + restrict_from_m0_to(ii+2,jj)*ap(-1,0)

                           + restrict_from_mp_to(ii+2,jj)*ap(-1,1)

                           + restrict_from_0p_to(ii+2,jj)*ap( 0,1));


    csten(i,j,k,3) = Real(0.5)*(cross1+cross2);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


Real mlndlap_adotx_sten_doit (int i, int j, int k, Array4<Real const> const& x,

                              Array4<Real const> const& sten) noexcept

{

    return     x(i-1,j-1,k)*sten(i-1,j-1,k,3)

        +      x(i  ,j-1,k)*sten(i  ,j-1,k,2)

        +      x(i+1,j-1,k)*sten(i  ,j-1,k,3)

        +      x(i-1,j  ,k)*sten(i-1,j  ,k,1)

        +      x(i  ,j  ,k)*sten(i  ,j  ,k,0)

        +      x(i+1,j  ,k)*sten(i  ,j  ,k,1)

        +      x(i-1,j+1,k)*sten(i-1,j  ,k,3)

        +      x(i  ,j+1,k)*sten(i  ,j  ,k,2)

        +      x(i+1,j+1,k)*sten(i  ,j  ,k,3);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

Real mlndlap_adotx_sten (int i, int j, int k, Array4<Real const> const& x,

                         Array4<Real const> const& sten, Array4<int const> const& msk) noexcept

{

    if (msk(i,j,k)) {

        return Real(0.0);

    } else {

        return mlndlap_adotx_sten_doit(i,j,k,x,sten);

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE


void mlndlap_gauss_seidel_sten (int i, int j, int k, Array4<Real> const& sol,

                                Array4<Real const> const& rhs,

                                Array4<Real const> const& sten,

                                Array4<int const> const& msk) noexcept

{

    if (msk(i,j,k)) {

        sol(i,j,k) = Real(0.0);

    } else if (sten(i,j,k,0) != Real(0.0)) {

        Real Ax = mlndlap_adotx_sten_doit(i,j,k,sol,sten);

        sol(i,j,k) += (rhs(i,j,k) - Ax) / sten(i,j,k,0);

    }

}


inline

void mlndlap_gauss_seidel_sten (Box const& bx, Array4<Real> const& sol,

                                Array4<Real const> const& rhs,

                                Array4<Real const> const& sten,

                                Array4<int const> const& msk) noexcept

{

    AMREX_LOOP_3D(bx, i, j, k,

    {

        mlndlap_gauss_seidel_sten(i,j,k,sol,rhs,sten,msk);

    });

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_interpadd_rap (int i, int j, int, Array4<Real> const& fine,

                            Array4<Real const> const& crse, Array4<Real const> const& sten,

                            Array4<int const> const& msk) noexcept

{

    using namespace nodelap_detail;


    if (!msk(i,j,0) && sten(i,j,0,0) != Real(0.0)) {

        int ic = amrex::coarsen(i,2);

        int jc = amrex::coarsen(j,2);

        bool ieven = ic*2 == i;

        bool jeven = jc*2 == j;

        Real fv;

        if (ieven && jeven) {

            fv = crse(ic,jc,0);

        } else if (ieven) {

            Real wym = std::abs(sten(i,j-1,0,2));

            Real wyp = std::abs(sten(i,j  ,0,2));

            fv = (wym*crse(ic,jc,0) + wyp*crse(ic,jc+1,0)) / (wym+wyp+eps);

        } else if (jeven) {

            Real wxm = std::abs(sten(i-1,j,0,1));

            Real wxp = std::abs(sten(i  ,j,0,1));

            fv = (wxm*crse(ic,jc,0) + wxp*crse(ic+1,jc,0)) / (wxm+wxp+eps);

        } else {

            Real wxm = std::abs(sten(i-1,j  ,0,1)) /

                (std::abs(sten(i-1,j-1,0,3))+std::abs(sten(i-1,j  ,0,3))+eps);

            Real wxp = std::abs(sten(i  ,j  ,0,1)) /

                (std::abs(sten(i  ,j-1,0,3))+std::abs(sten(i  ,j  ,0,3))+eps);

            Real wym = std::abs(sten(i  ,j-1,0,2)) /

                (std::abs(sten(i-1,j-1,0,3))+std::abs(sten(i  ,j-1,0,3))+eps);

            Real wyp = std::abs(sten(i  ,j  ,0,2)) /

                (std::abs(sten(i-1,j  ,0,3))+std::abs(sten(i  ,j  ,0,3))+eps);

            Real wmm = std::abs(sten(i-1,j-1,0,3)) * (Real(1.0) + wxm + wym);

            Real wpm = std::abs(sten(i,j-1,0,3)) * (Real(1.0) + wxp + wym);

            Real wmp = std::abs(sten(i-1,j,0,3)) *(Real(1.0) + wxm + wyp);

            Real wpp = std::abs(sten(i,j,0,3)) * (Real(1.0) + wxp + wyp);

            fv = (wmm*crse(ic,jc,0) + wpm*crse(ic+1,jc,0)

                  + wmp*crse(ic,jc+1,0) + wpp*crse(ic+1,jc+1,0))

                / (wmm+wpm+wmp+wpp+eps);

        }


        fine(i,j,0) += fv;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_restriction_rap (int i, int j, int /*k*/, Array4<Real> const& crse,

                              Array4<Real const> const& fine, Array4<Real const> const& sten,

                              Array4<int const> const& msk) noexcept

{

    using namespace nodelap_detail;


    int ii = i*2;

    int jj = j*2;

    if (msk(ii,jj,0)) {

        crse(i,j,0) = Real(0.0);

    } else {


        Real cv = fine(ii,jj,0)

            + fine(ii-1,jj  ,0)*std::abs(sten(ii-1,jj  ,0,1))

            /                  (std::abs(sten(ii-2,jj  ,0,1))

                               +std::abs(sten(ii-1,jj  ,0,1))+eps)

            + fine(ii+1,jj  ,0)*std::abs(sten(ii  ,jj  ,0,1))

            /                  (std::abs(sten(ii  ,jj  ,0,1))

                               +std::abs(sten(ii+1,jj  ,0,1))+eps)

            + fine(ii  ,jj-1,0)*std::abs(sten(ii  ,jj-1,0,2))

            /                  (std::abs(sten(ii  ,jj-2,0,2))

                               +std::abs(sten(ii  ,jj-1,0,2))+eps)

            + fine(ii  ,jj+1,0)*std::abs(sten(ii  ,jj  ,0,2))

            /                  (std::abs(sten(ii  ,jj  ,0,2))

                               +std::abs(sten(ii  ,jj+1,0,2))+eps);


        Real wxp = std::abs(sten(ii-1,jj-1,0,1))

            /     (std::abs(sten(ii-1,jj-2,0,3))

                  +std::abs(sten(ii-1,jj-1,0,3))+eps);

        Real wyp = std::abs(sten(ii-1,jj-1,0,2))

            /     (std::abs(sten(ii-2,jj-1,0,3))

                  +std::abs(sten(ii-1,jj-1,0,3))+eps);

        Real wpp = std::abs(sten(ii-1,jj-1,0,3))*(Real(1.0) + wxp + wyp);

        cv +=           wpp*sten(ii-1,jj-1,0,4)*fine(ii-1,jj-1,0);


        Real wxm = std::abs(sten(ii  ,jj-1,0,1))

            /     (std::abs(sten(ii  ,jj-2,0,3))

                  +std::abs(sten(ii  ,jj-1,0,3))+eps);

        wyp      = std::abs(sten(ii+1,jj-1,0,2))

            /     (std::abs(sten(ii  ,jj-1,0,3))

                  +std::abs(sten(ii+1,jj-1,0,3))+eps);

        Real wmp = std::abs(sten(ii  ,jj-1,0,3))*(Real(1.0) + wxm + wyp);

        cv +=           wmp*sten(ii+1,jj-1,0,4)*fine(ii+1,jj-1,0);


        wxp      = std::abs(sten(ii-1,jj+1,0,1))

            /     (std::abs(sten(ii-1,jj  ,0,3))

                  +std::abs(sten(ii-1,jj+1,0,3))+eps);

        Real wym = std::abs(sten(ii-1,jj  ,0,2))

            /     (std::abs(sten(ii-2,jj  ,0,3))

                  +std::abs(sten(ii-1,jj  ,0,3))+eps);

        Real wpm = std::abs(sten(ii-1,jj  ,0,3)) * (Real(1.0) + wxp + wym);

        cv +=           wpm*sten(ii-1,jj+1,0,4)*fine(ii-1,jj+1,0);


        wxm      = std::abs(sten(ii  ,jj+1,0,1))

            /     (std::abs(sten(ii  ,jj  ,0,3))

                  +std::abs(sten(ii  ,jj+1,0,3))+eps);

        wym      = std::abs(sten(ii+1,jj  ,0,2))

            /     (std::abs(sten(ii  ,jj  ,0,3))

                  +std::abs(sten(ii+1,jj  ,0,3))+eps);

        Real wmm = std::abs(sten(ii  ,jj  ,0,3)) * (Real(1.0) + wxm + wym);

        cv +=           wmm*sten(ii+1,jj+1,0,4)*fine(ii+1,jj+1,0);


        crse(i,j,0) = cv * Real(0.25);

    }

}


#ifdef AMREX_USE_EB


namespace nodelap_detail {

    constexpr int i_S_x     = 0;

    constexpr int i_S_y     = 1;

    constexpr int i_S_x2    = 2;

    constexpr int i_S_y2    = 3;

    constexpr int i_S_xy    = 4;

    constexpr int n_Sintg   = 5;


    constexpr int i_B_x     = 0;

    constexpr int i_B_y     = 1;

    constexpr int i_B_xy    = 2;

    constexpr int n_Bintg   = 3;

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_connection (int i, int j, int, Array4<Real> const& conn,

                             Array4<Real const> const& intg, Array4<Real const> const& vol,

                             Array4<EBCellFlag const> const& flag) noexcept

{

    using namespace nodelap_detail;


    if (flag(i,j,0).isCovered()) {

        for (int n = 0; n < 6; ++n) { conn(i,j,0,n) = Real(0.); }

    } else if (flag(i,j,0).isRegular() || vol(i,j,0) >= almostone) {

        for (int n = 0; n < 6; ++n) { conn(i,j,0,n) = Real(1.); }

    } else {

        // Note that these are normalized so that they equal 1 in the case of a regular cell


        conn(i,j,0,0) = Real(3.)*(Real(0.25)*vol(i,j,0) + intg(i,j,0,i_S_y2) - intg(i,j,0,i_S_y));

        conn(i,j,0,1) = Real(6.)*(Real(0.25)*vol(i,j,0) - intg(i,j,0,i_S_y2));

        conn(i,j,0,2) = Real(3.)*(Real(0.25)*vol(i,j,0) + intg(i,j,0,i_S_y2) + intg(i,j,0,i_S_y));


        conn(i,j,0,3) = Real(3.)*(Real(0.25)*vol(i,j,0) + intg(i,j,0,i_S_x2) - intg(i,j,0,i_S_x));

        conn(i,j,0,4) = Real(6.)*(Real(0.25)*vol(i,j,0) - intg(i,j,0,i_S_x2));

        conn(i,j,0,5) = Real(3.)*(Real(0.25)*vol(i,j,0) + intg(i,j,0,i_S_x2) + intg(i,j,0,i_S_x));

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_stencil_eb (int i, int j, int, Array4<Real> const& sten,

                             Array4<Real const> const& sig, Array4<Real const> const& conn,

                             GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(1./6.)*dxinv[0]*dxinv[0];

    Real facy = Real(1./6.)*dxinv[1]*dxinv[1];


    sten(i,j,0,1) = Real(2.)*facx*(sig(i,j-1,0)*conn(i,j-1,0,2)+sig(i,j,0)*conn(i,j,0,0))

                            -facy*(sig(i,j-1,0)*conn(i,j-1,0,4)+sig(i,j,0)*conn(i,j,0,4));

    sten(i,j,0,2) = Real(2.)*facy*(sig(i-1,j,0)*conn(i-1,j,0,5)+sig(i,j,0)*conn(i,j,0,3))

                            -facx*(sig(i-1,j,0)*conn(i-1,j,0,1)+sig(i,j,0)*conn(i,j,0,1));

    sten(i,j,0,3) = (facx*conn(i,j,0,1)+facy*conn(i,j,0,4))*sig(i,j,0);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_divu_eb (int i, int j, int, Array4<Real> const& rhs, Array4<Real const> const& vel,

                      Array4<Real const> const& vfrac, Array4<Real const> const& intg,

                      Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                      Box const& nodal_domain,

                      GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bclo,

                      GpuArray<LinOpBCType, AMREX_SPACEDIM> const& bchi) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];


    const auto domlo = amrex::lbound(nodal_domain);

    const auto domhi = amrex::ubound(nodal_domain);


    if (!msk(i,j,0)) {


        Real zero_ilo = Real(1.0);

        Real zero_ihi = Real(1.0);

        Real zero_jlo = Real(1.0);

        Real zero_jhi = Real(1.0);


        // The nodal divergence operator should not see the tangential velocity

        //     at an inflow face

        if ((bclo[0] == LinOpBCType::Neumann || bclo[0] == LinOpBCType::inflow)

            && i == domlo.x)

        {

            zero_ilo = Real(0.0);

        }

        if ((bchi[0] == LinOpBCType::Neumann || bchi[0] == LinOpBCType::inflow)

            && i == domhi.x)

        {

            zero_ihi = Real(0.0);

        }

        if ((bclo[1] == LinOpBCType::Neumann || bclo[1] == LinOpBCType::inflow)

            && j == domlo.y)

        {

            zero_jlo = Real(0.0);

        }

        if ((bchi[1] == LinOpBCType::Neumann || bchi[1] == LinOpBCType::inflow)

            && j == domhi.y)

        {

            zero_jhi = Real(0.0);

        }


        rhs(i,j,0) = facx*(-vel(i-1,j-1,0,0)*(vfrac(i-1,j-1,0)+Real(2.)*intg(i-1,j-1,0,1))*zero_jlo

                           +vel(i  ,j-1,0,0)*(vfrac(i  ,j-1,0)+Real(2.)*intg(i  ,j-1,0,1))*zero_jlo

                           -vel(i-1,j  ,0,0)*(vfrac(i-1,j  ,0)-Real(2.)*intg(i-1,j  ,0,1))*zero_jhi

                           +vel(i  ,j  ,0,0)*(vfrac(i  ,j  ,0)-Real(2.)*intg(i  ,j  ,0,1))*zero_jhi)

                   + facy*(-vel(i-1,j-1,0,1)*(vfrac(i-1,j-1,0)+Real(2.)*intg(i-1,j-1,0,0))*zero_ilo

                           -vel(i  ,j-1,0,1)*(vfrac(i  ,j-1,0)-Real(2.)*intg(i  ,j-1,0,0))*zero_ihi

                           +vel(i-1,j  ,0,1)*(vfrac(i-1,j  ,0)+Real(2.)*intg(i-1,j  ,0,0))*zero_ilo

                           +vel(i  ,j  ,0,1)*(vfrac(i  ,j  ,0)-Real(2.)*intg(i  ,j  ,0,0))*zero_ihi);

    } else {

        rhs(i,j,0) = Real(0.);

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void add_eb_flow_contribution (int i, int j, int, Array4<Real> const& rhs,

                      Array4<int const> const& msk, GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                      Array4<Real const> const& bareaarr,

                      Array4<Real const> const& sintg,

                      Array4<Real const> const& eb_vel_dot_n) noexcept

{

    using namespace nodelap_detail;


    Real fac_eb = 0.25 *dxinv[0];


    if (!msk(i,j,0)) {

        rhs(i,j,0) += fac_eb*(

           eb_vel_dot_n(i-1,j-1,0)*(         bareaarr(i-1,j-1,0)

                                      +Real(2.)*sintg(i-1,j-1,0,i_B_x )

                                      +Real(2.)*sintg(i-1,j-1,0,i_B_y )

                                      +Real(4.)*sintg(i-1,j-1,0,i_B_xy))

          +eb_vel_dot_n(i  ,j-1,0)*(         bareaarr(i  ,j-1,0)

                                      -Real(2.)*sintg(i  ,j-1,0,i_B_x )

                                      +Real(2.)*sintg(i  ,j-1,0,i_B_y )

                                      -Real(4.)*sintg(i  ,j-1,0,i_B_xy))

          +eb_vel_dot_n(i-1,j  ,0)*(         bareaarr(i-1,j  ,0)

                                      +Real(2.)*sintg(i-1,j  ,0,i_B_x )

                                      -Real(2.)*sintg(i-1,j  ,0,i_B_y )

                                      -Real(4.)*sintg(i-1,j  ,0,i_B_xy))

          +eb_vel_dot_n(i  ,j  ,0)*(         bareaarr(i  ,j  ,0)

                                      -Real(2.)*sintg(i  ,j  ,0,i_B_x )

                                      -Real(2.)*sintg(i  ,j  ,0,i_B_y )

                                      +Real(4.)*sintg(i  ,j  ,0,i_B_xy)));

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_mknewu_eb (int i, int j, int, Array4<Real> const& u, Array4<Real const> const& p,

                        Array4<Real const> const& sig, Array4<Real const> const& vfrac,

                        Array4<Real const> const& intg, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];

    if (vfrac(i,j,0) == Real(0.)) {

        u(i,j,0,0) = u(i,j,0,1) = Real(0.);

    } else {

        Real dpdx = facx*(-p(i,j,0)+p(i+1,j,0)-p(i,j+1,0)+p(i+1,j+1,0));

        Real dpdy = facy*(-p(i,j,0)-p(i+1,j,0)+p(i,j+1,0)+p(i+1,j+1,0));

        Real dpp = (p(i,j,0)+p(i+1,j+1,0)-p(i+1,j,0)-p(i,j+1,0))/vfrac(i,j,0);

        u(i,j,0,0) -= sig(i,j,0)*(dpdx + dxinv[0]*intg(i,j,0,1)*dpp);

        u(i,j,0,1) -= sig(i,j,0)*(dpdy + dxinv[1]*intg(i,j,0,0)*dpp);

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_mknewu_eb_c (int i, int j, int, Array4<Real> const& u, Array4<Real const> const& p,

                          Real sig, Array4<Real const> const& vfrac,

                          Array4<Real const> const& intg, GpuArray<Real,AMREX_SPACEDIM> const& dxinv) noexcept

{

    Real facx = Real(0.5)*dxinv[0];

    Real facy = Real(0.5)*dxinv[1];

    if (vfrac(i,j,0) == Real(0.)) {

        u(i,j,0,0) = u(i,j,0,1) = Real(0.);

    } else {

        Real dpdx = facx*(-p(i,j,0)+p(i+1,j,0)-p(i,j+1,0)+p(i+1,j+1,0));

        Real dpdy = facy*(-p(i,j,0)-p(i+1,j,0)+p(i,j+1,0)+p(i+1,j+1,0));

        Real dpp = (p(i,j,0)+p(i+1,j+1,0)-p(i+1,j,0)-p(i,j+1,0))/vfrac(i,j,0);

        u(i,j,0,0) -= sig*(dpdx + dxinv[0]*intg(i,j,0,1)*dpp);

        u(i,j,0,1) -= sig*(dpdy + dxinv[1]*intg(i,j,0,0)*dpp);

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

Real mlndlap_rhcc_eb (int i, int j, int, Array4<Real const> const& rhcc,

                      Array4<Real const> const& vfrac, Array4<Real const> const& intg,

                      Array4<int const> const& msk) noexcept

{

    using namespace nodelap_detail;


    if (!msk(i,j,0)) {

        return

            rhcc(i  ,j  ,0)*(Real(0.25)*vfrac(i  ,j  ,0)-intg(i  ,j  ,0,i_S_x)-intg(i  ,j  ,0,i_S_y)+intg(i  ,j  ,0,i_S_xy)) +

            rhcc(i-1,j  ,0)*(Real(0.25)*vfrac(i-1,j  ,0)+intg(i-1,j  ,0,i_S_x)-intg(i-1,j  ,0,i_S_y)-intg(i-1,j  ,0,i_S_xy)) +

            rhcc(i-1,j-1,0)*(Real(0.25)*vfrac(i-1,j-1,0)+intg(i-1,j-1,0,i_S_x)+intg(i-1,j-1,0,i_S_y)+intg(i-1,j-1,0,i_S_xy)) +

            rhcc(i  ,j-1,0)*(Real(0.25)*vfrac(i  ,j-1,0)-intg(i  ,j-1,0,i_S_x)+intg(i  ,j-1,0,i_S_y)-intg(i  ,j-1,0,i_S_xy));

    } else {

        return Real(0.);

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_integral (int i, int j, int, Array4<Real> const& intg) noexcept

{

    using namespace nodelap_detail;


    intg(i,j,0,i_S_x ) = Real(0.);

    intg(i,j,0,i_S_y ) = Real(0.);

    intg(i,j,0,i_S_x2) = Real(1./12.);

    intg(i,j,0,i_S_y2) = Real(1./12.);

    intg(i,j,0,i_S_xy) = Real(0.);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_surface_integral (int i, int j, int, Array4<Real> const& sintg) noexcept

{

    using namespace nodelap_detail;


    sintg(i,j,0,i_B_x ) = Real(0.);

    sintg(i,j,0,i_B_y ) = Real(0.);

    sintg(i,j,0,i_B_xy) = Real(0.);

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_integral_eb (int i, int j, int, Array4<Real> const& intg,

                              Array4<EBCellFlag const> const& flag, Array4<Real const> const& vol,

                              Array4<Real const> const& ax, Array4<Real const> const& ay,

                              Array4<Real const> const& bcen) noexcept

{

    using namespace nodelap_detail;


    if (flag(i,j,0).isCovered()) {

        intg(i,j,0,i_S_x ) = Real(0.);

        intg(i,j,0,i_S_y ) = Real(0.);

        intg(i,j,0,i_S_x2) = Real(0.);

        intg(i,j,0,i_S_y2) = Real(0.);

        intg(i,j,0,i_S_xy) = Real(0.);

    } else if (flag(i,j,0).isRegular() || vol(i,j,0) >= almostone) {

        intg(i,j,0,i_S_x ) = Real(0.);

        intg(i,j,0,i_S_y ) = Real(0.);

        intg(i,j,0,i_S_x2) = Real(1./12.);

        intg(i,j,0,i_S_y2) = Real(1./12.);

        intg(i,j,0,i_S_xy) = Real(0.);

    } else {

        Real axm = ax(i,j,0);

        Real axp = ax(i+1,j,0);

        Real aym = ay(i,j,0);

        Real ayp = ay(i,j+1,0);


        Real apnorm = std::sqrt((axm-axp)*(axm-axp) + (aym-ayp)*(aym-ayp));

        if (apnorm == Real(0.)) {

            amrex::Abort("amrex_mlndlap_set_integral: we are in trouble");

        }


        Real apnorminv = Real(1.)/apnorm;

        Real anrmx = (axm-axp) * apnorminv;  // pointing to the wall

        Real anrmy = (aym-ayp) * apnorminv;


        Real bcx = bcen(i,j,0,0);

        Real bcy = bcen(i,j,0,1);


        Real Sx, Sy, Sx2, Sy2, Sxy;

        if (std::abs(anrmx) <= almostzero) {

            Sx = Real(0.);

            Sx2 = Real(1./24.)*(axm+axp);

            Sxy = Real(0.);

        } else if (std::abs(anrmy) <= almostzero) {

            Sx  = Real(1./8.) *(axp-axm) + anrmx*Real(0.5)*(bcx*bcx);

            Sx2 = Real(1./24.)*(axp+axm) + anrmx*Real(1./3.)*(bcx*bcx*bcx);

            Sxy = Real(0.);

        } else {

            Real xmin, xmax;

            if (anrmx > Real(0.)) {

                xmin = Real(-0.5) + amrex::min(aym,ayp);

                xmax = Real(-0.5) + amrex::max(aym,ayp);

            } else {

                xmin = Real(0.5) - amrex::max(aym,ayp);

                xmax = Real(0.5) - amrex::min(aym,ayp);

            }

            Real xmin3 = xmin*xmin*xmin;

            Real xmin4 = xmin3*xmin;

            Real xmax3 = xmax*xmax*xmax;

            Real xmax4 = xmax3*xmax;

            Sx  = Real(1./8.) *(axp-axm) + (anrmx/std::abs(anrmy))*Real(1./6.) *(xmax3-xmin3);

            Sx2 = Real(1./24.)*(axp+axm) + (anrmx/std::abs(anrmy))*Real(1./12.)*(xmax4-xmin4);


            Real kk = -anrmx/anrmy;

            Real bb = bcy-kk*bcx;

            Sxy = Real(1./8.)*kk*kk*(xmax4-xmin4) + Real(1./3.)*kk*bb*(xmax3-xmin3)

                + (Real(0.25)*bb*bb-Real(1./16.))*(xmax*xmax-xmin*xmin);

            Sxy = std::copysign(Sxy, anrmy);

        }


        if (std::abs(anrmy) <= almostzero) {

            Sy = Real(0.);

            Sy2 = Real(1./24.)*(aym+ayp);

        } else if (std::abs(anrmx) <= almostzero) {

            Sy  = Real(1./8.) *(ayp-aym) + anrmy*Real(0.5)*(bcy*bcy);

            Sy2 = Real(1./24.)*(ayp+aym) + anrmy*Real(1./3.)*(bcy*bcy*bcy);

        } else {

            Real ymin, ymax;

            if (anrmy > Real(0.)) {

                ymin = Real(-0.5) + amrex::min(axm,axp);

                ymax = Real(-0.5) + amrex::max(axm,axp);

            } else {

                ymin = Real(0.5) - amrex::max(axm,axp);

                ymax = Real(0.5) - amrex::min(axm,axp);

            }

            Real ymin3 = ymin*ymin*ymin;

            Real ymin4 = ymin3*ymin;

            Real ymax3 = ymax*ymax*ymax;

            Real ymax4 = ymax3*ymax;

            Sy  = Real(1./8.) *(ayp-aym) + (anrmy/std::abs(anrmx))*Real(1./6.) *(ymax3-ymin3);

            Sy2 = Real(1./24.)*(ayp+aym) + (anrmy/std::abs(anrmx))*Real(1./12.)*(ymax4-ymin4);

        }


        intg(i,j,0,i_S_x ) = Sx;

        intg(i,j,0,i_S_y ) = Sy;

        intg(i,j,0,i_S_x2) = Sx2;

        intg(i,j,0,i_S_y2) = Sy2;

        intg(i,j,0,i_S_xy) = Sxy;

    }

}


AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE

void mlndlap_set_surface_integral_eb (int i, int j, int, Array4<Real> const& sintg,

                              Array4<EBCellFlag const> const& flag,

                              Array4<Real const> const& bcen,

                              Array4<Real const> const& barea,

                              Array4<Real const> const& bnorm) noexcept

{

    using namespace nodelap_detail;


    if (flag(i,j,0).isCovered() || flag(i,j,0).isRegular()) {

        sintg(i,j,0,i_B_x ) = Real(0.);

        sintg(i,j,0,i_B_y ) = Real(0.);

        sintg(i,j,0,i_B_xy) = Real(0.);

    } else {

        Real bcx = bcen(i,j,0,0);

        Real bcy = bcen(i,j,0,1);


        Real btanx =  bnorm(i,j,0,1);

        Real btany = -bnorm(i,j,0,0);


        Real x0 =  bcx - Real(0.5)*barea(i,j,0)*btanx;

        Real x1 =  bcx + Real(0.5)*barea(i,j,0)*btanx;


        Real y0 =  bcy - Real(0.5)*barea(i,j,0)*btany;

        Real y1 =  bcy + Real(0.5)*barea(i,j,0)*btany;


        Real Bx  = barea(i,j,0)*Real(0.5)*(x1 + x0);

        Real By  = barea(i,j,0)*Real(0.5)*(y1 + y0);

        Real Bxy = barea(i,j,0)*(x0*y0 + (x0*(y1 - y0) + y0*(x1 - x0))/Real(2.) + (x1 - x0)*(y1 - y0)/Real(3.));


        sintg(i,j,0,i_B_x ) = Bx;

        sintg(i,j,0,i_B_y ) = By;

        sintg(i,j,0,i_B_xy) = Bxy;

    }

}


#endif


#if defined(AMREX_USE_HYPRE)


template <typename HypreInt, typename AtomicInt>

void mlndlap_fillijmat_sten_cpu (Box const& ndbx,

                                 Array4<AtomicInt const> const& gid,

                                 Array4<int const> const& lid,

                                 HypreInt* ncols, HypreInt* cols,

                                 Real* mat, // NOLINT(readability-non-const-parameter)

                                 Array4<Real const> const& sten) noexcept

{

    constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

    HypreInt nelems = 0;

    amrex::LoopOnCpu(ndbx, [&] (int i, int j, int k) noexcept

    {

        if (lid(i,j,k) >= 0)

        {

            cols[nelems] = gid(i,j,k);

            mat[nelems] = sten(i,j,k,0);

            HypreNodeLap::Int nelems_old = nelems;

            ++nelems;


            if                (gid(i-1,j-1,k) < gidmax) {

                cols[nelems] = gid(i-1,j-1,k);

                mat[nelems] = sten(i-1,j-1,k,3);

                ++nelems;

            }


            if                (gid(i,j-1,k) < gidmax) {

                cols[nelems] = gid(i,j-1,k);

                mat[nelems] = sten(i,j-1,k,2);

                ++nelems;

            }


            if                (gid(i+1,j-1,k) < gidmax) {

                cols[nelems] = gid(i+1,j-1,k);

                mat[nelems] = sten(i  ,j-1,k,3);

                ++nelems;

            }


            if                (gid(i-1,j,k) < gidmax) {

                cols[nelems] = gid(i-1,j,k);

                mat[nelems] = sten(i-1,j,k,1);

                ++nelems;

            }


            if                (gid(i+1,j,k) < gidmax) {

                cols[nelems] = gid(i+1,j,k);

                mat[nelems] = sten(i  ,j,k,1);

                ++nelems;

            }


            if                (gid(i-1,j+1,k) < gidmax) {

                cols[nelems] = gid(i-1,j+1,k);

                mat[nelems] = sten(i-1,j  ,k,3);

                ++nelems;

            }


            if                (gid(i,j+1,k) < gidmax) {

                cols[nelems] = gid(i,j+1,k);

                mat[nelems] = sten(i,j  ,k,2);

                ++nelems;

            }


            if                (gid(i+1,j+1,k) < gidmax) {

                cols[nelems] = gid(i+1,j+1,k);

                mat[nelems] = sten(i  ,j  ,k,3);

                ++nelems;

            }


            ncols[lid(i,j,k)] = nelems - nelems_old;

        }

    });

}


template <typename HypreInt, typename AtomicInt>

void mlndlap_fillijmat_aa_cpu (Box const& ndbx,

                               Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Array4<Real const> const& sig,

                               GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    // Note that ccdom has been grown at periodic boundaries.

    const Box& nddom = amrex::surroundingNodes(ccdom);


    constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

    HypreInt nelems = 0;

    amrex::LoopOnCpu(ndbx, [&] (int i, int j, int k) noexcept

    {

        if (lid(i,j,k) >= 0)

        {

            Real fp, fm;

            if (is_rz) {

                fp = facy / static_cast<Real>(2*i+1);

                fm = facy / static_cast<Real>(2*i-1);

            } else {

                fp = fm = Real(0.0);

            }


            HypreInt nelems_old = nelems;

            cols[nelems_old] = gid(i,j,k);

            Real m0 = Real(0.);

            ++nelems;


            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = fxy*sig(i-1,j-1,k);

                m0 -= tmp;

                if (               gid(i-1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=       sig(i-1,j-1,k) * (fmx2y + fm);

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp +=       sig(i,j-1,k) * (fmx2y - fp);

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    cols[nelems] = gid(i,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = fxy*sig(i  ,j-1,k);

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += f2xmy*sig(i-1,j-1,k);

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp += f2xmy*sig(i-1,j,k);

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    cols[nelems] = gid(i-1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp += f2xmy*sig(i  ,j-1,k);

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp += f2xmy*sig(i  ,j,k);

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    cols[nelems] = gid(i+1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = fxy*sig(i-1,j  ,k);

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp +=       sig(i-1,j  ,k) * (fmx2y + fm);

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp +=       sig(i,j  ,k) * (fmx2y - fp);

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    cols[nelems] = gid(i,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = fxy*sig(i  ,j  ,k);

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            mat[nelems_old] = m0;

            ncols[lid(i,j,k)] = nelems - nelems_old;

        }

    });

}


template <typename HypreInt, typename AtomicInt>

void mlndlap_fillijmat_ha_cpu (Box const& ndbx,

                               Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Array4<Real const> const& sx,

                               Array4<Real const> const& sy,

                               GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];


    // Note that ccdom has been grown at periodic boundaries.

    const Box& nddom = amrex::surroundingNodes(ccdom);


    constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

    HypreInt nelems = 0;

    amrex::LoopOnCpu(ndbx, [&] (int i, int j, int k) noexcept

    {

        if (lid(i,j,k) >= 0)

        {

            Real fp, fm;

            if (is_rz) {

                fp = facy / static_cast<Real>(2*i+1);

                fm = facy / static_cast<Real>(2*i-1);

            } else {

                fp = fm = Real(0.0);

            }


            HypreInt nelems_old = nelems;

            cols[nelems_old] = gid(i,j,k);

            Real m0 = Real(0.);

            ++nelems;


            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = facx*sx(i-1,j-1,k) + facy*sy(i-1,j-1,k);

                m0 -= tmp;

                if (               gid(i-1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=        sy(i-1,j-1,k) * (facy * Real(2.0) + fm)

                                - sx(i-1,j-1,k) *  facx;

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp +=        sy(i,j-1,k) * (facy * Real(2.0) - fp)

                                - sx(i,j-1,k) *  facx;

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    cols[nelems] = gid(i,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = facx*sx(i  ,j-1,k) + facy*sy(i  ,j-1,k);

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=        sx(i-1,j-1,k) * facx*Real(2.0)

                                - sy(i-1,j-1,k) * facy;

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp +=        sx(i-1,j,k) * facx*Real(2.0)

                                - sy(i-1,j,k) * facy;

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    cols[nelems] = gid(i-1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp +=        sx(i  ,j-1,k) * facx*Real(2.0)

                                - sy(i  ,j-1,k) * facy;

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp +=        sx(i  ,j,k) * facx*Real(2.0)

                                - sy(i  ,j,k) * facy;

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    cols[nelems] = gid(i+1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = facx*sx(i-1,j  ,k) + facy*sy(i-1,j  ,k);

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp +=        sy(i-1,j  ,k) * (facy*Real(2.0) + fm)

                                - sx(i-1,j  ,k) *  facx;

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp +=       sy(i,j  ,k) * (facy*Real(2.0) - fp)

                               - sx(i,j  ,k) *  facx;

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    cols[nelems] = gid(i,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = facx*sx(i  ,j  ,k) + facy*sy(i  ,j  ,k);

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            mat[nelems_old] = m0;

            ncols[lid(i,j,k)] = nelems - nelems_old;

        }

    });

}


template <typename HypreInt, typename AtomicInt>

void mlndlap_fillijmat_cs_cpu (Box const& ndbx,

                               Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Real sig,

                               GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0] * sig;

    Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1] * sig;

    Real fxy = facx + facy;

    Real f2xmy = Real(2.0)*facx - facy;

    Real fmx2y = Real(2.0)*facy - facx;


    // Note that ccdom has been grown at periodic boundaries.

    const Box& nddom = amrex::surroundingNodes(ccdom);


    constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

    HypreInt nelems = 0;

    amrex::LoopOnCpu(ndbx, [&] (int i, int j, int k) noexcept

    {

        if (lid(i,j,k) >= 0)

        {

            Real fp, fm;

            if (is_rz) {

                fp = facy / static_cast<Real>(2*i+1);

                fm = facy / static_cast<Real>(2*i-1);

            } else {

                fp = fm = Real(0.0);

            }


            HypreInt nelems_old = nelems;

            cols[nelems_old] = gid(i,j,k);

            Real m0 = Real(0.);

            ++nelems;


            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if (               gid(i-1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += fmx2y + fm;

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp += fmx2y - fp;

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    cols[nelems] = gid(i,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j-1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += f2xmy;

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp += f2xmy;

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    cols[nelems] = gid(i-1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp += f2xmy;

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp += f2xmy;

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    cols[nelems] = gid(i+1,j,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i-1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp += fmx2y + fm;

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp += fmx2y - fp;

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    cols[nelems] = gid(i,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    cols[nelems] = gid(i+1,j+1,k);

                    mat[nelems] = tmp;

                    ++nelems;

                }

            }


            mat[nelems_old] = m0;

            ncols[lid(i,j,k)] = nelems - nelems_old;

        }

    });

}


#ifdef AMREX_USE_GPU


template <typename HypreInt, typename AtomicInt>

AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_fillijmat_sten_gpu (const int ps, const int i, const int j, const int k,

                                 const int offset,

                                 Array4<AtomicInt const> const& gid,

                                 Array4<int const> const& lid,

                                 HypreInt* ncols, HypreInt* cols,

                                 Real* mat, // NOLINT(readability-non-const-parameter)

                                 Array4<Real const> const& sten) noexcept

{

    if (lid(i,j,k) >= 0)

    {

        constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

        int nelems = 0;


        if (offset == 1 || offset == 0) {

            if                (gid(i-1,j-1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i-1,j-1,k);

                    mat[ps] = sten(i-1,j-1,k,3);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 2 || offset == 0) {

            if                (gid(i,j-1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i,j-1,k);

                    mat[ps] = sten(i,j-1,k,2);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 3 || offset == 0) {

            if                (gid(i+1,j-1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i+1,j-1,k);

                    mat[ps] = sten(i  ,j-1,k,3);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 4 || offset == 0) {

            if                (gid(i-1,j,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i-1,j,k);

                    mat[ps] = sten(i-1,j,k,1);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 5 || offset == 0) {

            if                (gid(i+1,j,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i+1,j,k);

                    mat[ps] = sten(i  ,j,k,1);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 6 || offset == 0) {

            if                (gid(i-1,j+1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i-1,j+1,k);

                    mat[ps] = sten(i-1,j  ,k,3);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 7 || offset == 0) {

            if                (gid(i,j+1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i,j+1,k);

                    mat[ps] = sten(i,j  ,k,2);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        if (offset == 8 || offset == 0) {

            if                (gid(i+1,j+1,k) < gidmax) {

                if (offset != 0) {

                    cols[ps] = gid(i+1,j+1,k);

                    mat[ps] = sten(i  ,j  ,k,3);

                }

                ++nelems;

            }

            if (offset != 0) { return; }

        }


        // Only offset == 0 could get this far.

        cols[ps] = gid(i,j,k);

        mat[ps] = sten(i,j,k,0);

        ncols[lid(i,j,k)] = nelems+1;

    }

}


template <typename HypreInt, typename AtomicInt>

AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_fillijmat_aa_gpu (const int ps, const int i, const int j, const int k,

                               const int offset,

                               Box const& ndbx, Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Array4<Real const> const& sig,

                               GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    if (lid(i,j,k) >= 0)

    {

        Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

        Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

        Real fxy = facx + facy;

        Real f2xmy = Real(2.0)*facx - facy;

        Real fmx2y = Real(2.0)*facy - facx;


        Real fp, fm;

        if (is_rz) {

            fp = facy / static_cast<Real>(2*i+1);

            fm = facy / static_cast<Real>(2*i-1);

        } else {

            fp = fm = Real(0.0);

        }


        const Box& nddom = amrex::surroundingNodes(ccdom);


        constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

        int nelems = 0;

        Real m0 = Real(0.);


        if (offset == 1 || offset == 0) {

            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = fxy*sig(i-1,j-1,k);

                m0 -= tmp;

                if                    (gid(i-1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 2 || offset == 0) {

            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=       sig(i-1,j-1,k) * (fmx2y + fm);

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp +=       sig(i,j-1,k) * (fmx2y - fp);

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 3 || offset == 0) {

            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = fxy*sig(i  ,j-1,k);

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 4 || offset == 0) {

            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += f2xmy*sig(i-1,j-1,k);

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp += f2xmy*sig(i-1,j,k);

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 5 || offset == 0) {

            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp += f2xmy*sig(i  ,j-1,k);

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp += f2xmy*sig(i  ,j,k);

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 6 || offset == 0) {

            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = fxy*sig(i-1,j  ,k);

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 7 || offset == 0) {

            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp +=       sig(i-1,j  ,k) * (fmx2y + fm);

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp +=       sig(i,j  ,k) * (fmx2y - fp);

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 8 || offset == 0) {

            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = fxy*sig(i  ,j  ,k);

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        // Only offset == 0 could get this far.

        cols[ps] = gid(i,j,k);

        mat[ps] = m0;

        ncols[lid(i,j,k)] = nelems+1;

    }

}


template <typename HypreInt, typename AtomicInt>

AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_fillijmat_ha_gpu (const int ps, const int i, const int j, const int k,

                               const int offset,

                               Box const& ndbx, Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Array4<Real const> const& sx,

                               Array4<Real const> const& sy,

                               GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    if (lid(i,j,k) >= 0)

    {

        Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

        Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];


        Real fp, fm;

        if (is_rz) {

            fp = facy / static_cast<Real>(2*i+1);

            fm = facy / static_cast<Real>(2*i-1);

        } else {

            fp = fm = Real(0.0);

        }


        const Box& nddom = amrex::surroundingNodes(ccdom);


        constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

        int nelems = 0;

        Real m0 = Real(0.);


        if (offset == 1 || offset == 0) {

            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = facx*sx(i-1,j-1,k) + facy*sy(i-1,j-1,k);

                m0 -= tmp;

                if (               gid(i-1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 2 || offset == 0) {

            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=        sy(i-1,j-1,k) * (facy * Real(2.0) + fm)

                                - sx(i-1,j-1,k) *  facx;

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp +=        sy(i,j-1,k) * (facy * Real(2.0) - fp)

                                - sx(i,j-1,k) *  facx;

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 3 || offset == 0) {

            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = facx*sx(i  ,j-1,k) + facy*sy(i  ,j-1,k);

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 4 || offset == 0) {

            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp +=        sx(i-1,j-1,k) * facx*Real(2.0)

                                - sy(i-1,j-1,k) * facy;

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp +=        sx(i-1,j,k) * facx*Real(2.0)

                                - sy(i-1,j,k) * facy;

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 5 || offset == 0) {

            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp +=        sx(i  ,j-1,k) * facx*Real(2.0)

                                - sy(i  ,j-1,k) * facy;

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp +=        sx(i  ,j,k) * facx*Real(2.0)

                                - sy(i  ,j,k) * facy;

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 6 || offset == 0) {

            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = facx*sx(i-1,j  ,k) + facy*sy(i-1,j  ,k);

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 7 || offset == 0) {

            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp +=        sy(i-1,j  ,k) * (facy*Real(2.0) + fm)

                                - sx(i-1,j  ,k) *  facx;

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp +=       sy(i,j  ,k) * (facy*Real(2.0) - fp)

                               - sx(i,j  ,k) *  facx;

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 8 || offset == 0) {

            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = facx*sx(i  ,j  ,k) + facy*sy(i  ,j  ,k);

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        // Only offset == 0 could get this far.

        cols[ps] = gid(i,j,k);

        mat[ps] = m0;

        ncols[lid(i,j,k)] = nelems+1;

    }

}


template <typename HypreInt, typename AtomicInt>

AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_fillijmat_cs_gpu (const int ps, const int i, const int j, const int k,

                               const int offset,

                               Box const& ndbx, Array4<AtomicInt const> const& gid,

                               Array4<int const> const& lid,

                               HypreInt* ncols, HypreInt* cols,

                               Real* mat, // NOLINT(readability-non-const-parameter)

                               Real sig, GpuArray<Real,AMREX_SPACEDIM> const& dxinv,

                               Box const& ccdom, bool is_rz) noexcept

{

    if (lid(i,j,k) >= 0)

    {

        Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0] * sig;

        Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1] * sig;

        Real fxy = facx + facy;

        Real f2xmy = Real(2.0)*facx - facy;

        Real fmx2y = Real(2.0)*facy - facx;


        Real fp, fm;

        if (is_rz) {

            fp = facy / static_cast<Real>(2*i+1);

            fm = facy / static_cast<Real>(2*i-1);

        } else {

            fp = fm = Real(0.0);

        }


        // Note that nddom has been grown at periodic boundaries.

        const Box& nddom = amrex::surroundingNodes(ccdom);


        constexpr auto gidmax = std::numeric_limits<AtomicInt>::max();

        int nelems = 0;

        Real m0 = Real(0.);


        if (offset == 1 || offset == 0) {

            if (nddom.contains(i-1,j-1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if (               gid(i-1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 2 || offset == 0) {

            if (nddom.contains(i,j-1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += fmx2y + fm;

                }

                if (  ccdom.contains(i,j-1,k)) {

                    tmp += fmx2y - fp;

                }

                m0 -= tmp;

                if                (gid(i,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 3 || offset == 0) {

            if (nddom.contains(i+1,j-1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i+1,j-1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j-1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 4 || offset == 0) {

            if (nddom.contains(i-1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j-1,k)) {

                    tmp += f2xmy;

                }

                if (  ccdom.contains(i-1,j,k)) {

                    tmp += f2xmy;

                }

                m0 -= tmp;

                if                (gid(i-1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 5 || offset == 0) {

            if (nddom.contains(i+1,j,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i  ,j-1,k)) {

                    tmp += f2xmy;

                }

                if (  ccdom.contains(i  ,j,k)) {

                    tmp += f2xmy;

                }

                m0 -= tmp;

                if                (gid(i+1,j,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 6 || offset == 0) {

            if (nddom.contains(i-1,j+1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i-1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i-1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 7 || offset == 0) {

            if (nddom.contains(i,j+1,k)) {

                Real tmp = Real(0.0);

                if (  ccdom.contains(i-1,j  ,k)) {

                    tmp += fmx2y + fm;

                }

                if (  ccdom.contains(i,j  ,k)) {

                    tmp += fmx2y - fp;

                }

                m0 -= tmp;

                if                (gid(i,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        if (offset == 8 || offset == 0) {

            if (nddom.contains(i+1,j+1,k)) {

                Real tmp = fxy;

                m0 -= tmp;

                if                (gid(i+1,j+1,k) < gidmax) {

                    if (offset != 0) {

                        cols[ps] = gid(i+1,j+1,k);

                        mat[ps] = tmp;

                    }

                    ++nelems;

                }

            }

            if (offset != 0) { return; }

        }


        // Only offset == 0 could get this far.

        cols[ps] = gid(i,j,k);

        mat[ps] = m0;

        ncols[lid(i,j,k)] = nelems+1;

    }

}


#endif


#endif


AMREX_GPU_DEVICE AMREX_FORCE_INLINE

int mlndlap_color (int i, int j, int)

{

    return (i%2) + (j%2)*2;

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE


void mlndlap_gscolor_ha (int i, int j, int k, Array4<Real> const& sol,

                         Array4<Real const> const& rhs, Array4<Real const> const& sx,

                         Array4<Real const> const& sy, Array4<int const> const& msk,

                         GpuArray<Real,AMREX_SPACEDIM> const& dxinv, int color,

                         bool is_rz) noexcept

{

    if (mlndlap_color(i,j,k) == color) {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

            Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];


            Real s0 = Real(-2.0)*(facx*(sx(i-1,j-1,k)+sx(i,j-1,k)+sx(i-1,j,k)+sx(i,j,k))

                                 +facy*(sy(i-1,j-1,k)+sy(i,j-1,k)+sy(i-1,j,k)+sy(i,j,k)));


            Real Ax = sol(i-1,j-1,k)*(facx*sx(i-1,j-1,k)+facy*sy(i-1,j-1,k))

                    + sol(i+1,j-1,k)*(facx*sx(i  ,j-1,k)+facy*sy(i  ,j-1,k))

                    + sol(i-1,j+1,k)*(facx*sx(i-1,j  ,k)+facy*sy(i-1,j  ,k))

                    + sol(i+1,j+1,k)*(facx*sx(i  ,j  ,k)+facy*sy(i  ,j  ,k))

                    + sol(i-1,j,k)*(Real(2.0)*facx*(sx(i-1,j-1,k)+sx(i-1,j,k))

                                        -     facy*(sy(i-1,j-1,k)+sy(i-1,j,k)))

                    + sol(i+1,j,k)*(Real(2.0)*facx*(sx(i  ,j-1,k)+sx(i  ,j,k))

                                        -     facy*(sy(i  ,j-1,k)+sy(i  ,j,k)))

                    + sol(i,j-1,k)*(   -facx*(sx(i-1,j-1,k)+sx(i,j-1,k))

                             +Real(2.0)*facy*(sy(i-1,j-1,k)+sy(i,j-1,k)))

                    + sol(i,j+1,k)*(   -facx*(sx(i-1,j  ,k)+sx(i,j  ,k))

                             +Real(2.0)*facy*(sy(i-1,j  ,k)+sy(i,j  ,k)))

                    + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm*sy(i-1,j-1,k)-fp*sy(i,j-1,k);

                Real frzhi = fm*sy(i-1,j  ,k)-fp*sy(i,j  ,k);

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax) / s0;

        }

    }

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE


void mlndlap_gscolor_aa (int i, int j, int k, Array4<Real> const& sol,

                         Array4<Real const> const& rhs, Array4<Real const> const& sig,

                         Array4<int const> const& msk,

                         GpuArray<Real,AMREX_SPACEDIM> const& dxinv, int color,

                         bool is_rz) noexcept

{

    if (mlndlap_color(i,j,k) == color) {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

            Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

            Real fxy = facx + facy;

            Real f2xmy = Real(2.0)*facx - facy;

            Real fmx2y = Real(2.0)*facy - facx;


            Real s0 = (-Real(2.0))*fxy*(sig(i-1,j-1,k)+sig(i,j-1,k)+sig(i-1,j,k)+sig(i,j,k));

            Real Ax =   sol(i-1,j-1,k)*fxy*sig(i-1,j-1,k)

                      + sol(i+1,j-1,k)*fxy*sig(i  ,j-1,k)

                      + sol(i-1,j+1,k)*fxy*sig(i-1,j  ,k)

                      + sol(i+1,j+1,k)*fxy*sig(i  ,j  ,k)

                      + sol(i-1,j,k)*f2xmy*(sig(i-1,j-1,k)+sig(i-1,j,k))

                      + sol(i+1,j,k)*f2xmy*(sig(i  ,j-1,k)+sig(i  ,j,k))

                      + sol(i,j-1,k)*fmx2y*(sig(i-1,j-1,k)+sig(i,j-1,k))

                      + sol(i,j+1,k)*fmx2y*(sig(i-1,j  ,k)+sig(i,j  ,k))

                      + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm*sig(i-1,j-1,k)-fp*sig(i,j-1,k);

                Real frzhi = fm*sig(i-1,j  ,k)-fp*sig(i,j  ,k);

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax) / s0;

        }

    }

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE


void mlndlap_gscolor_c (int i, int j, int k, Array4<Real> const& sol,

                        Array4<Real const> const& rhs, Real sig,

                        Array4<int const> const& msk,

                        GpuArray<Real,AMREX_SPACEDIM> const& dxinv, int color,

                        bool is_rz) noexcept

{

    if (mlndlap_color(i,j,k) == color) {

        if (msk(i,j,k)) {

            sol(i,j,k) = Real(0.0);

        } else {

            Real facx = Real(1.0/6.0)*dxinv[0]*dxinv[0];

            Real facy = Real(1.0/6.0)*dxinv[1]*dxinv[1];

            Real fxy = facx + facy;

            Real f2xmy = Real(2.0)*facx - facy;

            Real fmx2y = Real(2.0)*facy - facx;


            Real s0 = (-Real(2.0))*fxy*Real(4.);

            Real Ax =   sol(i-1,j-1,k)*fxy

                      + sol(i+1,j-1,k)*fxy

                      + sol(i-1,j+1,k)*fxy

                      + sol(i+1,j+1,k)*fxy

                      + sol(i-1,j,k)*f2xmy*Real(2.)

                      + sol(i+1,j,k)*f2xmy*Real(2.)

                      + sol(i,j-1,k)*fmx2y*Real(2.)

                      + sol(i,j+1,k)*fmx2y*Real(2.)

                      + sol(i,j,k)*s0;


            if (is_rz) {

                Real fp = facy / static_cast<Real>(2*i+1);

                Real fm = facy / static_cast<Real>(2*i-1);

                Real frzlo = fm-fp;

                Real frzhi = fm-fp;

                s0 += - frzhi - frzlo;

                Ax += frzhi*(sol(i,j+1,k)-sol(i,j,k))

                    + frzlo*(sol(i,j-1,k)-sol(i,j,k));

            }


            sol(i,j,k) += (rhs(i,j,k) - Ax*sig) / (s0*sig);

        }

    }

}


AMREX_GPU_DEVICE AMREX_FORCE_INLINE

void mlndlap_gscolor_sten (int i, int j, int k, Array4<Real> const& sol,

                           Array4<Real const> const& rhs,

                           Array4<Real const> const& sten,

                           Array4<int const> const& msk, int color) noexcept

{

    if (mlndlap_color(i,j,k) == color) {

        mlndlap_gauss_seidel_sten(i,j,k,sol,rhs,sten,msk);

    }

}


}

#endif

AMREX_FORCE_INLINE
#define AMREX_FORCE_INLINE
Definition AMReX_Extension.H:119

AMREX_GPU_DEVICE
#define AMREX_GPU_DEVICE
Definition AMReX_GpuQualifiers.H:18

AMREX_GPU_HOST_DEVICE
#define AMREX_GPU_HOST_DEVICE
Definition AMReX_GpuQualifiers.H:20

idir
int idir
Definition AMReX_HypreMLABecLap.cpp:1093

offset
Array4< int const  > offset
Definition AMReX_HypreMLABecLap.cpp:1089

fine
Array4< Real > fine
Definition AMReX_InterpFaceRegister.cpp:90

crse
Array4< Real const  > crse
Definition AMReX_InterpFaceRegister.cpp:92

AMREX_LOOP_3D
#define AMREX_LOOP_3D(bx, i, j, k, block)
Definition AMReX_Loop.nolint.H:4

amrex::BoxND< AMREX_SPACEDIM >

amrex::HypreNodeLap::Int
HYPRE_Int Int
Definition AMReX_HypreNodeLap.H:36

amrex::nodelap_detail::almostzero
constexpr Real almostzero
Definition AMReX_MLNodeLap_K.H:22

amrex::nodelap_detail::eps
constexpr double eps
Definition AMReX_MLNodeLap_K.H:19

amrex
Definition AMReX_Amr.cpp:49

amrex::mlndlap_adotx_ha
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_adotx_ha(int i, int, int, Array4< Real const > const &x, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:52

amrex::mlndlap_gscolor_ha
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_gscolor_ha(int i, int j, int k, Array4< Real > const &sol, Array4< Real const > const &rhs, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv, int color) noexcept
Definition AMReX_MLNodeLap_1D_K.H:426

amrex::LoopOnCpu
AMREX_ATTRIBUTE_FLATTEN_FOR void LoopOnCpu(Dim3 lo, Dim3 hi, F const &f) noexcept
Definition AMReX_Loop.H:355

amrex::mlndlap_Ax_fine_contrib_cs
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_Ax_fine_contrib_cs(int i, int j, int, Box const &ndbx, Box const &ccbx, Array4< Real > const &f, Array4< Real const > const &res, Array4< Real const > const &rhs, Array4< Real const > const &phi, Real const sig, Array4< int const > const &msk, bool is_rz, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_2D_K.H:1157

amrex::mlndlap_divu_fine_contrib
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_divu_fine_contrib(int i, int j, int, Box const &fvbx, Box const &velbx, Array4< Real > const &rhs, Array4< Real const > const &vel, Array4< Real const > const &frhs, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv, bool is_rz) noexcept
Definition AMReX_MLNodeLap_2D_K.H:867

amrex::Box
BoxND< AMREX_SPACEDIM > Box
Definition AMReX_BaseFwd.H:27

amrex::LoopConcurrentOnCpu
AMREX_ATTRIBUTE_FLATTEN_FOR void LoopConcurrentOnCpu(Dim3 lo, Dim3 hi, F const &f) noexcept
Definition AMReX_Loop.H:378

amrex::CurlCurlStateType::r
@ r

amrex::CurlCurlStateType::b
@ b

amrex::CurlCurlStateType::x
@ x

amrex::mlndlap_gauss_seidel_with_line_solve_aa
void mlndlap_gauss_seidel_with_line_solve_aa(Box const &, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &, GpuArray< Real, AMREX_SPACEDIM > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:225

amrex::mlndlap_jacobi_ha
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_jacobi_ha(int i, int, int, Array4< Real > const &sol, Real Ax, Array4< Real const > const &rhs, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:92

amrex::surroundingNodes
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE BoxND< dim > surroundingNodes(const BoxND< dim > &b, int dir) noexcept
Returns a BoxND with NODE based coordinates in direction dir that encloses BoxND b....
Definition AMReX_Box.H:1399

amrex::mlndlap_semi_avgdown_coeff
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_semi_avgdown_coeff(int i, int j, int k, Array4< Real > const &crse, Array4< Real const > const &fine, int) noexcept
Definition AMReX_MLNodeLap_1D_K.H:30

amrex::mlndlap_interpadd_rap
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_interpadd_rap(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:408

amrex::mlndlap_avgdown_coeff_y
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_avgdown_coeff_y(int i, int j, int k, Array4< Real > const &crse, Array4< Real const > const &fine) noexcept
Definition AMReX_MLNodeLap_2D_K.H:36

amrex::mlndlap_gauss_seidel_aa
void mlndlap_gauss_seidel_aa(Box const &bx, Array4< Real > const &sol, Array4< Real const > const &rhs, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:193

amrex::mlndlap_adotx_aa
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_adotx_aa(int i, int j, int k, Array4< Real const > const &x, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:66

amrex::mlndlap_jacobi_c
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_jacobi_c(int i, int, int, Array4< Real > const &sol, Real Ax, Array4< Real const > const &rhs, Real sig, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:141

amrex::mlndlap_jacobi_aa
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_jacobi_aa(int i, int j, int k, Array4< Real > const &sol, Real Ax, Array4< Real const > const &rhs, Array4< Real const > const &sig, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:125

amrex::mlndlap_adotx_sten
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_adotx_sten(int, int, int, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:396

amrex::mlndlap_interpadd_c
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_interpadd_c(int i, int, int, Array4< Real > const &fine, Array4< Real const > const &crse, Array4< int const > const &msk) noexcept
Definition AMReX_MLNodeLap_1D_K.H:233

amrex::min
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE constexpr const T & min(const T &a, const T &b) noexcept
Definition AMReX_Algorithm.H:21

amrex::mlndlap_set_stencil_s0
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_set_stencil_s0(int, int, int, Array4< Real > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:387

amrex::mlndlap_gauss_seidel_ha
void mlndlap_gauss_seidel_ha(Box const &bx, Array4< Real > const &sol, Array4< Real const > const &rhs, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:170

amrex::mlndlap_res_cf_contrib
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_res_cf_contrib(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &, Array4< int const > const &, Array4< int const > const &, Array4< Real const > const &, GpuArray< Real, AMREX_SPACEDIM > const &, Box const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, bool) noexcept
Definition AMReX_MLNodeLap_1D_K.H:357

amrex::mlndlap_normalize_aa
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_normalize_aa(int i, int j, int k, Array4< Real > const &x, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:84

amrex::mlndlap_sum_Ax
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_sum_Ax(P const &pred, S const &sig, int i, int j, Real facx, Real facy, Array4< Real const > const &phi, bool is_rz) noexcept
Definition AMReX_MLNodeLap_2D_K.H:1057

amrex::scale
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE IntVectND< dim > scale(const IntVectND< dim > &p, int s) noexcept
Returns a IntVectND obtained by multiplying each of the components of this IntVectND by s.
Definition AMReX_IntVect.H:1004

amrex::ubound
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Dim3 ubound(Array4< T > const &a) noexcept
Definition AMReX_Array4.H:319

amrex::mlndlap_rhcc_fine_contrib
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_rhcc_fine_contrib(int, int, int, Box const &, Array4< Real > const &, Array4< Real const > const &, Array4< int const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:332

amrex::mlndlap_semi_interpadd_aa
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_semi_interpadd_aa(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &, int) noexcept
Definition AMReX_MLNodeLap_1D_K.H:270

amrex::lbound
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Dim3 lbound(Array4< T > const &a) noexcept
Definition AMReX_Array4.H:312

amrex::mlndlap_set_stencil
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_set_stencil(Box const &, Array4< Real > const &, Array4< Real const > const &, GpuArray< Real, AMREX_SPACEDIM > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:381

amrex::aa_interp_line_y
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real aa_interp_line_y(Array4< Real const > const &crse, Array4< Real const > const &sig, int i, int j, int ic, int jc) noexcept
Definition AMReX_MLNodeLap_2D_K.H:582

amrex::mlndlap_zero_fine
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_zero_fine(int i, int, int, Array4< Real > const &phi, Array4< int const > const &msk, int fine_flag) noexcept
Definition AMReX_MLNodeLap_1D_K.H:8

amrex::coarsen
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE BoxND< dim > coarsen(const BoxND< dim > &b, int ref_ratio) noexcept
Coarsen BoxND by given (positive) refinement ratio. NOTE: if type(dir) = CELL centered: lo <- lo/rati...
Definition AMReX_Box.H:1304

amrex::mlndlap_adotx_c
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_adotx_c(int i, int, int, Array4< Real const > const &x, Real sigma, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:37

amrex::ha_interp_face_xy
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real ha_interp_face_xy(Array4< Real const > const &crse, Array4< Real const > const &sigx, Array4< Real const > const &sigy, int i, int j, int ic, int jc) noexcept
Definition AMReX_MLNodeLap_2D_K.H:694

amrex::mlndlap_interpadd_aa
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_interpadd_aa(int i, int, int, Array4< Real > const &fine, Array4< Real const > const &crse, Array4< Real const > const &sig, Array4< int const > const &msk) noexcept
Definition AMReX_MLNodeLap_1D_K.H:251

amrex::mlndlap_res_cf_contrib_cs
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_res_cf_contrib_cs(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Real, Array4< int const > const &, Array4< int const > const &, Array4< int const > const &, Array4< Real const > const &, GpuArray< Real, AMREX_SPACEDIM > const &, Box const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, bool) noexcept
Definition AMReX_MLNodeLap_1D_K.H:369

amrex::mlndlap_divu
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_divu(int i, int, int, Array4< Real > const &rhs, Array4< Real const > const &vel, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv, Box const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:284

amrex::mlndlap_divu_cf_contrib
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_divu_cf_contrib(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &, Array4< int const > const &, Array4< int const > const &, GpuArray< Real, AMREX_SPACEDIM > const &, Box const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, bool) noexcept
Definition AMReX_MLNodeLap_1D_K.H:338

amrex::mlndlap_gauss_seidel_sten
void mlndlap_gauss_seidel_sten(Box const &, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:401

amrex::mlndlap_gscolor_sten
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_gscolor_sten(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &, int) noexcept
Definition AMReX_MLNodeLap_1D_K.H:479

amrex::mlndlap_gscolor_aa
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_gscolor_aa(int i, int j, int k, Array4< Real > const &sol, Array4< Real const > const &rhs, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv, int color) noexcept
Definition AMReX_MLNodeLap_1D_K.H:448

amrex::mlndlap_mknewu
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_mknewu(int i, int, int, Array4< Real > const &u, Array4< Real const > const &p, Array4< Real const > const &sig, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:312

amrex::LoopConcurrent
AMREX_GPU_HOST_DEVICE AMREX_ATTRIBUTE_FLATTEN_FOR void LoopConcurrent(Dim3 lo, Dim3 hi, F const &f) noexcept
Definition AMReX_Loop.H:150

amrex::mlndlap_restriction_rap
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_restriction_rap(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< Real const > const &, Array4< int const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:414

amrex::mlndlap_gscolor_c
AMREX_GPU_DEVICE AMREX_FORCE_INLINE void mlndlap_gscolor_c(int i, int j, int k, Array4< Real > const &sol, Array4< Real const > const &rhs, Real sig, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv, int color) noexcept
Definition AMReX_MLNodeLap_1D_K.H:458

amrex::mlndlap_sum_Df
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_sum_Df(int ii, int jj, Real facx, Real facy, Array4< Real const > const &vel, Box const &velbx, bool is_rz) noexcept
Definition AMReX_MLNodeLap_2D_K.H:843

amrex::mlndlap_Ax_fine_contrib_doit
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_Ax_fine_contrib_doit(S const &sig, int i, int j, Box const &ndbx, Box const &ccbx, Array4< Real > const &f, Array4< Real const > const &res, Array4< Real const > const &rhs, Array4< Real const > const &phi, Array4< int const > const &msk, bool is_rz, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_2D_K.H:1099

amrex::max
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE constexpr const T & max(const T &a, const T &b) noexcept
Definition AMReX_Algorithm.H:35

amrex::aa_interp_face_xy
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real aa_interp_face_xy(Array4< Real const > const &crse, Array4< Real const > const &sig, int i, int j, int ic, int jc) noexcept
Definition AMReX_MLNodeLap_2D_K.H:591

amrex::mlndlap_color
AMREX_GPU_DEVICE AMREX_FORCE_INLINE int mlndlap_color(int i, int, int)
Definition AMReX_MLNodeLap_1D_K.H:420

amrex::Abort
void Abort(const std::string &msg)
Print out message to cerr and exit via abort().
Definition AMReX.cpp:230

amrex::int
const int[]
Definition AMReX_BLProfiler.cpp:1664

amrex::mlndlap_crse_resid
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_crse_resid(int, int, int, Array4< Real > const &, Array4< Real const > const &, Array4< int const > const &, Box const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &, bool) noexcept
Definition AMReX_MLNodeLap_1D_K.H:349

amrex::mlndlap_normalize_ha
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_normalize_ha(int i, int, int, Array4< Real > const &x, Array4< Real const > const &sx, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:74

amrex::mlndlap_avgdown_coeff_x
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_avgdown_coeff_x(int i, int, int, Array4< Real > const &crse, Array4< Real const > const &fine) noexcept
Definition AMReX_MLNodeLap_1D_K.H:21

amrex::mlndlap_gauss_seidel_c
void mlndlap_gauss_seidel_c(Box const &bx, Array4< Real > const &sol, Array4< Real const > const &rhs, Real sig, Array4< int const > const &msk, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:203

amrex::mlndlap_interpadd_ha
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_interpadd_ha(int i, int j, int k, Array4< Real > const &fine, Array4< Real const > const &crse, Array4< Real const > const &sig, Array4< int const > const &msk) noexcept
Definition AMReX_MLNodeLap_1D_K.H:276

amrex::mlndlap_Ax_fine_contrib
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_Ax_fine_contrib(int i, int j, int, Box const &ndbx, Box const &ccbx, Array4< Real > const &f, Array4< Real const > const &res, Array4< Real const > const &rhs, Array4< Real const > const &phi, Array4< Real const > const &sig, Array4< int const > const &msk, bool is_rz, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_2D_K.H:1143

amrex::aa_interp_line_x
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real aa_interp_line_x(Array4< Real const > const &crse, Array4< Real const > const &sig, int i, int j, int ic, int jc) noexcept
Definition AMReX_MLNodeLap_2D_K.H:573

amrex::mlndlap_stencil_rap
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_stencil_rap(int, int, int, Array4< Real > const &, Array4< Real const > const &) noexcept
Definition AMReX_MLNodeLap_1D_K.H:391

amrex::mlndlap_adotx_sten_doit
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_adotx_sten_doit(int i, int j, int k, Array4< Real const > const &x, Array4< Real const > const &sten) noexcept
Definition AMReX_MLNodeLap_2D_K.H:1507

amrex::tridiagonal_solve
AMREX_FORCE_INLINE void tridiagonal_solve(Array1D< T, 0, 31 > &a_ls, Array1D< T, 0, 31 > &b_ls, Array1D< T, 0, 31 > &c_ls, Array1D< T, 0, 31 > &r_ls, Array1D< T, 0, 31 > &u_ls, Array1D< T, 0, 31 > &gam, int ilen) noexcept
Definition AMReX_MLABecLap_3D_K.H:432

amrex::mlndlap_rhcc
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real mlndlap_rhcc(int i, int, int, Array4< Real const > const &rhcc, Array4< int const > const &msk) noexcept
Definition AMReX_MLNodeLap_1D_K.H:299

amrex::mlndlap_mknewu_c
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE void mlndlap_mknewu_c(int i, int, int, Array4< Real > const &u, Array4< Real const > const &p, Real sig, GpuArray< Real, AMREX_SPACEDIM > const &dxinv) noexcept
Definition AMReX_MLNodeLap_1D_K.H:322

amrex::neumann_scale
AMREX_GPU_HOST_DEVICE AMREX_FORCE_INLINE Real neumann_scale(int i, int j, Box const &nddom, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &bclo, GpuArray< LinOpBCType, AMREX_SPACEDIM > const &bchi) noexcept
Definition AMReX_MLNodeLap_2D_K.H:930

amrex::Array1D
Definition AMReX_Array.H:193

amrex::Array4
Definition AMReX_Array4.H:61

amrex::GpuArray
Definition AMReX_Array.H:34