MNN/source/backend/cuda/execution/ConvWinogradExecution.hpp

//
//  ConvWinogradExecution.hpp
//  MNN
//
//  Created by MNN on 2022/05/11.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#ifndef ConvWinogradExecution_hpp_
#define ConvWinogradExecution_hpp_

#include "ConvSingleInputExecution.hpp"
#include "CutlassGemmBatchedParam.hpp"
#include "MNNCUDADefine.hpp"
#include "MNNCUDAFunction.cuh"

namespace MNN {
namespace CUDA {

class ConvWinogradExecution : public Execution {
public:
    struct Resource;
    static bool isValid(const Convolution2D* conv);
    ConvWinogradExecution(Backend* backend, const MNN::Op* op, std::shared_ptr<Resource> res);
    virtual ~ConvWinogradExecution();

    struct Resource {
        Resource(Backend* backend, const MNN::Op* op);
        ~ Resource();
        void* mFilter;
        void* mBias;
        std::shared_ptr<Tensor> weightTensor;
        std::shared_ptr<Tensor> biasTensor;
        KernelInfo mKernelInfo;
        Backend* mBackend = nullptr;
        bool mUseHPack = false;
    };

    virtual ErrorCode onResize(const std::vector<Tensor*> &inputs, const std::vector<Tensor*> &outputs) override;
    virtual ErrorCode onExecute(const std::vector<Tensor*> &inputs, const std::vector<Tensor*> &outputs) override;
    virtual bool onClone(Backend* bn, const Op* op, Execution** dst) override;
    
private:
    std::shared_ptr<Resource> mResource;
    const Op* mOp = nullptr;
    __half* mBtdB_Buffer;
    void* mMatmul_Buffer;

    GemmBatchedTensor_F16_F16_Linear_AlignTensor_Row_Column_Sm75 mGemmBatchedF16LnSm75;
    GemmBatchedTensor_F16_F32_Linear_AlignTensor_Row_Column_Sm75 mGemmBatchedF32LnSm75;

    GemmBatchedCuda_F16_F16_Linear_AlignCuda_Row_Column mGemmBatchedCudaF16Ln;
    GemmBatchedCuda_F16_F32_Linear_AlignCuda_Row_Column mGemmBatchedCudaF32Ln;

    std::shared_ptr<Tensor> workspaceTensor;
    uint8_t* mWorkspace;

    CutlassGemmInfo mGemmInfo;

    int mPadX;
    int mPadY;
    int mBlock2;
    int mGpuComputeCap;
    int mActivationType;
};

} // namespace CUDA
} // namespace MNN
#endif /* ConvWinogradExecution_hpp_ */
Sync Internal 2.0.4 2022-08-12 10:30:48 +08:00			`//`
			`// ConvWinogradExecution.hpp`
			`// MNN`
			`//`
			`// Created by MNN on 2022/05/11.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#ifndef ConvWinogradExecution_hpp_`
			`#define ConvWinogradExecution_hpp_`

			`#include "ConvSingleInputExecution.hpp"`
[Sync] Sync Internal Gitlab 2.2.1 2022-11-08 17:05:14 +08:00			`#include "CutlassGemmBatchedParam.hpp"`
[Sync] Sync Internal 2.1.2 2022-09-30 10:02:52 +08:00			`#include "MNNCUDADefine.hpp"`
			`#include "MNNCUDAFunction.cuh"`
Sync Internal 2.0.4 2022-08-12 10:30:48 +08:00
			`namespace MNN {`
			`namespace CUDA {`

			`class ConvWinogradExecution : public Execution {`
			`public:`
			`struct Resource;`
[Sync] Sync Internal 2.1.2 2022-09-30 10:02:52 +08:00			`static bool isValid(const Convolution2D* conv);`
Sync Internal 2.0.4 2022-08-12 10:30:48 +08:00			`ConvWinogradExecution(Backend* backend, const MNN::Op* op, std::shared_ptr<Resource> res);`
			`virtual ~ConvWinogradExecution();`

			`struct Resource {`
			`Resource(Backend* backend, const MNN::Op* op);`
			`~ Resource();`
			`void* mFilter;`
			`void* mBias;`
			`std::shared_ptr<Tensor> weightTensor;`
			`std::shared_ptr<Tensor> biasTensor;`
			`KernelInfo mKernelInfo;`
			`Backend* mBackend = nullptr;`
			`bool mUseHPack = false;`
			`};`

			`virtual ErrorCode onResize(const std::vector<Tensor> &inputs, const std::vector<Tensor> &outputs) override;`
			`virtual ErrorCode onExecute(const std::vector<Tensor> &inputs, const std::vector<Tensor> &outputs) override;`
			`virtual bool onClone(Backend* bn, const Op* op, Execution** dst) override;`

			`private:`
			`std::shared_ptr<Resource> mResource;`
			`const Op* mOp = nullptr;`
			`__half* mBtdB_Buffer;`
			`void* mMatmul_Buffer;`
[Sync] Sync Internal Gitlab 2.2.1 2022-11-08 17:05:14 +08:00
			`GemmBatchedTensor_F16_F16_Linear_AlignTensor_Row_Column_Sm75 mGemmBatchedF16LnSm75;`
			`GemmBatchedTensor_F16_F32_Linear_AlignTensor_Row_Column_Sm75 mGemmBatchedF32LnSm75;`

			`GemmBatchedCuda_F16_F16_Linear_AlignCuda_Row_Column mGemmBatchedCudaF16Ln;`
			`GemmBatchedCuda_F16_F32_Linear_AlignCuda_Row_Column mGemmBatchedCudaF32Ln;`
[Sync] Sync Internal 2.1.2 2022-09-30 10:02:52 +08:00
			`std::shared_ptr<Tensor> workspaceTensor;`
			`uint8_t* mWorkspace;`

			`CutlassGemmInfo mGemmInfo;`
Sync Internal 2.0.4 2022-08-12 10:30:48 +08:00
			`int mPadX;`
			`int mPadY;`
			`int mBlock2;`
[Sync] Sync Internal Gitlab 2.2.1 2022-11-08 17:05:14 +08:00			`int mGpuComputeCap;`
			`int mActivationType;`
Sync Internal 2.0.4 2022-08-12 10:30:48 +08:00			`};`

			`} // namespace CUDA`
			`} // namespace MNN`
			`#endif /* ConvWinogradExecution_hpp_ */`