MNN/source/backend/cuda/core/CUDABackend.hpp

//
//  CUDABackend.hpp
//  MNN
//
//  Created by MNN on 2019/01/31.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#ifndef CUDABackend_hpp
#define CUDABackend_hpp

#include <set>
#include <vector>
#include <MNN/ErrorCode.hpp>
#include "MNN_generated.h"
#include "backend/cuda/core/runtime/CUDARuntime.hpp"
#include "core/Backend.hpp"
#include "core/Macro.h"
#include "core/ConvolutionCommon.hpp"
#include "core/BufferAllocator.hpp"
#include "backend/cpu/CPUResizeCache.hpp"
#define MNN_USER_SET_DEVICE
#include "MNN/MNNSharedContext.h"
#ifdef MNN_CODEGEN_CUDA
#include "backend/cuda/core/compiler/CUDACompiler.hpp"
#endif

namespace MNN {
namespace CUDA {
class MNN_PUBLIC CUDARuntimeWrapper : public Runtime {
public:
    CUDARuntimeWrapper(BackendConfig::PrecisionMode precision, BackendConfig::PowerMode power, int deviceId = 0);
    virtual ~CUDARuntimeWrapper();
    virtual Backend *onCreate(const BackendConfig* config) const override;
    virtual void onGabageCollect(int level) override;
    bool isCreateError() const {
        return mIsCreateError;
    }
    virtual CompilerType onGetCompilerType() const override {
        return Compiler_Loop;
    }
    virtual float onGetMemoryInMB() override;

private:
    std::shared_ptr<EagerBufferAllocator> mBufferPool;
    std::shared_ptr<CUDARuntime> mCUDARuntime;
    bool mIsCreateError{false};
    BackendConfig::PrecisionMode mDefaultPrecision;
};

class CUDABackend : public Backend {
public:
    CUDABackend(std::shared_ptr<BufferAllocator> st, std::shared_ptr<CUDARuntime> rt, int precisionLevel);
    ~CUDABackend();

    CUDARuntime *getCUDARuntime();
    virtual const Runtime* getRuntime() override;
    virtual Backend::MemObj* onAcquire(const Tensor *nativeTensor, StorageType storageType) override;
    virtual bool onClearBuffer() override;

    virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &outputs,
                                const MNN::Op *op) override;
    virtual void onResizeBegin() override;
    virtual ErrorCode onResizeEnd() override;

    virtual void onExecuteBegin() const override;
    virtual void onExecuteEnd() const override;

    virtual void onCopyBuffer(const Tensor *srcTensor, const Tensor *dstTensor) const override;

    class Creator {
    public:
        virtual ~Creator()                                                     = default;
        virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &output,
                                    const MNN::Op *op, Backend *backend) const = 0;
    };

    static bool addCreator(OpType t, Creator *c);
    static DataType getDataType(const Tensor* tensor);

    BufferAllocator *getBufferPool() const {
        return mBufferPool.get();
    }
    BufferAllocator *getStaticBufferPool() const {
        return mStaticBufferPool.get();
    }
    static size_t realSize(const Tensor *tensor);
    int getBytes(const Tensor* tensor) const;
    CPUResizeCache* getCache();
    bool useFp16() const;
    int getPrecision() const;
    #ifdef MNN_CODEGEN_CUDA
    std::map<std::pair<std::string, std:: string>, CUmodule> kernelCuModuleMap();
    #endif
private:
    std::shared_ptr<BufferAllocator> mBufferPool;
    std::shared_ptr<BufferAllocator> mStaticBufferPool;
    std::shared_ptr<CUDARuntime> mCUDARuntime;
    CPUResizeCache mCache;
    bool mUseFp16AsFp32 = false;
    int mPrecision = 0;
    #ifdef MNN_CODEGEN_CUDA
    CUmodule mCuModule;
    std::map<std::pair<std::string, std:: string>, CUmodule> mKernelCuModuleMap;
    #endif
};

template <class T>
class CUDACreatorRegister {
public:
    CUDACreatorRegister(OpType type) {
        T *t = new T;
        CUDABackend::addCreator(type, t);
    }
    ~CUDACreatorRegister() = default;
};

/** execution cast wrapper. insert tensor cast dynamic. */
class CastWrapExecution : public Execution {
public:
    CastWrapExecution(Backend* backend, DataType runT)
                    : Execution(backend), mRunType(runT) {}
    virtual ErrorCode onExecute(const std::vector<Tensor*>& inputs, const std::vector<Tensor*>& outputs) override;
private:
    DataType mRunType;
};

template <typename T>
class TypedCreator : public CUDABackend::Creator {
public:
    virtual ~TypedCreator() = default;
    virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &outputs,
                                const MNN::Op *op, Backend *backend) const override {
        return new T(inputs, op, backend);
    }
};

} // namespace CUDA
} // namespace MNN
#endif /* CUDABackend_hpp */
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`//`
			`// CUDABackend.hpp`
			`// MNN`
			`//`
			`// Created by MNN on 2019/01/31.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#ifndef CUDABackend_hpp`
			`#define CUDABackend_hpp`

			`#include <set>`
			`#include <vector>`
[MNN:Sync] Sync Internal 2.7.1 2023-09-20 20:16:25 +08:00			`#include <MNN/ErrorCode.hpp>`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`#include "MNN_generated.h"`
			`#include "backend/cuda/core/runtime/CUDARuntime.hpp"`
			`#include "core/Backend.hpp"`
			`#include "core/Macro.h"`
			`#include "core/ConvolutionCommon.hpp"`
Synchronize internal master to Github 2020-12-15 14:12:35 +08:00			`#include "core/BufferAllocator.hpp"`
[Sync] Sync internal Gitlab 2022-02-18 11:30:27 +08:00			`#include "backend/cpu/CPUResizeCache.hpp"`
[MNN:Sync] Sync Internal Gitlab 2.4.3 2023-04-18 18:54:46 +08:00			`#define MNN_USER_SET_DEVICE`
			`#include "MNN/MNNSharedContext.h"`
[MNN:Sync] Sync Internal Gitlab 2023-07-18 09:36:26 +08:00			`#ifdef MNN_CODEGEN_CUDA`
			`#include "backend/cuda/core/compiler/CUDACompiler.hpp"`
			`#endif`
[MNN:Sync] Sync Internal Gitlab 2.4.3 2023-04-18 18:54:46 +08:00
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`namespace MNN {`
			`namespace CUDA {`
			`class MNN_PUBLIC CUDARuntimeWrapper : public Runtime {`
			`public:`
[MNN:Sync] Sync Internal Gitlab 2.4.3 2023-04-18 18:54:46 +08:00			`CUDARuntimeWrapper(BackendConfig::PrecisionMode precision, BackendConfig::PowerMode power, int deviceId = 0);`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual ~CUDARuntimeWrapper();`
[MNN:Sync] Sync internal Gitlab 2021-04-08 15:34:23 +08:00			`virtual Backend onCreate(const BackendConfig config) const override;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual void onGabageCollect(int level) override;`
			`bool isCreateError() const {`
			`return mIsCreateError;`
			`}`
Synchronize internal github for version 1.2.0 (#1518) 2021-06-11 17:17:13 +08:00			`virtual CompilerType onGetCompilerType() const override {`
			`return Compiler_Loop;`
			`}`
			`virtual float onGetMemoryInMB() override;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00
			`private:`
[MNN:Sync] Sync Internal 2.7.0 2023-09-04 10:42:11 +08:00			`std::shared_ptr<EagerBufferAllocator> mBufferPool;`
[Sync] Sync Internal 2.1.2 2022-09-30 10:02:52 +08:00			`std::shared_ptr<CUDARuntime> mCUDARuntime;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`bool mIsCreateError{false};`
[Sync] Sync internal Gitlab 2022-02-18 11:30:27 +08:00			`BackendConfig::PrecisionMode mDefaultPrecision;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`};`

[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`class CUDABackend : public Backend {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`public:`
[Sync] Sync Internal 2.2.2 2022-11-18 22:35:31 +08:00			`CUDABackend(std::shared_ptr<BufferAllocator> st, std::shared_ptr<CUDARuntime> rt, int precisionLevel);`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`~CUDABackend();`

			`CUDARuntime *getCUDARuntime();`
[Sync] Sync Internal 2.1.2 2022-09-30 10:02:52 +08:00			`virtual const Runtime* getRuntime() override;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`virtual Backend::MemObj* onAcquire(const Tensor *nativeTensor, StorageType storageType) override;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual bool onClearBuffer() override;`

			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor *> &outputs,`
			`const MNN::Op *op) override;`
[MNN:Sync] Sync internal git 2021-01-06 16:29:37 +08:00			`virtual void onResizeBegin() override;`
[MNN:Sync] Sync Internal 2.7.1 2023-09-20 20:16:25 +08:00			`virtual ErrorCode onResizeEnd() override;`
[MNN:Sync] Sync internal git 2021-01-06 16:29:37 +08:00
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual void onExecuteBegin() const override;`
			`virtual void onExecuteEnd() const override;`

			`virtual void onCopyBuffer(const Tensor srcTensor, const Tensor dstTensor) const override;`

			`class Creator {`
			`public:`
			`virtual ~Creator() = default;`
			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor *> &output,`
			`const MNN::Op op, Backend backend) const = 0;`
			`};`

			`static bool addCreator(OpType t, Creator *c);`
[MNN:Sync] Sync Internal 2.5.3 2023-06-16 09:42:45 +08:00			`static DataType getDataType(const Tensor* tensor);`
Github release 1.1.0 2020-11-05 16:41:56 +08:00
Synchronize internal master to Github 2020-12-15 14:12:35 +08:00			`BufferAllocator *getBufferPool() const {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`return mBufferPool.get();`
			`}`
Synchronize internal master to Github 2020-12-15 14:12:35 +08:00			`BufferAllocator *getStaticBufferPool() const {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`return mStaticBufferPool.get();`
			`}`
			`static size_t realSize(const Tensor *tensor);`
[Sync] Sync internal Gitlab 2022-02-18 11:30:27 +08:00			`int getBytes(const Tensor* tensor) const;`
			`CPUResizeCache* getCache();`
			`bool useFp16() const;`
[Sync] Sync Internal 2.2.2 2022-11-18 22:35:31 +08:00			`int getPrecision() const;`
[MNN:Sync] Sync Internal Gitlab 2023-07-18 09:36:26 +08:00			`#ifdef MNN_CODEGEN_CUDA`
			`std::map<std::pair<std::string, std:: string>, CUmodule> kernelCuModuleMap();`
			`#endif`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`private:`
Synchronize internal master to Github 2020-12-15 14:12:35 +08:00			`std::shared_ptr<BufferAllocator> mBufferPool;`
			`std::shared_ptr<BufferAllocator> mStaticBufferPool;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`std::shared_ptr<CUDARuntime> mCUDARuntime;`
[Sync] Sync internal Gitlab 2022-02-18 11:30:27 +08:00			`CPUResizeCache mCache;`
			`bool mUseFp16AsFp32 = false;`
[Sync] Sync Internal 2.2.2 2022-11-18 22:35:31 +08:00			`int mPrecision = 0;`
[MNN:Sync] Sync Internal Gitlab 2023-07-18 09:36:26 +08:00			`#ifdef MNN_CODEGEN_CUDA`
			`CUmodule mCuModule;`
			`std::map<std::pair<std::string, std:: string>, CUmodule> mKernelCuModuleMap;`
			`#endif`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`};`

			`template <class T>`
			`class CUDACreatorRegister {`
			`public:`
			`CUDACreatorRegister(OpType type) {`
			`T *t = new T;`
			`CUDABackend::addCreator(type, t);`
			`}`
			`~CUDACreatorRegister() = default;`
			`};`

[MNN:Sync] Sync Internal 2.5.3 2023-06-16 09:42:45 +08:00			`/** execution cast wrapper. insert tensor cast dynamic. */`
			`class CastWrapExecution : public Execution {`
			`public:`
			`CastWrapExecution(Backend* backend, DataType runT)`
			`: Execution(backend), mRunType(runT) {}`
			`virtual ErrorCode onExecute(const std::vector<Tensor>& inputs, const std::vector<Tensor>& outputs) override;`
			`private:`
			`DataType mRunType;`
			`};`

Github release 1.1.0 2020-11-05 16:41:56 +08:00			`template <typename T>`
			`class TypedCreator : public CUDABackend::Creator {`
			`public:`
			`virtual ~TypedCreator() = default;`
			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor *> &outputs,`
			`const MNN::Op op, Backend backend) const override {`
			`return new T(inputs, op, backend);`
			`}`
			`};`

			`} // namespace CUDA`
			`} // namespace MNN`
			`#endif /* CUDABackend_hpp */`