MNN/source/backend/opengl/GLBackend.hpp

//
//  GLBackend.h
//  MNN
//
//  Created by MNN on 2019/01/31.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#ifndef GLBACKEND_H
#define GLBACKEND_H

#include <list>
#include <map>
#include <memory>
#include "core/Backend.hpp"
#include "backend/opengl/GLContext.hpp"
#include "backend/opengl/GLProgram.hpp"
#include "backend/opengl/GLSSBOBuffer.hpp"
#include "backend/opengl/GLTexture.hpp"
#include "MNN_generated.h"
#include "backend/opengl/GLUtils.hpp"
#include "core/TensorUtils.hpp"
#include "backend/opengl/GLHead.hpp"

namespace MNN {
namespace OpenGL {
class GLBackend : public Backend {
public:
    GLBackend(BackendConfig::PrecisionMode precision, BackendConfig::PowerMode power);
    virtual ~GLBackend();

    void upload(GLuint textureId, const float* inputData, int d1, int d2, int d3, bool align = false) const;
    void download(GLuint textureId, float* outputData, int d1, int d2, int d3, bool align = false) const;

    void copyImageToNhwcBuffer(GLuint textureId, float *outputData, int width, int height, int channel) const;
    void copyNhwcBufferToImage(GLuint textureId, const float *inputData, int width, int height, int channel) const;

    std::shared_ptr<GLProgram> getProgram(const std::string& key, const char* content);
    std::shared_ptr<GLProgram> getProgram(const std::string& key, const char* content,
                                          const std::vector<std::string>& prefix);

    enum GPUType { ADRENO = 0, MALI = 1, OTHER = 2 };

    inline GPUType gpuType() const {
        return mGpuType;
    }

    inline int glVersion() const {
        return mVersion;
    }

    void wait() const;

    void compute(int dim1, int dim2, int dim3, bool needWait = false) const;

    /*For Buffer alloc and release*/
    virtual bool onAcquireBuffer(const Tensor* nativeTensor, StorageType storageType) override;

    // If STATIC, delete the buffer. If dynamic don't free the buffer, just set it to reused
    virtual bool onReleaseBuffer(const Tensor* nativeTensor, StorageType storageType) override;

    // Clear All Dynamic Buffer
    virtual bool onClearBuffer() override;

    virtual void onCopyBuffer(const Tensor* srcTensor, const Tensor* dstTensor) const override;

    virtual void onExecuteBegin() const override;

    virtual void onExecuteEnd() const override;

    /// get execution
    virtual Execution* onCreate(const std::vector<Tensor*>& inputs, const std::vector<Tensor*>& outputs,
                                const MNN::Op* op) override;

    class Creator {
    public:
        virtual ~Creator() = default;
        virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &output, const MNN::Op *op, Backend *backend) const = 0;
    };
    static bool addCreator(OpType t, Creator *c);
    bool isCreateError() const;
    bool isSupportHalf() const;
    bool getOpenGLExtensions(std::string extStr);
    GLenum getTextrueFormat() const;
    std::string getImageFormat() const;
    std::shared_ptr<GLProgram> getTreatedProgramWithPrefix(const char *content,
                                                              const std::vector<std::string> &prefix);
    std::shared_ptr<GLProgram> getTreatedProgram(const char *content);
private:
    struct Runtime {
        std::shared_ptr<GLProgram> mNchw2ImageProgram;
        std::shared_ptr<GLProgram> mImage2NchwProgram;
        std::shared_ptr<GLProgram> mNc4hw42ImageProgram;
        std::shared_ptr<GLProgram> mImage2Nc4hw4Program;

        std::shared_ptr<GLProgram> mNhwc2ImageProgram;
        std::shared_ptr<GLProgram> mImage2NhwcProgram;

        std::map<std::string, std::shared_ptr<GLProgram>> mProgramCache;

        std::list<std::shared_ptr<GLTexture>> mBlocks;
        std::list<std::pair<const Tensor*, GLuint>> mFreeTextures;
        mutable std::shared_ptr<GLSSBOBuffer> mTempBuffer;
    };
    Runtime* mRuntime = nullptr;
    static std::unique_ptr<GLContext> mContext;
    GPUType mGpuType = OTHER;
    int mVersion = 0;
    int mLocalSize[3];
    bool mIsCreateError{false};
    bool mIsSupportHalf{false};
    GLenum mTextrueFormat{GL_RGBA32F};
    std::string mImageFormat{"rgba32f"};
};

inline std::vector<int> tensorShapeFormat(const Tensor *input) {
    int iN = std::max(1, input->batch());
    int iC = std::max(1, input->channel());
    int iH = std::max(1, input->height());
    int iW = std::max(1, input->width());

    if (input->dimensions() == 3) {
        iN = 1;
        iH = input->buffer().dim[0].extent;
        iW = input->buffer().dim[1].extent;
        iC = input->buffer().dim[2].extent;
    }

    if (input->dimensions() == 2) {
        iN = input->buffer().dim[0].extent;
        iH = 1;
        iW = 1;
        iC = input->buffer().dim[1].extent;
    }
    if (input->dimensions() == 1) {
        iN = 1;
        iH = 1;
        iW = 1;
        iC = input->buffer().dim[0].extent;
    }

#ifdef LOG_VERBOSE
    MNN_PRINT("dim %d : [%d, %d, %d, %d] \n",input->dimensions(), iN, iH, iW, iC);
#endif
    std::vector<int> shape_vec{iN, iH, iW, iC};

    return shape_vec;
}

template <class T>
class GLCreatorRegister {
public:
    GLCreatorRegister(OpType type) {
        GLBackend::addCreator(type, new T);
    }
    ~GLCreatorRegister() = default;
};

template <typename T>
class TypedCreator : public GLBackend::Creator {
public:
    virtual ~TypedCreator() = default;
    virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &outputs, const MNN::Op *op,
                                Backend *backend) const override {
        return new T(inputs, op, backend);
    }
};

} // namespace OpenGL
} // namespace MNN
#endif
beta 0.1.0 2019-04-17 10:49:11 +08:00			`//`
			`// GLBackend.h`
			`// MNN`
			`//`
			`// Created by MNN on 2019/01/31.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#ifndef GLBACKEND_H`
			`#define GLBACKEND_H`

			`#include <list>`
			`#include <map>`
			`#include <memory>`
Update 2019-12-27 22:16:57 +08:00			`#include "core/Backend.hpp"`
			`#include "backend/opengl/GLContext.hpp"`
			`#include "backend/opengl/GLProgram.hpp"`
			`#include "backend/opengl/GLSSBOBuffer.hpp"`
			`#include "backend/opengl/GLTexture.hpp"`
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`#include "MNN_generated.h"`
Update 2019-12-27 22:16:57 +08:00			`#include "backend/opengl/GLUtils.hpp"`
			`#include "core/TensorUtils.hpp"`
			`#include "backend/opengl/GLHead.hpp"`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`namespace MNN {`
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`namespace OpenGL {`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`class GLBackend : public Backend {`
			`public:`
- dynamic computation graph (beta) - add supports (/express) - add tests - add benchmarks with it (/benchmark/exprModels) - Python - MNN engine and tools were submitted to pip - available on Windows/macOS/Linux - Engine/Converter - add supports for each op benchmarking - refactor optimizer by separating steps - CPU - add supports for Conv3D, Pool3D, ELU, ReverseSequence - fix ArgMax, Permute, Scale, BinaryOp, Slice, SliceTf - OpenCL - add half transform in CPU - add broadcast supports for binary - optimize Conv2D, Reshape, Eltwise, Gemm, etc. - OpenGL - add sub, real div supports for binary - add supports for unary - optimize Conv2D, Reshape - Vulkan - add max supports for eltwise - Metal - fix metallib missing problem - Train/Quantization - use express to refactor training codes 2019-09-26 21:02:07 +08:00			`GLBackend(BackendConfig::PrecisionMode precision, BackendConfig::PowerMode power);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual ~GLBackend();`

			`void upload(GLuint textureId, const float* inputData, int d1, int d2, int d3, bool align = false) const;`
			`void download(GLuint textureId, float* outputData, int d1, int d2, int d3, bool align = false) const;`

beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`void copyImageToNhwcBuffer(GLuint textureId, float *outputData, int width, int height, int channel) const;`
			`void copyNhwcBufferToImage(GLuint textureId, const float *inputData, int width, int height, int channel) const;`
Update 2019-12-27 22:16:57 +08:00
beta 0.1.0 2019-04-17 10:49:11 +08:00			`std::shared_ptr<GLProgram> getProgram(const std::string& key, const char* content);`
			`std::shared_ptr<GLProgram> getProgram(const std::string& key, const char* content,`
			`const std::vector<std::string>& prefix);`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.1 - support both armv7/arm64 in podspec (pod version >= 1.5.0 required) - refactor neg axis support - fix memory overlap in de-conv - fix CONVOLUTION_TILED_NUMBER spell error - fix few warnings - add binary / interp / permute / relu / reshape / softmax support and optimize conv for OpenGL backend - add clean in nmake build script 2019-06-24 11:32:41 +08:00			`enum GPUType { ADRENO = 0, MALI = 1, OTHER = 2 };`
beta 0.1.0 2019-04-17 10:49:11 +08:00
beta 0.2.0.1 - support both armv7/arm64 in podspec (pod version >= 1.5.0 required) - refactor neg axis support - fix memory overlap in de-conv - fix CONVOLUTION_TILED_NUMBER spell error - fix few warnings - add binary / interp / permute / relu / reshape / softmax support and optimize conv for OpenGL backend - add clean in nmake build script 2019-06-24 11:32:41 +08:00			`inline GPUType gpuType() const {`
			`return mGpuType;`
			`}`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.1 - support both armv7/arm64 in podspec (pod version >= 1.5.0 required) - refactor neg axis support - fix memory overlap in de-conv - fix CONVOLUTION_TILED_NUMBER spell error - fix few warnings - add binary / interp / permute / relu / reshape / softmax support and optimize conv for OpenGL backend - add clean in nmake build script 2019-06-24 11:32:41 +08:00			`inline int glVersion() const {`
			`return mVersion;`
			`}`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`void wait() const;`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`void compute(int dim1, int dim2, int dim3, bool needWait = false) const;`

beta 0.1.0 2019-04-17 10:49:11 +08:00			`/For Buffer alloc and release/`
			`virtual bool onAcquireBuffer(const Tensor* nativeTensor, StorageType storageType) override;`

			`// If STATIC, delete the buffer. If dynamic don't free the buffer, just set it to reused`
			`virtual bool onReleaseBuffer(const Tensor* nativeTensor, StorageType storageType) override;`

			`// Clear All Dynamic Buffer`
			`virtual bool onClearBuffer() override;`

			`virtual void onCopyBuffer(const Tensor* srcTensor, const Tensor* dstTensor) const override;`

			`virtual void onExecuteBegin() const override;`

			`virtual void onExecuteEnd() const override;`

			`/// get execution`
			`virtual Execution* onCreate(const std::vector<Tensor>& inputs, const std::vector<Tensor>& outputs,`
			`const MNN::Op* op) override;`

beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`class Creator {`
			`public:`
			`virtual ~Creator() = default;`
			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor > &output, const MNN::Op op, Backend *backend) const = 0;`
			`};`
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`static bool addCreator(OpType t, Creator *c);`
beta 0.2.0.5 - CPU - add support for DepthToSpace & SpaceToDepth ops - OpenGL - add Android demo - add half / float runtime option - add support for ROIPooling, Squeeze - fix bugs in conv im2col - OpenCL - fix Concat, Eltwise, Reshape bugs - Tools - add KL threshold method in quantization tool - support optimization for graph with multiple rnn 2019-07-25 13:36:35 +08:00			`bool isCreateError() const;`
			`bool isSupportHalf() const;`
			`bool getOpenGLExtensions(std::string extStr);`
			`GLenum getTextrueFormat() const;`
			`std::string getImageFormat() const;`
			`std::shared_ptr<GLProgram> getTreatedProgramWithPrefix(const char *content,`
			`const std::vector<std::string> &prefix);`
			`std::shared_ptr<GLProgram> getTreatedProgram(const char *content);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`private:`
			`struct Runtime {`
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`std::shared_ptr<GLProgram> mNchw2ImageProgram;`
			`std::shared_ptr<GLProgram> mImage2NchwProgram;`
			`std::shared_ptr<GLProgram> mNc4hw42ImageProgram;`
			`std::shared_ptr<GLProgram> mImage2Nc4hw4Program;`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`std::shared_ptr<GLProgram> mNhwc2ImageProgram;`
			`std::shared_ptr<GLProgram> mImage2NhwcProgram;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`std::map<std::string, std::shared_ptr<GLProgram>> mProgramCache;`

			`std::list<std::shared_ptr<GLTexture>> mBlocks;`
			`std::list<std::pair<const Tensor*, GLuint>> mFreeTextures;`
			`mutable std::shared_ptr<GLSSBOBuffer> mTempBuffer;`
			`};`
beta 0.2.0.5 - CPU - add support for DepthToSpace & SpaceToDepth ops - OpenGL - add Android demo - add half / float runtime option - add support for ROIPooling, Squeeze - fix bugs in conv im2col - OpenCL - fix Concat, Eltwise, Reshape bugs - Tools - add KL threshold method in quantization tool - support optimization for graph with multiple rnn 2019-07-25 13:36:35 +08:00			`Runtime* mRuntime = nullptr;`
			`static std::unique_ptr<GLContext> mContext;`
beta 0.2.0.1 - support both armv7/arm64 in podspec (pod version >= 1.5.0 required) - refactor neg axis support - fix memory overlap in de-conv - fix CONVOLUTION_TILED_NUMBER spell error - fix few warnings - add binary / interp / permute / relu / reshape / softmax support and optimize conv for OpenGL backend - add clean in nmake build script 2019-06-24 11:32:41 +08:00			`GPUType mGpuType = OTHER;`
			`int mVersion = 0;`
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`int mLocalSize[3];`
Update 2019-12-27 22:16:57 +08:00			`bool mIsCreateError{false};`
beta 0.2.0.5 - CPU - add support for DepthToSpace & SpaceToDepth ops - OpenGL - add Android demo - add half / float runtime option - add support for ROIPooling, Squeeze - fix bugs in conv im2col - OpenCL - fix Concat, Eltwise, Reshape bugs - Tools - add KL threshold method in quantization tool - support optimization for graph with multiple rnn 2019-07-25 13:36:35 +08:00			`bool mIsSupportHalf{false};`
			`GLenum mTextrueFormat{GL_RGBA32F};`
			`std::string mImageFormat{"rgba32f"};`
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`};`

beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`inline std::vector<int> tensorShapeFormat(const Tensor *input) {`
			`int iN = std::max(1, input->batch());`
			`int iC = std::max(1, input->channel());`
			`int iH = std::max(1, input->height());`
			`int iW = std::max(1, input->width());`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`if (input->dimensions() == 3) {`
			`iN = 1;`
			`iH = input->buffer().dim[0].extent;`
			`iW = input->buffer().dim[1].extent;`
			`iC = input->buffer().dim[2].extent;`
			`}`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`if (input->dimensions() == 2) {`
			`iN = input->buffer().dim[0].extent;`
			`iH = 1;`
			`iW = 1;`
			`iC = input->buffer().dim[1].extent;`
			`}`
			`if (input->dimensions() == 1) {`
			`iN = 1;`
			`iH = 1;`
			`iW = 1;`
			`iC = input->buffer().dim[0].extent;`
			`}`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`#ifdef LOG_VERBOSE`
			`MNN_PRINT("dim %d : [%d, %d, %d, %d] \n",input->dimensions(), iN, iH, iW, iC);`
			`#endif`
			`std::vector<int> shape_vec{iN, iH, iW, iC};`
Update 2019-12-27 22:16:57 +08:00
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`return shape_vec;`
			`}`
Update 2019-12-27 22:16:57 +08:00
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`template <class T>`
			`class GLCreatorRegister {`
			`public:`
			`GLCreatorRegister(OpType type) {`
beta 0.2.0.2 - CPU - add padding support - fix bug in permute when channel % 4 != 0 - fix bug in exp with extreme value - OpenCL - add protecting logics - OpenGL - add protecting logics - support NCHW format in Squeeze and Reshape - Converter - add ShuffleChannel support for Caffe - add Clip/Transpose/Unary/Pad supports for ONNX 2019-07-02 18:01:08 +08:00			`GLBackend::addCreator(type, new T);`
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00			`}`
			`~GLCreatorRegister() = default;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`};`
beta 0.1.1.4 - refactor OpenGL, test relative codes - optimize LRN - fix doc link error 2019-05-24 11:26:54 +08:00
			`template <typename T>`
			`class TypedCreator : public GLBackend::Creator {`
			`public:`
			`virtual ~TypedCreator() = default;`
			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor > &outputs, const MNN::Op op,`
			`Backend *backend) const override {`
			`return new T(inputs, op, backend);`
			`}`
			`};`

			`} // namespace OpenGL`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`} // namespace MNN`
			`#endif`