MNN/source/backend/metal/MetalBackend.hpp

//
//  MetalBackend.hpp
//  MNN
//
//  Created by MNN on 2019/01/30.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#ifndef MetalBackend_hpp
#define MetalBackend_hpp

#include "core/Backend.hpp"
#include "core/BufferAllocator.hpp"
#include "core/TensorUtils.hpp"
#include "MNN_generated.h"
#include "MetalDefine.h"
#include <vector>
//#include "MNNMetalContext.h"
#include "MetalCache_generated.h"
using namespace MetalCache;

#if MNN_METAL_ENABLED
namespace MNN {

/** MetalRuntime */
enum MetalTuneLevel {Never = 0, Heavy = 1, Wide = 2, Normal = 3, Fast = 4};

class MetalRuntime {
public:
    friend class MetalBackend;
    MetalRuntime(const Backend::Info info);
    virtual ~ MetalRuntime();
    
    void *context() const {
        return mContext;
    }

    bool isCreateError() const {
        return mIsCreateError;
    }
    void setGpuMode(const int cl_mode_num);
    
    std::pair<const void*, size_t> makeCache();
    bool setCache(std::pair<const void*, size_t> cache);
    
    MetalTuneLevel getTuneLevel() {
        return mTuneLevel;
    }
    std::map<std::pair<std::string, std::vector<uint32_t>>, std::tuple<std::vector<uint32_t>, std::vector<uint32_t>,  uint32_t>>& getTunedThreadGroup() {
        return mTunedThreadGroup;
    };
private:
    void* mContext = nullptr;
    std::shared_ptr<BufferAllocator> mStatic;
    bool mIsCreateError = false;
    MetalTuneLevel mTuneLevel = Wide;
    std::map<std::pair<std::string, std::vector<uint32_t>>, std::tuple<std::vector<uint32_t>, std::vector<uint32_t>, uint32_t>> mTunedThreadGroup;

private:
    std::vector<uint8_t> mBuffer;
    const void* mCacheOutside = nullptr;
    size_t mCacheOutsideSize = 0;
};


class MetalRuntimeWrapper : public Runtime {
public:
    MetalRuntimeWrapper(const Backend::Info info);
    virtual ~MetalRuntimeWrapper();
    virtual Backend *onCreate(const BackendConfig* config) const override;
    virtual void onGabageCollect(int level) override;
    bool isCreateError() const {
        return mIsCreateError;
    }
    virtual CompilerType onGetCompilerType() const override {
        return Compiler_Loop;
    }
    virtual float onGetMemoryInMB() override;

    virtual std::pair<const void*, size_t> onGetCache() override;
    virtual bool onSetCache(const void* buffer, size_t size) override;

    
private:
    std::shared_ptr<BufferAllocator> mBufferPool;
    std::shared_ptr<MetalRuntime> mMetalRuntime;
    bool mIsCreateError{false};
};

class MetalRuntimeAllocator : public BufferAllocator::Allocator {
public:
    class MetalBufferAlloc {
    public:
        MetalBufferAlloc(id<MTLBuffer> buffer) {
            mBuffer = buffer;
        }
        id<MTLBuffer> getBuffer() {
            return mBuffer;
        }
        ~MetalBufferAlloc(){};
    private:
        id<MTLBuffer> mBuffer = nil;
    };
    
    MetalRuntimeAllocator(MetalRuntime *rt): mMetalRuntime(rt) {
        // Do nothing
    }
    virtual ~ MetalRuntimeAllocator() = default;
    virtual std::pair<void*, int> onAlloc(int size, int align) override;
    virtual void onRelease(std::pair<void*, int> ptr) override;
    
private:
    MetalRuntime *mMetalRuntime;
    id<MTLBuffer> mBuffer = nil;
};

/** Metal backend */
class MetalBackend : public Backend {
public:
    /** Metal execution creator */
    class Creator {
    public:
        /**
         * @brief create execution for given input, op on metal backend.
         * @param inputs    given input tensors.
         * @param op        given op.
         * @param backend   metal backend.
         * @return created execution if supported, NULL otherwise.
         */
        virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const MNN::Op *op, Backend *backend) const = 0;        
    };
    /**
     * @brief register creator for given op type.
     * @param type      given op type.
     * @param creator   registering creator.
     */
    static void addCreator(OpType type, Creator *creator);

    id<MTLBuffer> getHostBuffer(size_t size) const;
    id<MTLBuffer> getConstBuffer(size_t size) const;
public:
    MetalBackend(std::shared_ptr<BufferAllocator> staticMem, const MetalRuntime* runtime);
    virtual ~MetalBackend();
    const MetalRuntime* runtime() const {
        return mRuntime;
    }
    
    virtual Backend::MemObj* onAcquire(const Tensor *Tensor, StorageType storageType) override;
    virtual bool onClearBuffer() override;
    virtual void onCopyBuffer(const Tensor *srcTensor, const Tensor *dstTensor) const override;

    virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &outputs,
                                const MNN::Op *op) override;
    
    virtual void onResizeBegin() override;
    virtual void onResizeEnd() override;
    virtual void onExecuteBegin() const override;
    virtual void onExecuteEnd() const override;
    virtual std::pair<float, bool> onMeasure(const std::vector<Tensor*>& inputs, const std::vector<Tensor*>& outputs,
                                            const MNN::Op* op) override;

public:
    /**
     * @brief get metal context object
     * @return metal context object pointer
     */
    void *context() const;

    /**
     * @brief copy buffer content to dest tensor
     * @param srcTensor source tensor
     * @param dstTensor destined tensor
     * @param encoder command encoder
     */
    void onCopyBuffer(const Tensor *srcTensor, const Tensor *dstTensor,
                              id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;

    void flushEncoder() const;
    id<MTLComputeCommandEncoder> encoder() const;
    void addOpEncoder(std::function<void(void)> opEncoder);
    
    bool isCommandEncoderSet();
    void setOpEncoder() const;
    
    BufferAllocator *getBufferPool() const {
        return mBufferPool.get();
    }
    BufferAllocator *getStaticBufferPool() const {
        return mStaticBufferPool.get();
    }

    bool isCmdBufferCommit();
    
private:
    const MetalRuntime* mRuntime;
    std::vector<id<MTLBuffer>> mHoldBuffers;
    id<MTLBuffer> mShapeH2D;
    id<MTLBuffer> mShapeD2H;
    mutable NSUInteger mEncoderCount = 0;
    mutable bool mOpEncoderSet = false;//whether has set encoder
    mutable bool mOpFullSupport = true;
    mutable bool mFrameEncodeCache = false;

    std::vector<std::function<void(void)>> mOpEncoders;
    mutable id<MTLComputeCommandEncoder> mComputeEncoder = nil;
    std::shared_ptr<BufferAllocator> mBufferPool;
    std::shared_ptr<BufferAllocator> mStaticBufferPool;

private:
    mutable id<MTLBuffer> mHostBuffer = nullptr;
    void onCopyHostToDevice(const Tensor *src, const Tensor *dst) const;
    void onCopyDeviceToHost(const Tensor *src, const Tensor *dst) const;
    void onCopyDeviceToDevice(const Tensor *src, const Tensor *dst, id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;
};


/** Metal creator register */
template <class T>
class MetalCreatorRegister {
public:
    /**
     * @brief initializer. register T creator for given op type.
     * @param type  given op type.
     */
    MetalCreatorRegister(OpType type) {
        T *test = new T;
        MetalBackend::addCreator(type, test);
    }
};
} // namespace MNN

#define REGISTER_METAL_OP_CREATOR(name, opType)     \
    void ___##name##__##opType##__() {              \
        MetalBackend::addCreator(opType, new name); \
    }

#endif /* MNN_METAL_ENABLED */
#endif /* MetalBackend_hpp */
beta 0.1.0 2019-04-17 10:49:11 +08:00			`//`
			`// MetalBackend.hpp`
			`// MNN`
			`//`
			`// Created by MNN on 2019/01/30.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#ifndef MetalBackend_hpp`
			`#define MetalBackend_hpp`

Update 2019-12-27 22:16:57 +08:00			`#include "core/Backend.hpp"`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`#include "core/BufferAllocator.hpp"`
			`#include "core/TensorUtils.hpp"`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`#include "MNN_generated.h"`
			`#include "MetalDefine.h"`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`#include <vector>`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`//#include "MNNMetalContext.h"`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`#include "MetalCache_generated.h"`
			`using namespace MetalCache;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`#if MNN_METAL_ENABLED`
			`namespace MNN {`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`/** MetalRuntime */`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`enum MetalTuneLevel {Never = 0, Heavy = 1, Wide = 2, Normal = 3, Fast = 4};`

[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`class MetalRuntime {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`public:`
			`friend class MetalBackend;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`MetalRuntime(const Backend::Info info);`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual ~ MetalRuntime();`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`void *context() const {`
			`return mContext;`
			`}`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00
			`bool isCreateError() const {`
			`return mIsCreateError;`
			`}`
			`void setGpuMode(const int cl_mode_num);`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`std::pair<const void*, size_t> makeCache();`
			`bool setCache(std::pair<const void*, size_t> cache);`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00
			`MetalTuneLevel getTuneLevel() {`
			`return mTuneLevel;`
			`}`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`std::map<std::pair<std::string, std::vector<uint32_t>>, std::tuple<std::vector<uint32_t>, std::vector<uint32_t>, uint32_t>>& getTunedThreadGroup() {`
			`return mTunedThreadGroup;`
			`};`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`private:`
			`void* mContext = nullptr;`
			`std::shared_ptr<BufferAllocator> mStatic;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`bool mIsCreateError = false;`
			`MetalTuneLevel mTuneLevel = Wide;`
			`std::map<std::pair<std::string, std::vector<uint32_t>>, std::tuple<std::vector<uint32_t>, std::vector<uint32_t>, uint32_t>> mTunedThreadGroup;`

			`private:`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`std::vector<uint8_t> mBuffer;`
			`const void* mCacheOutside = nullptr;`
			`size_t mCacheOutsideSize = 0;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`};`


			`class MetalRuntimeWrapper : public Runtime {`
			`public:`
			`MetalRuntimeWrapper(const Backend::Info info);`
			`virtual ~MetalRuntimeWrapper();`
			`virtual Backend onCreate(const BackendConfig config) const override;`
			`virtual void onGabageCollect(int level) override;`
			`bool isCreateError() const {`
			`return mIsCreateError;`
			`}`
			`virtual CompilerType onGetCompilerType() const override {`
			`return Compiler_Loop;`
			`}`
			`virtual float onGetMemoryInMB() override;`

			`virtual std::pair<const void*, size_t> onGetCache() override;`
			`virtual bool onSetCache(const void* buffer, size_t size) override;`


			`private:`
			`std::shared_ptr<BufferAllocator> mBufferPool;`
			`std::shared_ptr<MetalRuntime> mMetalRuntime;`
			`bool mIsCreateError{false};`
			`};`

			`class MetalRuntimeAllocator : public BufferAllocator::Allocator {`
			`public:`
			`class MetalBufferAlloc {`
			`public:`
			`MetalBufferAlloc(id<MTLBuffer> buffer) {`
			`mBuffer = buffer;`
			`}`
			`id<MTLBuffer> getBuffer() {`
			`return mBuffer;`
			`}`
			`~MetalBufferAlloc(){};`
			`private:`
			`id<MTLBuffer> mBuffer = nil;`
			`};`

			`MetalRuntimeAllocator(MetalRuntime *rt): mMetalRuntime(rt) {`
			`// Do nothing`
			`}`
			`virtual ~ MetalRuntimeAllocator() = default;`
			`virtual std::pair<void*, int> onAlloc(int size, int align) override;`
			`virtual void onRelease(std::pair<void*, int> ptr) override;`

			`private:`
			`MetalRuntime *mMetalRuntime;`
			`id<MTLBuffer> mBuffer = nil;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`};`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`/** Metal backend */`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`class MetalBackend : public Backend {`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`public:`
			`/** Metal execution creator */`
			`class Creator {`
			`public:`
			`/**`
			`* @brief create execution for given input, op on metal backend.`
			`* @param inputs given input tensors.`
			`* @param op given op.`
			`* @param backend metal backend.`
			`* @return created execution if supported, NULL otherwise.`
			`*/`
- dynamic computation graph (beta) - add supports (/express) - add tests - add benchmarks with it (/benchmark/exprModels) - Python - MNN engine and tools were submitted to pip - available on Windows/macOS/Linux - Engine/Converter - add supports for each op benchmarking - refactor optimizer by separating steps - CPU - add supports for Conv3D, Pool3D, ELU, ReverseSequence - fix ArgMax, Permute, Scale, BinaryOp, Slice, SliceTf - OpenCL - add half transform in CPU - add broadcast supports for binary - optimize Conv2D, Reshape, Eltwise, Gemm, etc. - OpenGL - add sub, real div supports for binary - add supports for unary - optimize Conv2D, Reshape - Vulkan - add max supports for eltwise - Metal - fix metallib missing problem - Train/Quantization - use express to refactor training codes 2019-09-26 21:02:07 +08:00			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const MNN::Op op, Backend backend) const = 0;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`};`
			`/**`
			`* @brief register creator for given op type.`
			`* @param type given op type.`
			`* @param creator registering creator.`
			`*/`
			`static void addCreator(OpType type, Creator *creator);`

[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`id<MTLBuffer> getHostBuffer(size_t size) const;`
			`id<MTLBuffer> getConstBuffer(size_t size) const;`
			`public:`
			`MetalBackend(std::shared_ptr<BufferAllocator> staticMem, const MetalRuntime* runtime);`
			`virtual ~MetalBackend();`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`const MetalRuntime* runtime() const {`
			`return mRuntime;`
			`}`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00
			`virtual Backend::MemObj* onAcquire(const Tensor *Tensor, StorageType storageType) override;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual bool onClearBuffer() override;`
			`virtual void onCopyBuffer(const Tensor srcTensor, const Tensor dstTensor) const override;`

			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor *> &outputs,`
			`const MNN::Op *op) override;`
sync from internal repo 2021-04-28 18:02:10 +08:00
			`virtual void onResizeBegin() override;`
			`virtual void onResizeEnd() override;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual void onExecuteBegin() const override;`
			`virtual void onExecuteEnd() const override;`
- dynamic computation graph (beta) - add supports (/express) - add tests - add benchmarks with it (/benchmark/exprModels) - Python - MNN engine and tools were submitted to pip - available on Windows/macOS/Linux - Engine/Converter - add supports for each op benchmarking - refactor optimizer by separating steps - CPU - add supports for Conv3D, Pool3D, ELU, ReverseSequence - fix ArgMax, Permute, Scale, BinaryOp, Slice, SliceTf - OpenCL - add half transform in CPU - add broadcast supports for binary - optimize Conv2D, Reshape, Eltwise, Gemm, etc. - OpenGL - add sub, real div supports for binary - add supports for unary - optimize Conv2D, Reshape - Vulkan - add max supports for eltwise - Metal - fix metallib missing problem - Train/Quantization - use express to refactor training codes 2019-09-26 21:02:07 +08:00			`virtual std::pair<float, bool> onMeasure(const std::vector<Tensor>& inputs, const std::vector<Tensor>& outputs,`
			`const MNN::Op* op) override;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`public:`
			`/**`
			`* @brief get metal context object`
			`* @return metal context object pointer`
			`*/`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`void *context() const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`/**`
			`* @brief copy buffer content to dest tensor`
			`* @param srcTensor source tensor`
			`* @param dstTensor destined tensor`
			`* @param encoder command encoder`
			`*/`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void onCopyBuffer(const Tensor srcTensor, const Tensor dstTensor,`
			`id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void flushEncoder() const;`
			`id<MTLComputeCommandEncoder> encoder() const;`
sync from internal repo 2021-04-28 18:02:10 +08:00			`void addOpEncoder(std::function<void(void)> opEncoder);`

[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`bool isCommandEncoderSet();`
sync from internal repo 2021-04-28 18:02:10 +08:00			`void setOpEncoder() const;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00
			`BufferAllocator *getBufferPool() const {`
			`return mBufferPool.get();`
			`}`
			`BufferAllocator *getStaticBufferPool() const {`
			`return mStaticBufferPool.get();`
			`}`

[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`bool isCmdBufferCommit();`

beta 0.1.0 2019-04-17 10:49:11 +08:00			`private:`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`const MetalRuntime* mRuntime;`
			`std::vector<id<MTLBuffer>> mHoldBuffers;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`id<MTLBuffer> mShapeH2D;`
			`id<MTLBuffer> mShapeD2H;`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`mutable NSUInteger mEncoderCount = 0;`
			`mutable bool mOpEncoderSet = false;//whether has set encoder`
sync from internal repo 2021-04-28 18:02:10 +08:00			`mutable bool mOpFullSupport = true;`
			`mutable bool mFrameEncodeCache = false;`

			`std::vector<std::function<void(void)>> mOpEncoders;`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`mutable id<MTLComputeCommandEncoder> mComputeEncoder = nil;`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`std::shared_ptr<BufferAllocator> mBufferPool;`
			`std::shared_ptr<BufferAllocator> mStaticBufferPool;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`private:`
[MNN:Sync] Sync internal gitlab Main Feature: 1. Add OpenCV API and Numpy API Support 2. Protobuf move into MNN 3. Add more op for torchscript convert 4. Add recompute to speed up geometry compute 5. Add ModuleBasic Test 2021-11-30 10:10:53 +08:00			`mutable id<MTLBuffer> mHostBuffer = nullptr;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`void onCopyHostToDevice(const Tensor src, const Tensor dst) const;`
			`void onCopyDeviceToHost(const Tensor src, const Tensor dst) const;`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void onCopyDeviceToDevice(const Tensor src, const Tensor dst, id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`};`

Github release 1.1.0 2020-11-05 16:41:56 +08:00
beta 0.1.0 2019-04-17 10:49:11 +08:00			`/** Metal creator register */`
			`template <class T>`
			`class MetalCreatorRegister {`
			`public:`
			`/**`
			`* @brief initializer. register T creator for given op type.`
			`* @param type given op type.`
			`*/`
			`MetalCreatorRegister(OpType type) {`
			`T *test = new T;`
			`MetalBackend::addCreator(type, test);`
			`}`
			`};`
			`} // namespace MNN`

beta 0.1.1.1 - use code generate for op/backend/sizer register - add pose demo - fix docs & script - improve cpu softmax performance 80% - improve converter ops fuse 2019-05-08 15:44:57 +08:00			`#define REGISTER_METAL_OP_CREATOR(name, opType) \`
			`void ___##name##__##opType##__() { \`
			`MetalBackend::addCreator(opType, new name); \`
			`}`

beta 0.1.0 2019-04-17 10:49:11 +08:00			`#endif /* MNN_METAL_ENABLED */`
			`#endif /* MetalBackend_hpp */`