MNN/source/backend/metal/MetalBackend.hpp

//
//  MetalBackend.hpp
//  MNN
//
//  Created by MNN on 2019/01/30.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#ifndef MetalBackend_hpp
#define MetalBackend_hpp

#include "core/Backend.hpp"
#include "MNN_generated.h"
#include "MetalDefine.h"
#include <vector>

#if MNN_METAL_ENABLED
namespace MNN {
/** MetalRuntime */
class MetalRuntime : public Runtime {
public:
    friend class MetalBackend;
    class BufferAllocator {
    public:
        BufferAllocator(void* context);
        ~ BufferAllocator();
        id<MTLBuffer> alloc(size_t size, bool seperate = false);
        void release(id<MTLBuffer> buffer);
        void clear();
        float computeSizeInMB() const;
    private:
        std::map<id<MTLBuffer>, size_t> mAllocated;
        std::multimap<size_t, id<MTLBuffer>> mReusableBuffers;
        void* mContext = nullptr;
    };
    virtual float onGetMemoryInMB() override;

    MetalRuntime();
    virtual ~ MetalRuntime();
    virtual Backend* onCreate(const BackendConfig* config) const override;
    virtual void onGabageCollect(int level) override;
    void *context() const {
        return mContext;
    }
    id<MTLBuffer> getHostBuffer(size_t size) const;
private:
    void* mContext = nullptr;
    std::shared_ptr<BufferAllocator> mStatic;
    std::shared_ptr<BufferAllocator> mDynamic;
    mutable id<MTLBuffer> mHostBuffer = nullptr;
};

/** Metal backend */
class MetalBackend final : public Backend {
public:
    /** Metal execution creator */
    class Creator {
    public:
        /**
         * @brief create execution for given input, op on metal backend.
         * @param inputs    given input tensors.
         * @param op        given op.
         * @param backend   metal backend.
         * @return created execution if supported, NULL otherwise.
         */
        virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const MNN::Op *op, Backend *backend) const = 0;        
    };
    /**
     * @brief register creator for given op type.
     * @param type      given op type.
     * @param creator   registering creator.
     */
    static void addCreator(OpType type, Creator *creator);

    class AutoBuffer {
    public:
        AutoBuffer(const MetalRuntime* runtime) {
            mRuntime = runtime;
        }
        ~ AutoBuffer();
        void reset(size_t length);
        id<MTLBuffer> buffer() const {
            return mBuffer;
        }
    private:
        const MetalRuntime* mRuntime = nullptr;
        id<MTLBuffer> mBuffer = nil;
    };
    const MetalRuntime* runtime() const {
        return mRuntime;
    }
public:
    MetalBackend(const MetalRuntime* runtime);
    virtual ~MetalBackend();

    virtual bool onAcquireBuffer(const Tensor *Tensor, StorageType storageType) override;
    virtual bool onReleaseBuffer(const Tensor *Tensor, StorageType storageType) override;
    virtual bool onClearBuffer() override;
    virtual void onCopyBuffer(const Tensor *srcTensor, const Tensor *dstTensor) const override;

    virtual Execution *onCreate(const std::vector<Tensor *> &inputs, const std::vector<Tensor *> &outputs,
                                const MNN::Op *op) override;
    
    virtual void onResizeBegin() override;
    virtual void onResizeEnd() override;
    virtual void onExecuteBegin() const override;
    virtual void onExecuteEnd() const override;
    virtual std::pair<float, bool> onMeasure(const std::vector<Tensor*>& inputs, const std::vector<Tensor*>& outputs,
                                            const MNN::Op* op) override;

public:
    /**
     * @brief get metal context object
     * @return metal context object pointer
     */
    void *context() const;

    /**
     * @brief copy buffer content to dest tensor
     * @param srcTensor source tensor
     * @param dstTensor destined tensor
     * @param encoder command encoder
     */
    void onCopyBuffer(const Tensor *srcTensor, const Tensor *dstTensor,
                              id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;

    void flushEncoder() const;
    id<MTLComputeCommandEncoder> encoder() const;
    void addOpEncoder(std::function<void(void)> opEncoder);
    
    bool isCommandEncoderSet() const;
    void setOpEncoder() const;
private:
    const MetalRuntime* mRuntime;
    std::vector<id<MTLBuffer>> mHoldBuffers;
    AutoBuffer mShapeH2D;
    AutoBuffer mShapeD2H;
    mutable bool mOpEncoderSet = false;
    mutable bool mOpFullSupport = true;
    mutable bool mFrameEncodeCache = false;

    std::vector<std::function<void(void)>> mOpEncoders;
    mutable id<MTLComputeCommandEncoder> mComputeEncoder = nil;

private:
    id<MTLBuffer> getHostBuffer(size_t size) const;
    void onCopyHostToDevice(const Tensor *src, const Tensor *dst) const;
    void onCopyDeviceToHost(const Tensor *src, const Tensor *dst) const;
    void onCopyDeviceToDevice(const Tensor *src, const Tensor *dst, id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;
};


/** Metal creator register */
template <class T>
class MetalCreatorRegister {
public:
    /**
     * @brief initializer. register T creator for given op type.
     * @param type  given op type.
     */
    MetalCreatorRegister(OpType type) {
        T *test = new T;
        MetalBackend::addCreator(type, test);
    }
};
} // namespace MNN

#define REGISTER_METAL_OP_CREATOR(name, opType)     \
    void ___##name##__##opType##__() {              \
        MetalBackend::addCreator(opType, new name); \
    }

#endif /* MNN_METAL_ENABLED */
#endif /* MetalBackend_hpp */
beta 0.1.0 2019-04-17 10:49:11 +08:00			`//`
			`// MetalBackend.hpp`
			`// MNN`
			`//`
			`// Created by MNN on 2019/01/30.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#ifndef MetalBackend_hpp`
			`#define MetalBackend_hpp`

Update 2019-12-27 22:16:57 +08:00			`#include "core/Backend.hpp"`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`#include "MNN_generated.h"`
			`#include "MetalDefine.h"`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`#include <vector>`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`#if MNN_METAL_ENABLED`
			`namespace MNN {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`/** MetalRuntime */`
			`class MetalRuntime : public Runtime {`
			`public:`
			`friend class MetalBackend;`
			`class BufferAllocator {`
			`public:`
			`BufferAllocator(void* context);`
			`~ BufferAllocator();`
			`id<MTLBuffer> alloc(size_t size, bool seperate = false);`
			`void release(id<MTLBuffer> buffer);`
			`void clear();`
[PATCH 43/78] [Metal:Feature] Support count memory for metal 2020-11-13 15:54:41 +08:00			`float computeSizeInMB() const;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`private:`
			`std::map<id<MTLBuffer>, size_t> mAllocated;`
			`std::multimap<size_t, id<MTLBuffer>> mReusableBuffers;`
			`void* mContext = nullptr;`
			`};`
[PATCH 43/78] [Metal:Feature] Support count memory for metal 2020-11-13 15:54:41 +08:00			`virtual float onGetMemoryInMB() override;`

Github release 1.1.0 2020-11-05 16:41:56 +08:00			`MetalRuntime();`
			`virtual ~ MetalRuntime();`
[MNN:Sync] Sync internal Gitlab 2021-04-08 15:34:23 +08:00			`virtual Backend* onCreate(const BackendConfig* config) const override;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`virtual void onGabageCollect(int level) override;`
			`void *context() const {`
			`return mContext;`
			`}`
			`id<MTLBuffer> getHostBuffer(size_t size) const;`
			`private:`
			`void* mContext = nullptr;`
			`std::shared_ptr<BufferAllocator> mStatic;`
			`std::shared_ptr<BufferAllocator> mDynamic;`
			`mutable id<MTLBuffer> mHostBuffer = nullptr;`
			`};`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`/** Metal backend */`
			`class MetalBackend final : public Backend {`
			`public:`
			`/** Metal execution creator */`
			`class Creator {`
			`public:`
			`/**`
			`* @brief create execution for given input, op on metal backend.`
			`* @param inputs given input tensors.`
			`* @param op given op.`
			`* @param backend metal backend.`
			`* @return created execution if supported, NULL otherwise.`
			`*/`
- dynamic computation graph (beta) - add supports (/express) - add tests - add benchmarks with it (/benchmark/exprModels) - Python - MNN engine and tools were submitted to pip - available on Windows/macOS/Linux - Engine/Converter - add supports for each op benchmarking - refactor optimizer by separating steps - CPU - add supports for Conv3D, Pool3D, ELU, ReverseSequence - fix ArgMax, Permute, Scale, BinaryOp, Slice, SliceTf - OpenCL - add half transform in CPU - add broadcast supports for binary - optimize Conv2D, Reshape, Eltwise, Gemm, etc. - OpenGL - add sub, real div supports for binary - add supports for unary - optimize Conv2D, Reshape - Vulkan - add max supports for eltwise - Metal - fix metallib missing problem - Train/Quantization - use express to refactor training codes 2019-09-26 21:02:07 +08:00			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const MNN::Op op, Backend backend) const = 0;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`};`
			`/**`
			`* @brief register creator for given op type.`
			`* @param type given op type.`
			`* @param creator registering creator.`
			`*/`
			`static void addCreator(OpType type, Creator *creator);`

Github release 1.1.0 2020-11-05 16:41:56 +08:00			`class AutoBuffer {`
			`public:`
			`AutoBuffer(const MetalRuntime* runtime) {`
			`mRuntime = runtime;`
			`}`
			`~ AutoBuffer();`
			`void reset(size_t length);`
			`id<MTLBuffer> buffer() const {`
			`return mBuffer;`
			`}`
			`private:`
			`const MetalRuntime* mRuntime = nullptr;`
			`id<MTLBuffer> mBuffer = nil;`
			`};`
			`const MetalRuntime* runtime() const {`
			`return mRuntime;`
			`}`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`public:`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`MetalBackend(const MetalRuntime* runtime);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual ~MetalBackend();`

			`virtual bool onAcquireBuffer(const Tensor *Tensor, StorageType storageType) override;`
			`virtual bool onReleaseBuffer(const Tensor *Tensor, StorageType storageType) override;`
			`virtual bool onClearBuffer() override;`
			`virtual void onCopyBuffer(const Tensor srcTensor, const Tensor dstTensor) const override;`

			`virtual Execution onCreate(const std::vector<Tensor > &inputs, const std::vector<Tensor *> &outputs,`
			`const MNN::Op *op) override;`
sync from internal repo 2021-04-28 18:02:10 +08:00
			`virtual void onResizeBegin() override;`
			`virtual void onResizeEnd() override;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual void onExecuteBegin() const override;`
			`virtual void onExecuteEnd() const override;`
- dynamic computation graph (beta) - add supports (/express) - add tests - add benchmarks with it (/benchmark/exprModels) - Python - MNN engine and tools were submitted to pip - available on Windows/macOS/Linux - Engine/Converter - add supports for each op benchmarking - refactor optimizer by separating steps - CPU - add supports for Conv3D, Pool3D, ELU, ReverseSequence - fix ArgMax, Permute, Scale, BinaryOp, Slice, SliceTf - OpenCL - add half transform in CPU - add broadcast supports for binary - optimize Conv2D, Reshape, Eltwise, Gemm, etc. - OpenGL - add sub, real div supports for binary - add supports for unary - optimize Conv2D, Reshape - Vulkan - add max supports for eltwise - Metal - fix metallib missing problem - Train/Quantization - use express to refactor training codes 2019-09-26 21:02:07 +08:00			`virtual std::pair<float, bool> onMeasure(const std::vector<Tensor>& inputs, const std::vector<Tensor>& outputs,`
			`const MNN::Op* op) override;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`public:`
			`/**`
			`* @brief get metal context object`
			`* @return metal context object pointer`
			`*/`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`void *context() const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`/**`
			`* @brief copy buffer content to dest tensor`
			`* @param srcTensor source tensor`
			`* @param dstTensor destined tensor`
			`* @param encoder command encoder`
			`*/`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void onCopyBuffer(const Tensor srcTensor, const Tensor dstTensor,`
			`id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void flushEncoder() const;`
			`id<MTLComputeCommandEncoder> encoder() const;`
sync from internal repo 2021-04-28 18:02:10 +08:00			`void addOpEncoder(std::function<void(void)> opEncoder);`

			`bool isCommandEncoderSet() const;`
			`void setOpEncoder() const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`private:`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`const MetalRuntime* mRuntime;`
			`std::vector<id<MTLBuffer>> mHoldBuffers;`
sync from internal repo 2021-04-28 18:02:10 +08:00			`AutoBuffer mShapeH2D;`
			`AutoBuffer mShapeD2H;`
			`mutable bool mOpEncoderSet = false;`
			`mutable bool mOpFullSupport = true;`
			`mutable bool mFrameEncodeCache = false;`

			`std::vector<std::function<void(void)>> mOpEncoders;`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`mutable id<MTLComputeCommandEncoder> mComputeEncoder = nil;`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`private:`
			`id<MTLBuffer> getHostBuffer(size_t size) const;`
			`void onCopyHostToDevice(const Tensor src, const Tensor dst) const;`
			`void onCopyDeviceToHost(const Tensor src, const Tensor dst) const;`
[PATCH 41/78] [Metal:Speed] Reduce metal encoder and buffer alloc, delete unuseful code 2020-11-13 14:27:18 +08:00			`void onCopyDeviceToDevice(const Tensor src, const Tensor dst, id<MTLComputeCommandEncoder> encoder, id<MTLBuffer> shape) const;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`};`

Github release 1.1.0 2020-11-05 16:41:56 +08:00
beta 0.1.0 2019-04-17 10:49:11 +08:00			`/** Metal creator register */`
			`template <class T>`
			`class MetalCreatorRegister {`
			`public:`
			`/**`
			`* @brief initializer. register T creator for given op type.`
			`* @param type given op type.`
			`*/`
			`MetalCreatorRegister(OpType type) {`
			`T *test = new T;`
			`MetalBackend::addCreator(type, test);`
			`}`
			`};`
			`} // namespace MNN`

beta 0.1.1.1 - use code generate for op/backend/sizer register - add pose demo - fix docs & script - improve cpu softmax performance 80% - improve converter ops fuse 2019-05-08 15:44:57 +08:00			`#define REGISTER_METAL_OP_CREATOR(name, opType) \`
			`void ___##name##__##opType##__() { \`
			`MetalBackend::addCreator(opType, new name); \`
			`}`

beta 0.1.0 2019-04-17 10:49:11 +08:00			`#endif /* MNN_METAL_ENABLED */`
			`#endif /* MetalBackend_hpp */`