MNN/source/shape/ShapeConvolution.cpp

//
//  ShapeConvolution.cpp
//  MNN
//
//  Created by MNN on 2019/01/10.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#include <math.h>
#include "shape/SizeComputer.hpp"
#include "core/TensorUtils.hpp"
namespace MNN {
class ConvolutionSizeComputer : public SizeComputer {
public:
    static const Convolution2DCommon* loadCommon(const Op* op) {
        const Convolution2DCommon* layer = nullptr;
        if (op->main_type() == OpParameter_Convolution2D) {
            layer = op->main_as_Convolution2D()->common();
        } else {
            MNN_ASSERT(op->main_type() == OpParameter_TfQuantizedConv2D);
            layer = op->main_as_TfQuantizedConv2D()->common();
        }
        return layer;
    }
    virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,
                               const std::vector<Tensor*>& outputs) const override {
        MNN_ASSERT(inputs.size() >= 1);
        MNN_ASSERT(1 == outputs.size());
        const Convolution2DCommon* layer = loadCommon(op);
        int kernel_width  = layer->dilateX() * (layer->kernelX() - 1) + 1;
        int kernel_height = layer->dilateY() * (layer->kernelY() - 1) + 1;

        int output_width  = 1;
        int output_height = 1;

        auto input = inputs[0];
        // For Tensorflow Group Convolution, the inputCount is the size of filter's input count
        if (layer->inputCount() > 0 && input->channel() % layer->inputCount() != 0 && OpType_Convolution == op->type()) {
            MNN_ERROR("Error for compute convolution shape, need channel = %d, input channel = %d\n", layer->inputCount(), input->channel());
            return false;
        }

        if (layer->padMode() == PadMode_SAME) {
            // Tensorflow padding mode SAME
            output_width  = ceil((float)input->width() / (float)layer->strideX());
            output_height = ceil((float)input->height() / (float)layer->strideY());
        } else if (layer->padMode() == PadMode_VALID) {
            // Tensorflow padding mode VALID
            output_width  = ceil((float)(input->width() - kernel_width + 1) / (float)layer->strideX());
            output_height = ceil((float)(input->height() - kernel_height + 1) / (float)layer->strideY());
        } else {
            // Pad_Caffe means User setted padding
            if (nullptr != layer->pads()) {
                MNN_ASSERT(layer->pads()->size() >= 4);
                int input_width  = input->width() + layer->pads()->data()[1] + layer->pads()->data()[3];
                int input_height = input->height() + layer->pads()->data()[0] + layer->pads()->data()[2];
                output_width     = (input_width - kernel_width) / layer->strideX() + 1;
                output_height    = (input_height - kernel_height) / layer->strideY() + 1;
            } else {
                int input_width  = input->width() + layer->padX() * 2;
                int input_height = input->height() + layer->padY() * 2;
                output_width     = (input_width - kernel_width) / layer->strideX() + 1;
                output_height    = (input_height - kernel_height) / layer->strideY() + 1;
            }
        }

        auto& outputBuffer         = outputs[0]->buffer();
        outputBuffer.dimensions    = input->buffer().dimensions;
        auto format = TensorUtils::getDescribe(input)->dimensionFormat;
        outputBuffer.type = input->getType();
        outputBuffer.dim[0].extent = input->buffer().dim[0].extent;
        if (MNN_DATA_FORMAT_NHWC == format) {
            outputBuffer.dim[3].extent = layer->outputCount();
            outputBuffer.dim[1].extent = output_height;
            outputBuffer.dim[2].extent = output_width;
        } else {
            outputBuffer.dim[1].extent = layer->outputCount();
            outputBuffer.dim[2].extent = output_height;
            outputBuffer.dim[3].extent = output_width;
        }
        //MNN_PRINT("%d, %d, %d, %d\n", outputs[0]->length(0), outputs[0]->length(1), outputs[0]->length(2), outputs[0]->length(3));
        TensorUtils::getDescribe(outputs[0])->dimensionFormat = TensorUtils::getDescribe(inputs[0])->dimensionFormat;
        return true;
    }

    virtual float onComputeFlops(const MNN::Op* op, const std::vector<Tensor*>& inputs,
                                 const std::vector<Tensor*>& outputs) const override {
        const Convolution2DCommon* layer = loadCommon(op);
        auto kw    = layer->kernelX();
        auto kh    = layer->kernelY();
        auto group = layer->group();
        auto ic    = inputs[0]->channel();
        auto oc    = outputs[0]->channel();
        auto oSize = outputs[0]->width() * outputs[0]->height() * outputs[0]->batch();
        if (op->type() == OpType_QuantizedDepthwiseConv2D) {
            group = ic;
        }
        if (layer->inputCount() != ic && layer->inputCount() > 0) {
            group = ic / layer->inputCount();
        }
        auto flops = (float)oSize * kw * kh * (ic * oc / group) / FLOPS_M;
        return flops;
    }
};

class Dilation2DSizeComputer : public ConvolutionSizeComputer {
public:
    virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,
                               const std::vector<Tensor*>& outputs) const override {
        MNN_ASSERT(1 == inputs.size() && 1 == outputs.size());
        return ConvolutionSizeComputer::onComputeSize(op, inputs, outputs);
    }
    virtual float onComputeFlops(const MNN::Op* op, const std::vector<Tensor*>& inputs,
                                 const std::vector<Tensor*>& outputs) const override {
        auto output = outputs[0];
        auto layer = op->main_as_Convolution2D()->common();
        auto oSize = output->batch() * output->height() * output->width() * output->channel();
        auto flops = (float)oSize * layer->kernelY() * layer->kernelX() / FLOPS_M;
        return flops;
    }
};
class Conv2DBackpropFilterSizeComputer : public SizeComputer {
public:
    virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,
                               const std::vector<Tensor*>& outputs) const override {
        auto common = op->main_as_Convolution2D()->common();
        auto kernel = outputs[0];
        kernel->buffer().dimensions = 4;
        kernel->buffer().type = halide_type_of<float>();
        TensorUtils::getDescribe(kernel)->dimensionFormat = MNN_DATA_FORMAT_NCHW;
        kernel->setLength(0, inputs[1]->channel());
        kernel->setLength(1, inputs[0]->channel() / common->group());
        kernel->setLength(2, common->kernelY());
        kernel->setLength(3, common->kernelX());
        return true;
    }
};

REGISTER_SHAPE(ConvolutionSizeComputer, OpType_Convolution);
REGISTER_SHAPE(ConvolutionSizeComputer, OpType_ConvolutionDepthwise);
REGISTER_SHAPE(ConvolutionSizeComputer, OpType_TfQuantizedConv2D);
REGISTER_SHAPE(ConvolutionSizeComputer, OpType_QuantizedDepthwiseConv2D);
REGISTER_SHAPE(ConvolutionSizeComputer, OpType_ConvInt8);
REGISTER_SHAPE(ConvolutionSizeComputer, OpType_DepthwiseConvInt8);
REGISTER_SHAPE(Dilation2DSizeComputer, OpType_Dilation2D);
REGISTER_SHAPE(Conv2DBackpropFilterSizeComputer, OpType_Conv2DBackPropFilter);
} // namespace MNN
beta 0.1.0 2019-04-17 10:49:11 +08:00			`//`
			`// ShapeConvolution.cpp`
			`// MNN`
			`//`
			`// Created by MNN on 2019/01/10.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#include <math.h>`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`#include "shape/SizeComputer.hpp"`
Update 2019-12-27 22:16:57 +08:00			`#include "core/TensorUtils.hpp"`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`namespace MNN {`
			`class ConvolutionSizeComputer : public SizeComputer {`
			`public:`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`static const Convolution2DCommon* loadCommon(const Op* op) {`
			`const Convolution2DCommon* layer = nullptr;`
			`if (op->main_type() == OpParameter_Convolution2D) {`
			`layer = op->main_as_Convolution2D()->common();`
			`} else {`
			`MNN_ASSERT(op->main_type() == OpParameter_TfQuantizedConv2D);`
			`layer = op->main_as_TfQuantizedConv2D()->common();`
			`}`
			`return layer;`
			`}`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,`
			`const std::vector<Tensor*>& outputs) const override {`
Update 2019-12-27 22:16:57 +08:00			`MNN_ASSERT(inputs.size() >= 1);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`MNN_ASSERT(1 == outputs.size());`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`const Convolution2DCommon* layer = loadCommon(op);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`int kernel_width = layer->dilateX() * (layer->kernelX() - 1) + 1;`
			`int kernel_height = layer->dilateY() * (layer->kernelY() - 1) + 1;`

			`int output_width = 1;`
			`int output_height = 1;`

			`auto input = inputs[0];`
[PATCH 04/19] [Converter:Bugfix] Support group convolution for PB 2021-01-06 19:12:36 +08:00			`// For Tensorflow Group Convolution, the inputCount is the size of filter's input count`
			`if (layer->inputCount() > 0 && input->channel() % layer->inputCount() != 0 && OpType_Convolution == op->type()) {`
Update 2020-02-26 09:57:17 +08:00			`MNN_ERROR("Error for compute convolution shape, need channel = %d, input channel = %d\n", layer->inputCount(), input->channel());`
			`return false;`
			`}`
beta 0.1.0 2019-04-17 10:49:11 +08:00
			`if (layer->padMode() == PadMode_SAME) {`
			`// Tensorflow padding mode SAME`
			`output_width = ceil((float)input->width() / (float)layer->strideX());`
			`output_height = ceil((float)input->height() / (float)layer->strideY());`
			`} else if (layer->padMode() == PadMode_VALID) {`
			`// Tensorflow padding mode VALID`
			`output_width = ceil((float)(input->width() - kernel_width + 1) / (float)layer->strideX());`
			`output_height = ceil((float)(input->height() - kernel_height + 1) / (float)layer->strideY());`
			`} else {`
Update 2020-02-26 09:57:17 +08:00			`// Pad_Caffe means User setted padding`
			`if (nullptr != layer->pads()) {`
			`MNN_ASSERT(layer->pads()->size() >= 4);`
			`int input_width = input->width() + layer->pads()->data()[1] + layer->pads()->data()[3];`
			`int input_height = input->height() + layer->pads()->data()[0] + layer->pads()->data()[2];`
			`output_width = (input_width - kernel_width) / layer->strideX() + 1;`
			`output_height = (input_height - kernel_height) / layer->strideY() + 1;`
			`} else {`
			`int input_width = input->width() + layer->padX() * 2;`
			`int input_height = input->height() + layer->padY() * 2;`
			`output_width = (input_width - kernel_width) / layer->strideX() + 1;`
			`output_height = (input_height - kernel_height) / layer->strideY() + 1;`
			`}`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`}`

			`auto& outputBuffer = outputs[0]->buffer();`
			`outputBuffer.dimensions = input->buffer().dimensions;`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`auto format = TensorUtils::getDescribe(input)->dimensionFormat;`
beta 0.2.0.3 - add quantization tool & cpu impl & demo/exec - add thread pool - add tests - fix onnx converter tensor name mismatch - optimize cpu performance with SSE for windows 2019-07-11 13:56:52 +08:00			`outputBuffer.type = input->getType();`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`outputBuffer.dim[0].extent = input->buffer().dim[0].extent;`
			`if (MNN_DATA_FORMAT_NHWC == format) {`
			`outputBuffer.dim[3].extent = layer->outputCount();`
			`outputBuffer.dim[1].extent = output_height;`
			`outputBuffer.dim[2].extent = output_width;`
			`} else {`
			`outputBuffer.dim[1].extent = layer->outputCount();`
			`outputBuffer.dim[2].extent = output_height;`
			`outputBuffer.dim[3].extent = output_width;`
			`}`
Sync. Fix OpenGL related building issues. Build the whole suite on Android CI (#580) * Sync code with latest internal version * Update CMake * Fix logging issues * Fix OpenGL Building * Bump CMakeLists version. Update Podspec * Update MetalLib Lookup logic * Fix Windows Build 2020-01-15 13:33:47 +08:00			`//MNN_PRINT("%d, %d, %d, %d\n", outputs[0]->length(0), outputs[0]->length(1), outputs[0]->length(2), outputs[0]->length(3));`
beta 0.2.0.3 - add quantization tool & cpu impl & demo/exec - add thread pool - add tests - fix onnx converter tensor name mismatch - optimize cpu performance with SSE for windows 2019-07-11 13:56:52 +08:00			`TensorUtils::getDescribe(outputs[0])->dimensionFormat = TensorUtils::getDescribe(inputs[0])->dimensionFormat;`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`return true;`
			`}`

			`virtual float onComputeFlops(const MNN::Op* op, const std::vector<Tensor*>& inputs,`
			`const std::vector<Tensor*>& outputs) const override {`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`const Convolution2DCommon* layer = loadCommon(op);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`auto kw = layer->kernelX();`
			`auto kh = layer->kernelY();`
			`auto group = layer->group();`
			`auto ic = inputs[0]->channel();`
			`auto oc = outputs[0]->channel();`
			`auto oSize = outputs[0]->width() * outputs[0]->height() * outputs[0]->batch();`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`if (op->type() == OpType_QuantizedDepthwiseConv2D) {`
			`group = ic;`
			`}`
[PATCH 04/19] [Converter:Bugfix] Support group convolution for PB 2021-01-06 19:12:36 +08:00			`if (layer->inputCount() != ic && layer->inputCount() > 0) {`
			`group = ic / layer->inputCount();`
			`}`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`auto flops = (float)oSize * kw * kh * (ic * oc / group) / FLOPS_M;`
			`return flops;`
			`}`
			`};`

Update 2019-12-27 22:16:57 +08:00			`class Dilation2DSizeComputer : public ConvolutionSizeComputer {`
			`public:`
			`virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,`
			`const std::vector<Tensor*>& outputs) const override {`
			`MNN_ASSERT(1 == inputs.size() && 1 == outputs.size());`
			`return ConvolutionSizeComputer::onComputeSize(op, inputs, outputs);`
			`}`
			`virtual float onComputeFlops(const MNN::Op* op, const std::vector<Tensor*>& inputs,`
			`const std::vector<Tensor*>& outputs) const override {`
			`auto output = outputs[0];`
			`auto layer = op->main_as_Convolution2D()->common();`
			`auto oSize = output->batch() * output->height() * output->width() * output->channel();`
			`auto flops = (float)oSize * layer->kernelY() * layer->kernelX() / FLOPS_M;`
			`return flops;`
			`}`
			`};`
[PATCH 121/160] [Train:Refractor] Remove no use input of CPUConv2DBackPropFilter 2020-03-14 09:46:57 +08:00			`class Conv2DBackpropFilterSizeComputer : public SizeComputer {`
			`public:`
			`virtual bool onComputeSize(const MNN::Op* op, const std::vector<Tensor*>& inputs,`
			`const std::vector<Tensor*>& outputs) const override {`
			`auto common = op->main_as_Convolution2D()->common();`
			`auto kernel = outputs[0];`
			`kernel->buffer().dimensions = 4;`
			`kernel->buffer().type = halide_type_of<float>();`
			`TensorUtils::getDescribe(kernel)->dimensionFormat = MNN_DATA_FORMAT_NCHW;`
			`kernel->setLength(0, inputs[1]->channel());`
			`kernel->setLength(1, inputs[0]->channel() / common->group());`
			`kernel->setLength(2, common->kernelY());`
			`kernel->setLength(3, common->kernelX());`
			`return true;`
			`}`
			`};`
Update 2019-12-27 22:16:57 +08:00
beta 0.1.0 2019-04-17 10:49:11 +08:00			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_Convolution);`
			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_ConvolutionDepthwise);`
Github release 1.1.0 2020-11-05 16:41:56 +08:00			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_TfQuantizedConv2D);`
			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_QuantizedDepthwiseConv2D);`
beta 0.2.0.3 - add quantization tool & cpu impl & demo/exec - add thread pool - add tests - fix onnx converter tensor name mismatch - optimize cpu performance with SSE for windows 2019-07-11 13:56:52 +08:00			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_ConvInt8);`
			`REGISTER_SHAPE(ConvolutionSizeComputer, OpType_DepthwiseConvInt8);`
Update 2019-12-27 22:16:57 +08:00			`REGISTER_SHAPE(Dilation2DSizeComputer, OpType_Dilation2D);`
[PATCH 121/160] [Train:Refractor] Remove no use input of CPUConv2DBackPropFilter 2020-03-14 09:46:57 +08:00			`REGISTER_SHAPE(Conv2DBackpropFilterSizeComputer, OpType_Conv2DBackPropFilter);`
beta 0.1.0 2019-04-17 10:49:11 +08:00			`} // namespace MNN`