MNN/tools/converter/source/common/AddSparseInfo.cpp

//
//  AddSparseInfo.cpp
//  MNNConverter
//
//  Created by MNN on 2021/08/11.
//  Copyright © 2018, Alibaba Group Holding Limited
//

#include "CommonUtils.hpp"
#include "common/CommonCompute.hpp"
#include "backend/cpu/compute/SparseConvolutionTiledExecutor.hpp"

using namespace MNN;

void AddSparseInfo(std::unique_ptr<MNN::OpT>& op, Compression::Pipeline proto) {
    auto prune_algo_type = MNN::SparseAlgo_RANDOM;
    int sparseBlockOC = 1;
    int sparseBlockKernel = 1;

    for (const auto& algo : proto.algo()) {
        if (algo.type() == Compression::CompressionAlgo::PRUNE) {
            auto prune_type = algo.prune_params().type();
            prune_algo_type = MNN::SparseAlgo(prune_type);
            if (prune_type == Compression::PruneParams_PruneType_SIMD_OC) {
                sparseBlockOC = algo.prune_params().simd_oc_pruner_params().oc_blocks(0);
            }
        }
    }

    const auto opType = op->type;
    switch (opType) {
        case MNN::OpType_Convolution:
        case MNN::OpType_ConvolutionDepthwise: {
            auto param = op->main.AsConvolution2D();
            if (param->weight.empty()) {
                return;
            }

            size_t weightSize = param->weight.size();
            size_t biasSize = param->bias.size();
            size_t weightNNZElement, weightBlockNumber = 0;
            CommonCompute::statisticWeightSparsity(weightNNZElement, weightBlockNumber, param->weight.data(), biasSize, weightSize / biasSize, sparseBlockOC);
            float sparsity = 1. - double(weightNNZElement) / weightSize;
            // MNN_PRINT(" opname [%s] sparsity is:%f\n", op->name.c_str(), sparsity);
            if (!SparseConvolutionTiledExecutor::shouldUseSparseConvolution(sparsity, sparseBlockOC)) {
                return;
            }

            MNN::AttributeT* arg1(new MNN::AttributeT);
            arg1->key = "sparseBlockOC";
            arg1->i = sparseBlockOC;

            MNN::AttributeT* arg2(new MNN::AttributeT);
            arg2->key = "sparseBlockKernel";
            arg2->i = sparseBlockKernel;

            MNN::AttributeT* arg3(new MNN::AttributeT);
            arg3->key = "NNZElement";
            arg3->i = weightNNZElement;

            MNN::AttributeT* arg4(new MNN::AttributeT);
            arg4->key = "blockNumber";
            arg4->i = weightBlockNumber;

            flatbuffers::FlatBufferBuilder builder;
            std::vector<flatbuffers::Offset<MNN::Attribute>> argsVector;
            auto sparseArg1 = MNN::CreateAttribute(builder, arg1);
            auto sparseArg2 = MNN::CreateAttribute(builder, arg2);
            auto sparseArg3 = MNN::CreateAttribute(builder, arg3);
            auto sparseArg4 = MNN::CreateAttribute(builder, arg4);

            argsVector.emplace_back(sparseArg1);
            argsVector.emplace_back(sparseArg2);
            argsVector.emplace_back(sparseArg3);
            argsVector.emplace_back(sparseArg4);

            auto sparseArgs = builder.CreateVectorOfSortedTables<MNN::Attribute>(&argsVector);
            auto sparseCom = MNN::CreateSparseCommon(builder, prune_algo_type, sparseArgs);
            builder.Finish(sparseCom);
            auto sparseComPtr = flatbuffers::GetRoot<MNN::SparseCommon>(builder.GetBufferPointer())->UnPack();

            param->sparseParameter.reset(sparseComPtr);

            break;
        }
        default:
            break;
    }
};

void addSparseInfo(std::unique_ptr<MNN::NetT>& netT, MNN::Compression::Pipeline proto) {
    for (auto& op : netT->oplists) {
        AddSparseInfo(op, proto);
    }
    for (auto& subgraph : netT->subgraphs) {
        for (auto& op : subgraph->nodes) {
            AddSparseInfo(op, proto);
        }
    }
}
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`//`
			`// AddSparseInfo.cpp`
			`// MNNConverter`
			`//`
			`// Created by MNN on 2021/08/11.`
			`// Copyright © 2018, Alibaba Group Holding Limited`
			`//`

			`#include "CommonUtils.hpp"`
			`#include "common/CommonCompute.hpp"`
			`#include "backend/cpu/compute/SparseConvolutionTiledExecutor.hpp"`

			`using namespace MNN;`

			`void AddSparseInfo(std::unique_ptr<MNN::OpT>& op, Compression::Pipeline proto) {`
			`auto prune_algo_type = MNN::SparseAlgo_RANDOM;`
			`int sparseBlockOC = 1;`
			`int sparseBlockKernel = 1;`

			`for (const auto& algo : proto.algo()) {`
			`if (algo.type() == Compression::CompressionAlgo::PRUNE) {`
			`auto prune_type = algo.prune_params().type();`
			`prune_algo_type = MNN::SparseAlgo(prune_type);`
			`if (prune_type == Compression::PruneParams_PruneType_SIMD_OC) {`
			`sparseBlockOC = algo.prune_params().simd_oc_pruner_params().oc_blocks(0);`
			`}`
			`}`
			`}`

			`const auto opType = op->type;`
			`switch (opType) {`
			`case MNN::OpType_Convolution:`
			`case MNN::OpType_ConvolutionDepthwise: {`
			`auto param = op->main.AsConvolution2D();`
			`if (param->weight.empty()) {`
			`return;`
			`}`

[Sync] Sync internal gitlab 2022-05-06 19:51:20 +08:00			`size_t weightSize = param->weight.size();`
			`size_t biasSize = param->bias.size();`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`size_t weightNNZElement, weightBlockNumber = 0;`
			`CommonCompute::statisticWeightSparsity(weightNNZElement, weightBlockNumber, param->weight.data(), biasSize, weightSize / biasSize, sparseBlockOC);`
[Sync] Sync internal gitlab 2022-05-06 19:51:20 +08:00			`float sparsity = 1. - double(weightNNZElement) / weightSize;`
[MNN:Sync] Sync 2.0. 2022-07-11 10:56:37 +08:00			`// MNN_PRINT(" opname [%s] sparsity is:%f\n", op->name.c_str(), sparsity);`
[MNN:Sync] Sync internal gitlab 2022-01-04 10:50:40 +08:00			`if (!SparseConvolutionTiledExecutor::shouldUseSparseConvolution(sparsity, sparseBlockOC)) {`
[MNN:Sync] Sync internal Gitlab 2021-09-18 15:52:30 +08:00			`return;`
			`}`

			`MNN::AttributeT* arg1(new MNN::AttributeT);`
			`arg1->key = "sparseBlockOC";`
			`arg1->i = sparseBlockOC;`

			`MNN::AttributeT* arg2(new MNN::AttributeT);`
			`arg2->key = "sparseBlockKernel";`
			`arg2->i = sparseBlockKernel;`

			`MNN::AttributeT* arg3(new MNN::AttributeT);`
			`arg3->key = "NNZElement";`
			`arg3->i = weightNNZElement;`

			`MNN::AttributeT* arg4(new MNN::AttributeT);`
			`arg4->key = "blockNumber";`
			`arg4->i = weightBlockNumber;`

			`flatbuffers::FlatBufferBuilder builder;`
			`std::vector<flatbuffers::Offset<MNN::Attribute>> argsVector;`
			`auto sparseArg1 = MNN::CreateAttribute(builder, arg1);`
			`auto sparseArg2 = MNN::CreateAttribute(builder, arg2);`
			`auto sparseArg3 = MNN::CreateAttribute(builder, arg3);`
			`auto sparseArg4 = MNN::CreateAttribute(builder, arg4);`

			`argsVector.emplace_back(sparseArg1);`
			`argsVector.emplace_back(sparseArg2);`
			`argsVector.emplace_back(sparseArg3);`
			`argsVector.emplace_back(sparseArg4);`

			`auto sparseArgs = builder.CreateVectorOfSortedTables<MNN::Attribute>(&argsVector);`
			`auto sparseCom = MNN::CreateSparseCommon(builder, prune_algo_type, sparseArgs);`
			`builder.Finish(sparseCom);`
			`auto sparseComPtr = flatbuffers::GetRoot<MNN::SparseCommon>(builder.GetBufferPointer())->UnPack();`

			`param->sparseParameter.reset(sparseComPtr);`

			`break;`
			`}`
			`default:`
			`break;`
			`}`
			`};`

			`void addSparseInfo(std::unique_ptr<MNN::NetT>& netT, MNN::Compression::Pipeline proto) {`
			`for (auto& op : netT->oplists) {`
			`AddSparseInfo(op, proto);`
			`}`
			`for (auto& subgraph : netT->subgraphs) {`
			`for (auto& op : subgraph->nodes) {`
			`AddSparseInfo(op, proto);`
			`}`
			`}`
			`}`