MNN/pymnn/examples/MNNExpr/gpu_io_interface.py

import numpy as np
import MNN
import sys
import torch
import time

def inference():
    """ inference mobilenet_v1 using a specific picture """

    config = {}
    config['precision'] = 'low'
    config['backend'] = 2
    config['numThread'] = 4

    rt = MNN.nn.create_runtime_manager((config,))
    rt.set_cache(".cachefile")

    net = MNN.nn.load_module_from_file(sys.argv[1], ["data"], ["prob"], runtime_manager=rt)

    input_var = MNN.expr.placeholder([1, 3, 224, 224], MNN.expr.NCHW)
    image = np.loadtxt(sys.argv[2])
    image = image.astype(np.float32)

    torch_tensor = torch.from_numpy(image)
    torch_tensor = torch_tensor.cuda().type(torch.float16)
    input_var.set_device_ptr(torch_tensor.data_ptr(), 2)

    #inference
    output_var = net.forward([input_var])
    output_var = output_var[0]
    output_var = MNN.expr.convert(output_var, MNN.expr.NCHW)

    # output_numpy= output_var.read()
    out_torch = torch.empty([1, 1000], dtype=torch.float16).cuda()
    output_var.copy_to_device_ptr(out_torch.data_ptr(), 2)
    output_numpy = out_torch.type(torch.float32).cpu().numpy()

    ref_out = np.loadtxt(sys.argv[3]).astype(np.float32)
    close = np.allclose(output_numpy.flatten(), ref_out, atol=0.03)

    print("USE GPU IO data, verify equal:", close)

if __name__ == "__main__":
    # python gpu_interface.py **/mobilenet/temp.bin **/mobilenet/input_0.txt **/mobilenet/output.txt
    inference()
[MNN:Sync] Sync Internal 2.8.2 2024-02-29 16:21:40 +08:00			`import numpy as np`
			`import MNN`
			`import sys`
			`import torch`
			`import time`

			`def inference():`
			`""" inference mobilenet_v1 using a specific picture """`

			`config = {}`
			`config['precision'] = 'low'`
			`config['backend'] = 2`
			`config['numThread'] = 4`

			`rt = MNN.nn.create_runtime_manager((config,))`
			`rt.set_cache(".cachefile")`

			`net = MNN.nn.load_module_from_file(sys.argv[1], ["data"], ["prob"], runtime_manager=rt)`

			`input_var = MNN.expr.placeholder([1, 3, 224, 224], MNN.expr.NCHW)`
			`image = np.loadtxt(sys.argv[2])`
			`image = image.astype(np.float32)`

			`torch_tensor = torch.from_numpy(image)`
			`torch_tensor = torch_tensor.cuda().type(torch.float16)`
			`input_var.set_device_ptr(torch_tensor.data_ptr(), 2)`

			`#inference`
			`output_var = net.forward([input_var])`
			`output_var = output_var[0]`
			`output_var = MNN.expr.convert(output_var, MNN.expr.NCHW)`

			`# output_numpy= output_var.read()`
			`out_torch = torch.empty([1, 1000], dtype=torch.float16).cuda()`
			`output_var.copy_to_device_ptr(out_torch.data_ptr(), 2)`
			`output_numpy = out_torch.type(torch.float32).cpu().numpy()`

			`ref_out = np.loadtxt(sys.argv[3]).astype(np.float32)`
			`close = np.allclose(output_numpy.flatten(), ref_out, atol=0.03)`

			`print("USE GPU IO data, verify equal:", close)`

			`if __name__ == "__main__":`
			`# python gpu_interface.py /mobilenet/temp.bin /mobilenet/input_0.txt **/mobilenet/output.txt`
			`inference()`