openvino 多线程推理--688IT编程网

openvino 多线程推理

OpenVINO支持多线程推理，可以通过以下步骤实现：

1. 启用OpenVINO多线程支持：可以在创建InferenceEngine实例时传递相应参数以启用多线程支持：

c++

InferenceEngine::Core ie;

ie.SetConfig({{InferenceEngine::PluginConfigParams::KEY_PERF_COUNT, InferenceEngine::PluginConfigParams::YES}});

ie.SetConfig({{InferenceEngine::PluginConfigParams::KEY_DYN_BATCH_ENABLED, InferenceEngine::PluginConfigParams::YES}});

ie.SetConfig({{InferenceEngine::PluginConfigParams::KEY_CPU_THREADS_NUM, "4"}}); 设置CPU线程数为4

2. 设置模型输入数据格式：在多线程处理数据时，每个线程会处理不同的数据子集。因此，需要将模型输入数据划分为适当大小的子集，以充分利用多线程并行性。可以通过设置输入层的batch大小和分配给每个线程的batch大小来实现：

c++

int batch_size = ...; 原始batch大小

int num_threads = ...; 线程数

int thread_batch_size = batch_size / num_threads; 每个线程的batch大小

int num_batches = num_threads; 模型处理批次大小等于线程数

设置模型输入数据格式

InferenceEngine::TensorDesc input_desc = input_layer->getTensorDesc();

input_desc.setDims({batch_size, ...}); 设置原始batch大小

BlockingDesc().setBlockDims({thread_batch_size, ...}); 设置每个线程的batch大小

BlockingDesc().setOrder({0, 1, ...}); 设置数据布局

3. 创建多线程处理函数：可以创建一个函数，该函数通过传递不同的数据子集来处理模型的多个线程。例如：

c++

void worker(int thread_id, const InferenceEngine::ExecutableNetwork& network, const InferenceEngine::BlobMap& input_blobs, const InferenceEngine::BlobMap& output_blobs, int batch_size, int thread_batch_size) {

int start_idx = thread_id * thread_batch_size;

int end_idx = start_idx + thread_batch_size;

InferenceEngine::Blob::Ptr input_blob = input_blobs.at("input");

InferenceEngine::Blob::Ptr output_blob = output_blobs.at("output");

while (start_idx < batch_size) {

将数据子集复制到输入blob中

memcpy(input_blob->buffer().as<float*>() + start_idx * input_size, ...);

执行推理

InferenceEngine::InferRequest request = network.CreateInferRequest();

request.SetInput("input", input_blob);

request.SetOutput("output", output_blob);

request.Infer();

处理输出

memcpy(..., output_blob->buffer().as<float*>() + start_idx * output_size);

start_idx += num_threads * thread_batch_size;

}php支持多线程吗

}

4. 创建多个线程并启动处理函数：可以创建多个线程，每个线程处理模型的不同数据子集。例如：

c++

InferenceEngine::ExecutableNetwork network = ...; 加载可执行的网络

InferenceEngine::BlobMap input_blobs = ...; 输入blob映射

InferenceEngine::BlobMap output_blobs = ...; 输出blob映射

int batch_size = ...; 原始batch大小

int num_threads = ...; 线程数

int thread_batch_size = batch_size / num_threads; 每个线程的batch大小

std::vector<std::thread> threads;

for (int i = 0; i < num_threads; i++) {

place_back(std::bind(worker, i, network, input_blobs, output_blobs, batch_size, thread_batch_size));

}

for (auto& t : threads) {

t.join();

}

多线程推理能够显著提高推理性能，并充分利用现代多核处理器的计算能力。但是，为了实现正确的多线程推理，需要小心处理数据划分和同步问题。特别是在模型具有大量参数

和多层的情况下，需要采用适当的线程数和数据划分策略，以充分利用多线程并行性，同时避免过度线程通信和同步开销。

688IT编程网

openvino 多线程推理

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

openvino 多线程推理

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式