pytorch中神经网络的多线程数设置：torch.set_num_threads(N)

pytorch中神经网络的多线程数设置：torch.set_num_threads(N)
实验室的同学一直都是在服务器上既用CPU训练神经网络也有使用GPU的，最近才发现原来在pytorch中可以通过设置 torch.set_num_threads(args.thread) 来限制CPU上进行深度学习训练的线程数。

torch.set_num_threads(args.thread) 在使用时的一个注意事项就是如果不设置则默认使用物理CPU核心数的线程进行训练，而往往默认设置是可以保证运算效率最高的，因此该设置线程数是需要小于物理CPU核心数的，否则会造成效率下降。

既然默认设置既可以保证最高的运算效率那么这个设置的意义在哪呢，这个设置的意义就是在多人使用计算资源时限制你个人的改应用的计算资源占用情况，否则很可能你一个进程跑起来开了太多的线程直接把CPU占用率搞到50%或者直接奔100%去了。

总的说，该设置是为了在多人共享计算资源的时候防止一个进程抢占过高CPU使用率的。

给一个自己的设置代码：（实现了pytorch的最大可能性的确定性可复现性，并设置训练、推理时最大的线程数）
```
# pytorch的运行设备
device = None


def context_config(args):
    global device

    seed = args.seed

    random.seed(seed)
    np.random.seed(seed)

    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)

    torch.set_num_threads(args.thread)  # 设置pytorch并行线程数
    if torch.cuda.is_available() and args.gpu >= 0:
        torch.backends.cudnn.benchmark = False
        torch.backends.cudnn.deterministic = True

        device = torch.device('cuda:' + str(args.gpu))
    else:
        device = torch.device('cpu')
```
================================

运行DQN2013算法，CPU运行，CPU为Intel 10700k, 8核心16线程：

默认设置：

设置20线程：

torch.set_num_threads(20）

结果：

发现如果线程设置过多，超过CPU的物理线程数运行效率不仅没有提升反而下降，正常默认设置即可。

===================================
本博客是博主个人学习时的一些记录，不保证是为原创，个别文章加入了转载的源地址还有个别文章是汇总网上多份资料所成，在这之中也必有疏漏未加标注者，如有侵权请与博主联系。如果未特殊标注的则为原创，遵循 CC 4.0 BY-SA 版权协议。
相关阅读:
sbt commands
SBT Assembly
There is no setter for property named 可能产生的原因！
JSP页面分页显示数据
 CentOS7配置FTP服务器增强版~(零基础学会FTP配置)
Windows下将程序打包为安装包（最为简易的方式）
Linux多线程编程详细解析----条件变量 pthread_cond_t
在Linux中使用线程
 关于verilog中语句可不可综合
 32位先行进位加法器的实现
原文地址：https://www.cnblogs.com/devilmaycry812839668/p/15854307.html