mutex和CRITICAL_SECTION，互斥和临界区

mutex和CRITICAL_SECTION，互斥和临界区
本文不没有任何知识可讲，只是帖上自己测试的结果。

想看底层原理的可以直接关闭。

不过对于急着要选方案的人，倒提供一些帮助。

先说一些无关紧要的废话：

====================================================================================================================================================

先说说为什么会有这篇文章。

我在做练习的时候，参考一些老代码，发现了CRITICAL_SECTION这个类型。以前没有用过。查了一下，三个要点：windows使用；互斥效果；比mutex快。

后来又翻了些网页查看两者的一些简介。很统一的结果，CRITICAL_SECTION比mutex快，而且Linux上没有类似的接口（注：可能是我搜索的方式不对，加上本人对Linux研究不多，所以没有找到）。

对于刚打算使用c++11制作全新技术接口版本的服务器的我来说，很遗憾啊，Linux没有。难道我只能用这种慢速的锁？而我又不想写太多差异化的代码，能用标准库最好，等到真的某个模块成为新能瓶颈的时候再针对某个模块在Linux上做差异处理。

所以我还是想使用标准库来完成这个事情。

于是，我搜索“CRITICAL_SECTION c++11”。

两篇很重要的文章出现在了搜索结果里，是因为这两篇文章而产生了本文。

https://stackoverflow.com/questions/23519630/are-there-c11-critical-sections

https://stackoverflow.com/questions/9997473/stdmutex-performance-compared-to-win32-critical-section

====================================================================================================================================================

第一篇文章的精要在：

虽然Linux上没有临界区这样的接口，而mutex又是需要陷入内核去处理的东西。但是呢这些都是规定，仅仅是为了兼容POSIX协议做的。而mutex慢主要是POSIX需要跨进程。但是呢，在不同的系统和版本上面，就可以有私人定制，就如同windows上的CRITICAL_SECTION。一旦我不再兼容POSIX，就可以做一些自己的花活。而同时在兼容POSIX的平台上，继续遵循POSIX的规定。

以上精要，你可以在第一个连接的第一个回复里面的追问里面得到。

这给我提供了一个很重要的信息：c++11是没有临界区这样的用法。而且mutex的跨进程也不是所有的系统和版本都需要的，仅仅是某些版本需要。在不需要的版本上std::mutex可能是有特殊的用法和优化可以媲美临界区。

总之，mutex和mutex不一样

有了这个想法，我决定自己写代码试试。

然而不幸的是，当我准备写的时候，我想，这种问题应该也会有其他人这样想吧，说不定能搜到呢？

在搜索结果里，我就看到了第二篇。

第二篇文章的精要在：

std::mutex慢。CRITICAL_SECTION更快。但是如果采用合理的方式来分割任务，两者可以达到几乎相同的效果。

第二篇文章是含有两个人的测试代码的。第一个人的测试代码是直接比对两种用法的时间差异。但是很遗憾，他使用的是vs2012。这个版本对c++11的支持并不算完美。第二个人的测试代码是将任务做了分割，分给不同的cpu，又延长了执行间隔，减少访问冲突。使用的是vs2013，这一传说中对c++11支持很完善的版本

看到这里，我有些冷，就不太想写测试代码了。原因是开发工具，人家已经更新到了一个合理的版本，其次在结构上进行了划分，而划分之后才打个平手。

似乎所有的结果都是唯一的。

但是！中间好几年了。万一有变化呢？即使没有，自己测试一下总归实在一些。所以还是自己做了个测试。结果很意外。

先说思路：

在同一进程中，开启4个线程，2个用std::mutext去抢，两个用CRITICAL_SECTION去抢；

两组方式各自使用自己组的变量；

只记录计算次数，不做结果正确判断；

以下是测试代码
1 #include <iostream> 2 #include <mutex> 3 #include <thread> 4 #include <Windows.h> 5 #include <chrono> 6 7 using namespace std; 8 9 mutex g_Mutex_Lock, g_Mutex_finish; 10 CRITICAL_SECTION g_CS_Lock, g_CS_finish; 11 uint64_t g_Mutext_Num = -1; 12 uint64_t g_CS_Num = -1; 13 const int32_t g_Count = 10000000; 14 once_flag g_Mutex_flag, g_CS_flag; 15 chrono::time_point<chrono::system_clock> g_Mutex_StartTime, g_CS_StartTime; 16 int32_t g_Mutex_Complete = 0; 17 int32_t g_CS_Complete = 0; 18 19 uint64_t Calculate(uint64_t num, int index) 20 { 21 if (index % 2) 22 { 23 return (num / 0x5555) * 0xaaaa; 24 } 25 else 26 { 27 return (num / 0x6666) * 0x9999; 28 } 29 } 30 31 void mutexTimeStart() 32 { 33 g_Mutex_StartTime = chrono::system_clock::now(); 34 } 35 36 void mutexCalculate() 37 { 38 call_once(g_Mutex_flag, mutexTimeStart); 39 40 for (int i = 0; i < g_Count; ++i) 41 { 42 g_Mutex_Lock.lock(); 43 g_Mutext_Num = Calculate(g_Mutext_Num, i); 44 g_Mutex_Lock.unlock(); 45 } 46 g_Mutex_finish.lock(); 47 ++g_Mutex_Complete; 48 if (2 == g_Mutex_Complete) 49 { 50 chrono::duration<double> elapsed_seconds = chrono::system_clock::now() - g_Mutex_StartTime; 51 printf("mutex finished use: %f ", elapsed_seconds.count()); 52 } 53 g_Mutex_finish.unlock(); 54 } 55 56 void csTimeStart() 57 { 58 g_CS_StartTime = chrono::system_clock::now(); 59 } 60 61 void csCalculate() 62 { 63 call_once(g_CS_flag, csTimeStart); 64 for (int i = 0; i < g_Count; ++i) 65 { 66 EnterCriticalSection(&g_CS_Lock); 67 g_CS_Num = Calculate(g_CS_Num, i); 68 LeaveCriticalSection(&g_CS_Lock); 69 } 70 EnterCriticalSection(&g_CS_finish); 71 ++g_CS_Complete; 72 if (2 == g_CS_Complete) 73 { 74 chrono::duration<double> elapsed_seconds = chrono::system_clock::now() - g_CS_StartTime; 75 printf("cs finished use: %f ", elapsed_seconds.count()); 76 } 77 LeaveCriticalSection(&g_CS_finish); 78 } 79 80 81 void main() 82 { 83 InitializeCriticalSection(&g_CS_Lock); 84 InitializeCriticalSection(&g_CS_finish); 85 86 thread t3(csCalculate); 87 t3.detach(); 88 thread t4(csCalculate); 89 t4.detach(); 90 91 thread t1(mutexCalculate); 92 t1.detach(); 93 thread t2(mutexCalculate); 94 t2.detach(); 95 96 int tStop; 97 cin >> tStop; 98 }
main.cpp
测试环境：win10企业版（已经更新到最新）+vs2015企业版+i7-6700HQ（2.6G×8）

64位release版结果：

图中除最后一个外，都是循环1千万次的结果。最后一个是10亿次的结果。

再上一个64位debug版的1亿次的截图（原谅我没有等带10亿次的结果，你们不知道，我测试1千万的结果是n秒。然后头绕一热直接跳了两级，一运行，发现没出结果，然后一算，就傻了，关掉减个0）。

无论前面有多少经历，无论多少推测。结果胜过一切，我可以继续安心的、开心的使用std继续进行我的练习了。

本次测试结果：

1、性能不是瓶颈，不要考虑太多。优化都是在原有的基础上逐步修改改出来的成果，不是动手的时候，脑子就有现成的方案。何况性能并没有走到瓶颈。

2、没有什么比电脑跑出来的结果更靠谱。毕竟电脑才是所有理论知识最终产物的执行者。

3、随时间的推移，技术在改良。使用通用的接口，每次技术更替，你也在享受免费的红利。

最后，如果有朋友发现我的代码中存在影响测试结果的错误，请留言指出。我不想自己错了，还误导别人。
相关阅读:
jQuery_第一章_JavaScript基础
 呵呵双钻
 MINIDVD
幸运抽奖
 三章
 复习
 三种循环
 百文买百鸡
 1~100的奇数和
 Python memcache和redis
原文地址：https://www.cnblogs.com/saucerman/p/7438250.html