_beginthread和CreateThread

_beginthread和CreateThread

转自：http://www.cnblogs.com/project/archive/2011/08/21/2147634.html

为什么要用C运行时库的_beginthreadex代替操作系统的CreateThread来创建线程？

来源自自1999年7月MSJ杂志的《Win32 Q&A》栏目

   你也许会说我一直用CreateThread来创建线程，一直都工作得好好的，为什么要用_beginthreadex来代替CreateThread，下面让我来告

诉你为什么。
   回答一个问题可以有两种方式，一种是简单的，一种是复杂的。

如果你不愿意看下面的长篇大论，那我可以告诉你简单的答案：_beginthreadex在内部调用了CreateThread，在调用之前

_beginthreadex做了很多的工作，从而使得它比CreateThread更安全。

    为什么我们需要两个几乎相同的库来分别对待单线程和多线程程序？说起来也很简单，两个字——效率。让我们从头说起，标准CRT库出现

于1970年左右，那时，线程的概念尚未出现在任何一个操作系统上。但是，线程毕竟是出现了，那好，让我们来看看下面这个例子，在这个例

子中我们使用了CRT的全局变量 errno：

BOOL fFailure = (system("NOTEPAD.EXE README.TXT") == -1);
if (fFailure) {
     switch (errno) {
     case E2BIG: // Argument list or environment too big
         break;
   case ENOENT: // Command interpreter cannot be found
       break;
   case ENOEXEC: // Command interpreter has bad format
       break;
   case ENOMEM: // Insufficient memory to run command
       break;
   }
}

设想这样的情况，当上面的代码执行到system函数之后，if声明之前的时候，操作系统打断了它，而转去执行进程中的另一个线程，而这个线

程正好使用了会设置errno的某个CRT函数......于是，问题就出现了。

为了解决这个问题，每个线程需要自己的errno全局变量，而且还需要一些机制来使得它们使用它们自己的errno变量，而不是其他线程的。当

然， errno只是“多线程不服症”的其中一个受害者，其他受害者还有：_doserrno, strtok, _wcstok, strerror, _strerror, tmpnam,

tmpfile, asctime, _wasctime, gmtime, _ecvt, _fcvt。

于是，为了让C和C++程序能够正常工作，必须创建一个数据结构，并把它与每一个线程关连起来，只有这样才能调用CRT库时不至于误入“他线程家园”。
   那么系统怎么知道在创建一个新线程时分配这个数据块呢？回答是系统不知道，这一切责任都在你，只有你才能确保所有的事情正常完成。

是不是有点重任在肩的感觉？呵呵，不要紧，其你要做的和标题所说的一样，只需要调用_beginthreadex函数即可：

unsigned long _beginthreadex(void *security,
     unsigned stack_size,
unsigned (*start_address)(void *), void *arglist,
     unsigned initflag, unsigned *thrdaddr);

_beginthreadex的参数列表与 CreateThread一模一样，只是参数名与类型有少许差异罢了。这是因为Microsoft觉得CRT函数不应该对

Windows的数据类型有任何依赖。两者返回的东西也是一样的，所以即使你使用了CreateThread函数，要替换成_beginthreadex也是一

件很容易的事情。

因为两者的数据类型不完全一致，所以我们需要作一些转换来避免编译器的抱怨，为了简化这项工作，你可以使用我所写的这个宏：

typedef unsigned (__stdcall * PTHREAD_START) (void *);

#define chBEGINTHREADEX(psa, cbStack, pfnStartAddr, \ pvParam, fdwCreate, pdwThreadID) \
((HANDLE) _beginthreadex( \
(void *) (psa), \
(unsigned) (cbStack), \
(PTHREAD_START) (pfnStartAddr),\
(void *) (pvParam),\
(unsigned) (fdwCreate), \
(unsigned *) (pdwThreadID)))

注意_beginthreadex函数只存在于CRT库的多线程版本中，如果你链接到了一个单线程运行时库，链接器会毫不客气地报告 “unresolved

external symbol”错误。另外，还需要注意的是VS在创建新项目时默认选择的是单线程库，所以需要记得修改设置。

说了这么多，只是说了一些概念，至于 _beginthreadex为什么要比CreateThread更好，还是需要事实来说话的，当然，程序员所说的事

实，就是代码了，代码之前，了无秘密，所以下面让我们来看看CRT库的代码是怎样的。首先，自然是主角人物_beginthreadex（你可以在

THREADEX.C中找到它），因为没必要在这里重复写出源代码，所以我只给出伪代码版本的_beginthreadex：

unsigned long __cdecl _beginthreadex (
     void *psa,
     unsigned cbStack,
     unsigned (__stdcall * pfnStartAddr) (void *),
     void * pvParam,
     unsigned fdwCreate,
     unsigned *pdwThreadID)

{
     _ptiddata ptd;         // Pointer to thread's data block
     unsigned long thdl;    // Thread's handle
     // Allocate data block for the new thread
     if ((ptd = calloccrt(1, sizeof(struct tiddata))) == NULL)
         goto errorreturn;
     // Initialize the data block
     initptd(ptd);
     // Save the desired thread function and the parameter
     // we want it to get in the data block
     ptd->_initaddr = (void *) pfnStartAddr;
     ptd->_initarg = pvParam;
     // Create the new thread
     thdl = (unsigned long) CreateThread(psa, cbStack,_threadstartex, (PVOID) ptd, fdwCreate, pdwThreadID);
     if (thdl == NULL) {
         // Thread couldn't be created, cleanup and return failure
         goto error_return;
     }
     // Create created OK, return the handle
     return(thdl);
error_return:
     // Error: data block or thread couldn't be created
     _free_crt(ptd);
     return((unsigned long)0L);
}

_beginthreadex的代码中有几个地方需要重点注意：
   首先每个线程会从CRT的堆上获得真正属于它自己的tiddata内存块。 tiddata数据结构你可以在MTDLL.H中找到。传递给

_beginthreadex的线程函数的地址被保存在tiddata内存块中。要传递给该线程函数的参数也被保存在这里。_beginthreadex接下来调用

CreateThread，注意，这时CreateThread在新线程中执行的并不是pfnStartAddr函数，而是一个名为_threadstartex的函数。同

时，传递给线程函数的参数也不是pvParam，而是 tiddata结构的地址。最后，如果一切顺利将返回线程句柄，如果任何一个操作失败，将返

回NULL。

现在，tiddata结构已经被分配并初始化完成，下面来看看该结构是如何关联到线程的。这次的对象是_threadstartex，同样也在

THREADEX.C中，同样也给出伪代码：

static unsigned long WINAPI _threadstartex (void* ptd) {
    // Note: ptd is the address of this thread's tiddata block

    // Associate the tiddata block with this thread
TlsSetValue(__tlsindex, ptd);

    // Save this thread ID in the tiddata block
    ((_ptiddata) ptd)->_tid = GetCurrentThreadId();

    // Initialize floating-point support (code not shown)

    // Wrap desired thread function in SEH frame to
    // handle runtime errors and signal support
    __try {
        // Call desired thread function passing it the desired parameter
        // Pass threads exit code value to _endthreadex
_endthreadex(
          ( (unsigned (WINAPI *)(void *))(((_ptiddata)ptd)->_initaddr) )
              ( ((_ptiddata)ptd)->_initarg ) ) ;
    }
    __except(_XcptFilter(GetExceptionCode(), GetExceptionInformation()){
        // The C-Runtime's exception handler deals with runtime errors
        // and signal support, we should never get it here.
        _exit(GetExceptionCode());
    }

    // We never get here, the thread dies in this function
    return(0L);
}

_threadstartex同样也有一些东西需要我们注意。新线程开始时会执行BaseThreadStart（位于Kernel32.DLL 中），然后跳到

_threadstartex。_threadstartex的唯一参数就是新线程的tiddata内存块地址。TlsSetValue完成了将tiddata结构与线程关联起来的

目的（这里的tiddata结构被称为线程本地存储，TLS，顾名思义，就是属于每个线程自己的数据）。

在事实上的线程函数周围放置了一个结构化异常处理体（A structured exception handling frame）。这个处理体主要负责处理与运行时库

有关的很多东西，比如运行时错误（像抛出但却没有被捕获的C++异常这类东西）和CRT的signal函数。这很重要，如果你使用

CreateThread创建了线程，然后又调用了CRT的signal函数，那么signal函数将无法正常工作。

注意，这时还不能返回到BaseThreadStart，如果这样做，线程会死掉，退出码会正常设置，但tiddata内存块不会被销毁，这就会造成内存

泄漏。为了防止泄漏，需要调用_endthreadex，并且将退出码传递给它。

_endthreadex同样也在THREADEX.C中，同样也给出伪代码：

void __cdecl _endthreadex (unsigned retcode) {
     _ptiddata ptd;    // Pointer to thread's data block

     // Cleanup floating-point support (code not shown)

     // Get the address of this thread's tiddata block
     ptd = _getptd();

     // Free the tiddata block
     _freeptd(ptd);

     // Terminate the thread
     ExitThread(retcode);
}

注意CRT的_getptd函数在内部调用了系统的TlsGetValue函数来获取对应线程的tiddata内存块地址，然后释放该内存块，最后调用

ExitThread来真正销毁线程，当然是用上面所提到的退出码来调用。

我强烈建议你绝不要调用ExitThread来中止你的线程。最好也是最简单的办法就是让线程自己返回即可，让它自生自灭。ExitThread不仅徒增

复杂，而且还会造成tiddata内存块泄漏。

Microsoft Visual C++项目组发现人们总是喜欢调用ExitThread，他们希望能尽可能的做到让程序不泄漏内存。所以如果你真的想要明确地

退出线程，你也最好使用_endthreadex，虽然这也不太好。

OK，目前为止你应该对谁更好些的问题有了深入的了解，但是为什么调用CreateThread的程序仍然可以经年累月的正常运行呢？当线程调用

一个需要 tiddata结构的CRT函数时（大多数CRT函数是线程安全的，并不需要该结构），首先CRT函数试图获取线程的数据块的地址（通过

调用 TlsGetValue），然后，如果返回NULL，说明调用线程没有相关联的tiddata块，那么CRT函数马上为调用线程分配并初始化一个

tiddata块，并将该内存块关联到线程（通过TlsSetValue），这样，该CRT函数以及其他CRT函数都可以使用该线程的tiddata块了（此即

所谓“前人栽树后人乘凉”了，^_^）。

当然，如果说你的线程运行的时候一直没有问题是几乎不可能的。事实上，的确有一些问题需要说说。如果线程使用了CRT的signal函数，整

个进程都会被中止，因为结构化异常处理体尚未准备好。同样，如果不调用_endthreadex来中止线程就会造成内存泄漏，如果使用

_beginthreadex，当然会容易想到_endthreadex，但如果你习惯了使用CreateThread，是否还会想起_endthreadex，我表示极大的怀

疑，而且CreateThread/_endthreadex的组合怎么看怎么让人别扭。

不要忘记开始的问题，接下来让我们再来看看效率问题。CRT库的多线程版本在某些函数里面放置了同步原语，比如malloc，为了保证堆不会

被同时调用的 malloc函数破坏，这不可避免地会对效率造成影响，C/C++的哲学我们不应忘记，“决不为自己没有用到的付出代价”，自

然，我们无权要求单线程程序为多线程程序付出它们不该付出的代价，所以，开头的问题也有了答案。

上面所说的都是静态链接的CRT库，而CRT库的动态链接版本则被编写得更加通用，以便能够被任何运行的程序和DLL共享。正是基于这个原

因，这个版本的库只存在多线程版本。因为CRT库是以DLL形式提供的，程序和DLL不需要包含CRT库的任何代码，自然尺寸也就更小。同

时，如果Microsoft修正了CRT库DLL中的Bug，程序也就自然受益了。

终于该结束了，还是来几句总结吧：首先，如果你调用_beginthreadex，你会获得线程的句柄，句柄当然需要关闭，但_endthreadex并没

有这么做。通常是调用_beginthreadex的线程（很可能是主线程）来调用CloseHandle关闭不再需要的新线程的句柄。其次，如果你使用

CRT函数，你只需要使用_beginthreadex即可。如果不使用，那么你可以只使用CreateThread。同样，如果只有一个线程（主线程）使用

CRT，你也可以使用CreateThread；如果新创建的线程不使用CRT，那么你也不需要_beginthreadex和多线程CRT。
相关阅读:
Java Program to Calculate Standard Deviation
Basic JavaScript: Counting Cards
MacBook Pro jdk Installation、Update、Delete
How to Download and Install Oracle JAVA 8 on Ubuntu 18.04/16.04 LTS
9扩大你的词汇量：字体和颜色样式
 8添加一些样式：开始学习CSS
7添加一个“X”到HTML：转到XHTML
6严格的HTML：遵循标准，合乎规范
 5认识媒体：给网页添加图像
 4Web镇之旅：开始链接
原文地址：https://www.cnblogs.com/qinfengxiaoyue/p/3033170.html

_beginthread和CreateThread

转自：http://www.cnblogs.com/project/archive/2011/08/21/2147634.html

为什么要用C运行时库的_beginthreadex代替操作系统的CreateThread来创建线程？