目录
Linux中,我们知道getpid(2) 可以获取调用进程的pid,那么如何获取一个线程的id呢?
可以用系统调用gettid(2)获取内核中的线程id ,POSIX线程库提供的pthread_self(3)方法获取分配的线程id。C++11 std::thread的get_id()方法,封装的也是POSIX pthread线程库的线程id。
内核中的线程id,与pthread线程库的线程id有何区别?
在Linux中,线程本质上是一个进程(实现),也就是说,通过系统调用gettid获取的线程id跟进程id是一样的。
glibc的Pthreads实现,把pthread_self返回值类型pthread_t用作一个结构体指针(类型为unsigned long),指向一个动态分配的内存,而且该内存是反复使用的。这也就是说,pthread_t的值很容易重复。Pthreads只能保证同一个进程内,同一时刻的各个线程id不同;但不能保证同一进程先后多个线程具有不同id,不能保证一台机器上多个进程间的id不同。
因此,pthread_t不适合作为程序中对线程的标识符。建议用gettid(2)系统调用返回值作为线程id,好处在于:
- 类型是pid_t,其值是一个小整数(最大值/proc/sys/kernel/pid_max,默认32768),便于log输出;
- 表示内核的任务调度id,在/proc文件系统中,可以找到对应项:/proc/tid,或/prod/pid/task/tid;
- 在其他系统工具中容易定位到具体某个线程,如top(1)命令中,可以按线程列出任务,然后找出CPU使用率最高的线程id,再根据log判断到底哪个线程在耗费CPU;
- 任何时刻都是全局唯一的,且由于Linux分配新pid采用递增轮回办法,短时间内启动的多个线程也会具有不同的线程id;
- 0是非法值,因为操作系统的第一个进程init的pid是1,而gettid采用的线程tid本质上是进程pid,因此不能再为1。
示例
// 通过pthread线程库获取tid
void* threadFunc(void* arg)
{
pthread_t id = pthread_self(); // 获取Pthreads线程id
printf("pthread id=%lx\n", id);
}
int main()
{
pthread_t th;
pthread_create(&th, NULL, threadFunc, NULL);
pthread_join(th, NULL);
return 0;
}
// C++11 std::thread通过get_id获取tid
void threadFunc()
{
cout << th.get_id() << endl; // 获取Pthreads线程id
}
int main()
{
std::thread th(threadFunc);
th.join();
return 0;
}
// 通过系统调用gettid获取线程id
pid_t gettid()
{
return static_cast<pid_t>(::syscall(SYS_gettid));
}
利用thread local缓存线程id
由于系统调用会陷入内核,频繁系统调用可能会影响系统性能,有没有办法可以避免这个问题?
答案是由的。考虑到线程id在线程创建后,并不会随意改变,因此可以用每个线程自带的thread local(__thread)变量来缓存其线程id值,初值设为0或负数即可。
// C++11 利用__thread缓存线程id
__thread int t_tid = 0;
// 用户接口:获取线程id
inline int tid()
{
if (t_tid == 0)
{
cacheTid();
}
return t_tid;
}
void cacheTid()
{
if (t_tid == 0)
{
t_tid = gettid();
}
}
// 通过系统调用gettid获取线程id
pid_t gettid()
{
return static_cast<pid_t>(::syscall(SYS_gettid));
}
参考
[1]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.