在Linux上,执行有多线程的程序时,当程序执行退出操作时有时会遇到卡死现象,如果程序模块多,代码量大,很难快速定位,此时可试试gdb attach方法。
测试代码main.cpp如下,这里为了使程序退出时产生卡死现象,在第51行时push线程sleep 100分钟:
- #include <stdio.h>
- #include <thread>
- #include <queue>
- #include <mutex>
- #include <condition_variable>
- #include <chrono>
-
- namespace {
-
- class Queue {
- public:
- Queue() = default;
- ~Queue() { }
-
- void Init(int num) {
- for (int i = 0; i < num; ++i) {
- queue_.push(i);
- }
- }
-
- int Pop() {
- std::unique_lock<std::mutex> lck(mutex_);
- while (queue_.size() == 0) {
- cv_.wait(lck);
- }
-
- int value = queue_.front();
- queue_.pop();
-
- return value;
- }
-
- void Push(int value) {
- std::unique_lock<std::mutex> lck(mutex_);
- queue_.push(value);
- cv_.notify_all();
- }
-
- private:
- std::queue<int> queue_;
- std::mutex mutex_;
- std::condition_variable cv_;
- }; // class Queue
-
- bool running = false;
-
- void push(Queue& q) {
- int value = 100;
- while (running) {
- q.Push(value++);
- std::this_thread::sleep_for(std::chrono::minutes(100));
- }
- }
-
- void pop(Queue& q) {
- while (running) {
- fprintf(stdout, "pop value: %d
", q.Pop());
- std::this_thread::sleep_for(std::chrono::seconds(1));
- }
- }
-
- } // namespace
-
- int main()
- {
- fprintf(stdout, "test start
");
-
- Queue q;
- q.Init(2);
-
- running = true;
- std::thread th1(push, std::ref(q));
- std::thread th2(pop, std::ref(q));
-
- std::this_thread::sleep_for(std::chrono::seconds(10));
- running = false;
- th1.join();
- th2.join();
-
- fprintf(stdout, "test end
");
- return 0;
- }
build.sh脚本内容如下:
- g++ -g -std=c++11 -o main main.cpp -lpthread
- ./main
执行:$ ./build.sh ,执行结果如下,程序无法正常退出,产生卡死现象:
通过命令:$ ps -aux | grep main ,获取执行main的进程(pid),如下图所示,执行main的进程为18786:
启动gdb attach,执行gdb attach pid即可调试正在运行的程序,执行:$ gdb attach 18786,若执行gdb attach时提示:” ptrace: Operation not permitted”,则执行:$ sudo gdb attach 18786,如下图所示:
也可执行:$ gdb main 18786,与gdb attach 18786相同。
常用的命令如下:
1. bt:查看函数调用栈的所有信息,当程序执行异常时,可通过此命令查看程序的调用过程;
2. info threads:显示当前进程中的线程;
3. thread id:切换到具体的线程id,一般切换到具体的线程后再执行bt等操作。
首先执行info threads,发现共有3个线程,当前线程id是1,即主线程,执行bt,会发现程序卡在第77行,即th1.join()语句上,即在push函数内没有退出;执行thread 2,再执行bt,发现此线程在执行pop函数,卡在了第24行的cv_.wait(lck)语句上;执行thread 3,再执行bt,发现此线程在执行push函数,卡在了第51行的std::this_thread::sleep_for(std::chrono::minutes(100));语句上,分析完成,了解了程序卡死的原因,执行结果如下图所示: