核桃干貨 | C++11實現(xiàn)的100行線程池

線程池
C++帶有線程操作,異步操作,就是沒有線程池,至于線程池的概念,我先搜一下別人的解釋:
一般而言,線程池有以下幾個部分:
1. 完成主要任務的一個或多個線程。
2. 用于調度管理的管理線程。
3. 要求執(zhí)行的任務隊列。
我來講講人話:你的函數(shù)需要在多線程中運行,但是你又不能每來一個函數(shù)就開啟一個線程,所以你就需要固定的N個線程來跑執(zhí)行,但是有的線程還沒有執(zhí)行完,有的又在空閑,如何分配任務呢,你就需要封裝一個線程池來完成這些操作,有了線程池這層封裝,你就只需要告訴它開啟幾個線程,然后直接塞任務就行了,然后通過一定的機制獲取執(zhí)行結果。
這里有一個100行實現(xiàn)線程池的操作:
分析源代碼 頭文件
vector,queue,momory 都沒啥說的,thread線程相關,mutex 互斥量,解決資源搶占問題,condition_variable 條件量,用于喚醒線程和阻塞線程,future 從使用的角度出發(fā),它是一個獲取線程數(shù)據(jù)的函數(shù)。functional 函數(shù)子,可以理解為規(guī)范化的函數(shù)指針。stdexcept 就跟它的名字一樣,標準異常。
class ThreadPool {public:ThreadPool(size_t);template<class F, class... Args>auto enqueue(F&& f, Args&&... args)-> std::future<typename std::result_of<F(Args...)>::type>;~ThreadPool();private:// need to keep track of threads so we can join themstd::vector< std::thread > workers;// the task queuestd::queue< std::function<void()> > tasks;// synchronizationstd::mutex queue_mutex;std::condition_variable condition;bool stop;};
線程池的聲明,構造函數(shù),一個enqueue模板函數(shù) 返回std::future<type>, 然后這個type又利用了運行時檢測(還是編譯時檢測?)推斷出來的,非常的amazing啊。成功的使用一行代碼反復套娃,這高階的用法就是大佬的水平嗎,i了i了。
workers 是vector<std::thread> 俗稱工作線程。
std::queue<std::function<void()>> tasks 俗稱任務隊列。
那么問題來了,這個任務隊列的任務只能是void() 類型的嗎?感覺沒那么簡單,還得接著看吶。
mutex,condition_variable 沒啥講的,stop 控制線程池停止的。
// the constructor just launches some amount of workersinline ThreadPool::ThreadPool(size_t threads): stop(false){for(size_t i = 0;i<threads;++i)workers.emplace_back([this]{for(;;){std::function<void()> task;{std::unique_lock<std::mutex> lock(this->queue_mutex);this->condition.wait(lock,[this]{ return this->stop || !this->tasks.empty(); });if(this->stop && this->tasks.empty())return;task = std::move(this->tasks.front());this->tasks.pop();}task();}});}
大佬寫的注釋就是這么樸實無華,說這個構造函數(shù)僅僅是把一定數(shù)量的線程塞進去,我是看了又看才悟出來這玩意是什么意思……雖然本質上的確是它說的只是把線程塞進去,但是這個線程也太繞了。
workers.emplace_back 參數(shù)是一個lambda表達式,不會阻塞,也就是說最外層的是一個異步函數(shù),每個線程里面的事情才是重點。
labmda表達式中最外層是一個死循環(huán),至于為什么是for(;;)而不是while(1) 這雖然不是重點,不過大佬的用法還是值得揣摩的,我估計是效率會更高?
task 申明后,緊跟著一個大括號,這個{}里面的部分,是一個同步操作,至于為什么用this->lock 而不是直接使用[&]來捕獲參數(shù),想來也是處于內存考慮。精打細算的風格像極了摳門的地主,i了i了。
緊接著一個wait(lock,condtion)的操作,像極了千層餅的套路。
第一層:這TM不是要鎖死自己啊?這樣不是構造都得卡死?
第二層:我們看到它emplace_back了一個線程,不會阻塞,但是等開鎖,鎖不就在它自己的線程里面嘛?那不得鎖死了啊?
第三層:我們看到這個lock其實只是個包裝,真正的鎖是外層的mutex,所以從這里是不存在死鎖的。但是你的wait的condition怎么可能不懂呢,必須要 stop 或者 !empty 才wait嗎?
第四層:我們查資料發(fā)現(xiàn)后面的condition是返回false才會wait,也就是說要!stop && empty才會wait,就是說這個線程池是 運行態(tài),并且沒有任務才才會執(zhí)行等待操作!否則就不等了,直接沖!
第五層:既然你判斷了上面判斷了stop和非空,為啥下面還要判斷stop和空才退出呢?不顯得冗余?
第六層:要確定它的確是被置為stop了,且隊列執(zhí)行空了,它才能夠光榮退休。有沒有問題呢,有,最后所有線程都阻塞了,你stop置為true它們也不知道啊……
我估計它的stop會有喚醒所有線程的操作,不過如果有的在執(zhí)行,有的在等待,應該沒辦法都通知到位,但是在執(zhí)行的在下一次判斷的時候也能正常退出。
因為有了疑惑,我們就想看stop相關的操作,結果發(fā)現(xiàn)放在了析構函數(shù)里面……
// the destructor joins all threadsinline ThreadPool::~ThreadPool(){{std::unique_lock<std::mutex> lock(queue_mutex);stop = true;}condition.notify_all();for(std::thread &worker: workers)worker.join();}
{}里面上鎖進行了stop為true的操作,至于為什么不用原子操作,我也不知道,但是仔細想了下大概是因為本來就有一把鎖了,再用原子就不是內味兒了。然后它果然通知了所有,并且還把工作線程join了。也就是等它們結束。
結束了千層餅の解析之后,我們看看最重要的入隊操作
// add new work item to the pooltemplate<class F, class... Args>auto ThreadPool::enqueue(F&& f, Args&&... args)-> std::future<typename std::result_of<F(Args...)>::type>{using return_type = typename std::result_of<F(Args...)>::type;auto task = std::make_shared< std::packaged_task<return_type()> >(std::bind(std::forward<F>(f), std::forward<Args>(args)...));std::future<return_type> res = task->get_future();{std::unique_lock<std::mutex> lock(queue_mutex);// don't allow enqueueing after stopping the poolif(stop)throw std::runtime_error("enqueue on stopped ThreadPool");tasks.emplace([task](){ (*task)(); });}condition.notify_one();return res;}
typename std::result_of<F(Args...)>::type中的typename 應該是為消除歧義的,或者因為嵌套依賴名字的關系,做為一個堅決不寫模板的普通程序員,這段代碼太難了……-> type 我倒是知道怎么回事,就是指明它的返回類型的一種方式result_of<F(Args...)> 應該是指明了F是一個函數(shù),簽名為Args...這個變參,Args是啥它不關系,它關心的是返回值的參數(shù)類型 所以有個type。
至于為什么函數(shù)入口是一個右值引用那就超出我的理解范圍了。難道說functional 必須要右值引用?那它的銷毀誰來管呢?這個線程來管嗎?這些坑我以后慢慢填。
前面我們說了tasks 只能接收void() 的函數(shù)類型,這里使用std::packaged_task<return_type()>完成對函數(shù)類型的推導,至于為什么不用 function<return_type()> ,因為這還不是最終放入tasks的對象,它要承接一個返回future<T>的工作,而package_task就是來打包返回future<T>的……
然后就是加鎖入隊+通知工作線程+返回future<T>的操作。本來是線程池最難理解的部分,反而顯得平淡無奇了,因為前面那些花里胡哨的操作已經很好的打通了我們的理解能力。
