Linux有2种方法可以实现线程局部存储:
1)使用NTPL提供的函数;
2)使用编译器扩展的__thread关键字。
NPTL(Native POSIX Thread Library),顾名思义,本地POSIX线程库。
NPTL提供实现线程局部存储功能的接口:
#include <pthread.h> int pthread_key_create(pthread_key_t* key, void (*destructor)(void*)); int pthread_key_delete(pthread_key_t key); int pthread_setspecific(pthread_key_t key, const void* value); void* pthread_getspecific(pthread_key_t key);
pthread_key_create 为线程局部存储创建一个新键,并通过给key赋值,返回给用户。而参数key需要给进程中所有线程使用,因此key应指向一个全局变量。
参数destructor指向一个自定义函数,主要用于是否value指向的资源:
void destructor(void *value) { // 释放value指向的资源 }
pthread_key_delete 删除由pthread_key_create 创建的线程局部存储的数据。参数key由pthread_key_create 赋值。
pthread_setspecific和pthread_getspecific用于线程局部数据管理:
pthread_getspecific返回绑定到key绑定的value;
pthread_setspecific用于绑定value到key。
key由pthread_key_create 创建,不同的线程可以绑定不同的value到相同的key。
而value是一个指向动态分配的内存块,为调用线程独有。
NPTL实现下,一个进程中,由pthread_key_create 创建的key(对应一个槽位)最多1024个。pthread_key_create 调用成功时,会将一个<1024的值,填入第一个传入参数key指向的pthread_key_t变量中。
也就是说,记录槽位分配区块的数据结构pthread_keys是进程唯一的。槽位初始值为0。
一个1024个槽位:pthread_keys[0...1023]。
此时,各线程还没数据和该key相关联。接下来,需要用pthread_setspecific绑定key和线程关联的数据,用pthread_getspecific得到与key绑定的、跟线程关联的数据。
示例:
使用NPTL创建的线程局部存储,分别在多个线程中设置、访问,并写入文件。
#include <malloc.h> #include <pthread.h> #include <stdio.h> #include <stdlib.h> /* 为每个线程保存文件指针的TSD键值,根据键值可以找到线程各自的Data */ static pthread_key_t thread_log_key; void write_to_thread_log(const char* message) { FILE* thread_log = (FILE*) pthread_getspecific(thread_log_key); fprintf(thread_log, "%s\n", message); } void fn_close_thread_log(void* thread_log) { fclose((FILE*)thread_log); } void* thread_function(void* arg) { char thread_log_filename[128]; FILE* thread_log; snprintf(thread_log_filename, sizeof(thread_log_filename), "thread%ld.log", (unsigned long)pthread_self()); thread_log = fopen(thread_log_filename, "w"); /* 将文件指针保存在thread_log_key标识的TSD中 */ pthread_setspecific(thread_log_key, thread_log); write_to_thread_log("Thread starting."); return NULL; } int main() { int i; pthread_t threads[5]; pthread_key_create(&thread_log_key, fn_close_thread_log); for (i = 0; i < 5; ++i) { pthread_create(&(threads[i]), NULL, thread_function, NULL); } for (i = 0; i < 5; ++i) { pthread_join(threads[i], NULL); } return 0; }
运行结果:
在可执行目标文件所指目录中,生成多个线程对应的文件,每个文件名对应一个线程tid。
NTPL提供的函数太过繁琐,有人想到在编译器中添加通过添加关键字__thread,以增进新功能,隐式构造线程局部变量。
例如,下面的声明,表示val在当前进程的每个线程中,都会有该变量的一个拷贝,直到线程退出为止。
__thread int val = 0;
有几点需要注意:
将1)中使用NPTL实现线程局部存储的示例,用__thread改写:
#include <malloc.h> #include <pthread.h> #include <stdio.h> #include <stdlib.h> __thread FILE* thread_log = NULL; void write_to_thread_log(const char* message) { fprintf(thread_log, "%s\n", message); } void *thread_function(void* arg) { char thread_log_filename[128]; sprintf(thread_log_filename, "thread%ld.log", (unsigned long)pthread_self()); thread_log = fopen(thread_log_filename, "w"); write_to_thread_log("Thread starting."); fclose(thread_log); return NULL; } int main() { int i; pthread_t threads[5]; for (i = 0; i < 5; ++i) pthread_create(&(threads[i]), NULL, thread_function, NULL); for (i = 0; i < 5; ++i) pthread_join(threads[i], NULL); return 0; }
自定义一个class ThreadLocal,用RAII方式管理pthread_key,以简化线程局部存储的使用。
template <typename T> class ThreadLocal : noncopyable { public: ThreadLocal() { pthread_key_create(&pkey_, &ThreadLocal::destructor); } ~ThreadLocal() { pthread_key_delete(pkey_); } T& value() { T* perThreadValue = static_cast<T*>(pthread_getspecific(pkey_)); if (!perThreadValue) { T* newObj = new T(); pthread_setspecific(pkey_, newObj); perThreadValue = newObj; } return *perThreadValue; } private: static void destructor(void *x) { T* obj = static_cast<T*>(x); typedef char T_must_be_complete_type[sizeof(T) == 0 ? -1 : 1]; T_must_be_complete_type dummy; (void)dummy; delete obj; } pthread_key_t pkey_; };
使用ThreadLocal,为每个线程分配一个局部存储class Test,包装了名称字符串(name_)
#include "muduo/base/ThreadLocal.h" #include "muduo/base/CurrentThread.h" #include "muduo/base/Thread.h" #include <stdio.h> class Test : muduo::noncopyable { public: Test() { printf("tid=%d, constructing %p\n", muduo::CurrentThread::tid(), this); } ~Test() { printf("tid=%d, destructing %p %s\n", muduo::CurrentThread::tid(), this, name_.c_str()); } const muduo::string& name() const { return name_; } void setName(const muduo::string& n) { name_ = n; } private: muduo::string name_; }; muduo::ThreadLocal<Test> t_testObj1; muduo::ThreadLocal<Test> t_testObj2; void print() { printf("tid=%d, obj1 %p name=%s\n", muduo::CurrentThread::tid(), &t_testObj1.value(), t_testObj1.value().name().c_str()); printf("tid=%d, obj2 %p name=%s\n", muduo::CurrentThread::tid(), &t_testObj2.value(), t_testObj2.value().name().c_str()); } void threadFunc() { print(); t_testObj1.value().setName("changed 1"); t_testObj2.value().setName("changed 2"); print(); } int main() { t_testObj1.value().setName("main one"); print(); muduo::Thread t1(threadFunc); t1.start(); t1.join(); t_testObj2.value().setName("main two"); print(); return 0; }
运行结果:
ThreadLocal变量,虽然名称一样,在main线程和t1线程中,存储的空间和值是不一样的。
tid=104305, constructing 0x19d2c50 tid=104305, obj1 0x19d2c50 name=main one tid=104305, constructing 0x19d2c70 tid=104305, obj2 0x19d2c70 name= tid=104306, constructing 0x7f7c300008c0 tid=104306, obj1 0x7f7c300008c0 name= tid=104306, constructing 0x7f7c300008e0 tid=104306, obj2 0x7f7c300008e0 name= tid=104306, obj1 0x7f7c300008c0 name=changed 1 tid=104306, obj2 0x7f7c300008e0 name=changed 2 tid=104306, destructing 0x7f7c300008c0 changed 1 tid=104306, destructing 0x7f7c300008e0 changed 2 tid=104305, obj1 0x19d2c50 name=main one tid=104305, obj2 0x19d2c70 name=main two
[1]高峰, 李彬. Linux环境编程:从应用到内核[M]. 机械工业出版社, 2016.
[2]陈硕. Linux多线程服务端编程:使用muduo C++网络库[M]. 电子工业出版社, 2013.