union是一种特殊的struct,它的所有成员被分配在同一块内存区域中,因此,联合实际占用的空间就是它最大的成员所占的空间。自然,在某个时刻,一个union中只能保存一个成员的值。例如,一个符号表表项结构保存一个名字和一个值,值可以是一个Node*或一个int:
enum Type {ptr, num}; //一个Type可以保存值ptr和num struct Entry{ string name; //string是一个标准库类型 Type t; Node* p; //如果t==str,则使用p int i; //如果t==num,则使用i }; void f(Entry* pe){ if(pe->t == num) cout<<pe->i; //... }
因为p和i永远不会同时使用,所以浪费了内存空间。通过将两者定义为一个union的成员,可以很容易解决该问题,如下所示:
union Value{ Node* p; int i; };
C++不会记录一个union保存了哪种值,因此程序员必须自己做这个工作:
struct Entry{ string name; Type t; Value v; }; void f(Entry* pe){ if(pe->t == num) cout<<pe->v.i; //... }
维护类型域(type field,在本例中是t)与union中所存类型的对应关系很容易出错。为了避免错误,我们可以强制这种对应关系——将联合和类型域封装在一个类中、只允许通过能正确使用联合的成员函数来访问它们。在应用层面上,依赖这种标记联合(tagged union)的抽象很常见也很有用。我们应尽量少地使用“裸”union。
在大多数情况下,我们可以使用标准库类型variant来避免直接使用union。一个variant保存一组可选类型中一个类型的值。例如,一个variant<Node*, int>可以保存一个Node*或一个int。
使用variant,Entry的例子可改写为:
struct Entry{ string name; variant<Node*,int> v; }; void f(Entry* pe){ if(holds_alternative<int>(pe->v )) //*pe保存一个int吗? cout<<get<int>(pe->v); //获取一个int //... }
对于很多应用,使用variant都比使用union更简单、更安全。