数据连接是任何数据分析的常见要求。可能需要在单个源中连接来自不同表的数据,或者从多个源连接数据。
Tableau提供了使用“Data”菜单中提供的数据窗格来连接表的功能。
连接意味着组合关系数据库中一个或多个表的列。它还创建一个可以保存为表的集合,或者可以按原样使用它。
连接指定有五种类型:
连接部分用于组合来自两个或多个表的行,基于它们之间的相关列。
1.交叉连接:交叉连接生成的行将第一个表中的每一行与第二个表中的每一行组合在一起。
2.内部联接:内部联接返回正在连接的表中的匹配行。
3.自然连接: 自然连接不使用任何比较运算符。它没有连接方式。
如果两个关系之间至少存在一个共同属性,则只能执行自然连接。此外,属性必须具有相同的名称和域。自然连接适用于那些匹配属性,其中两个关系中的属性值相同。
4.外连接:外连接是内连接的扩展形式。它返回正在连接的表的匹配行和非匹配行。
外连接的类型如下:
4.1.左外连接:左外连接返回正在连接的表中的匹配行,以及结果中左表的不匹配行,并将NULL值放在来自右表的属性中。
4.2.右外连接:右外连接操作返回正在连接的表中的匹配行,以及结果中右表中的不匹配行,并将NULL值放在来自左表的属性中。
4.3.全外联接:完整外部联接用于组合表。因此,它包含两个表中的所有值。当表中的值与另一个表不匹配时,它将在数据网格中返回NULL值。
5.1.自联接: 自联接用于将表连接到自身。这意味着表的每一行都与自身以及表的每一行组合在一起。
我们假设一个数据源Sample-superstore 来创建两个表(如Orders和Returns)之间的连接。
下面的屏幕截图显示了使用Order id
字段在Orders和Returns表之间建立内部连接。
Tableau会自动在两个表之间创建一种连接类型,但可以根据需要进行更改。
inner join
, left outer join
, right outer join
和 full outer join
。可以通过单击“数据源”选项来更改字段,以添加连接弹出窗口中可用的新连接子句。
选择字段时,可以使用搜索文本框搜索字段。