pd.concat()函数可以沿着指定的轴将多个dataframe或者series拼接到一起。
基本语法:
pd.concat( objs, axis=0, join=‘outer’, join_axes=None,ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True,)
objs 表示需要连接的对象,比如:[df1, df2],需要将合并的数据用综括号包围;
axis=0 表拼接方式是上下堆叠,当axis=1表示左右拼接;
join 参数控制的是外连接还是内连接,join='outer’表示外连接,保留两个表中的所有信息;join="inner"表示内连接,拼接结果只保留两个表共有的信息;
join_axes参数是在内连接时选择要完整保留哪个表的索引,但是这个参数在官方文档中提醒即将被弃用,所以不做详细讲解,只看一下join参数的表现吧;
import pandas as pd d1 = [["xiaolei",20,10081],["xiaowu",30,10082]] t1 = pd.DataFrame(d1) print(t1) print('*'*50) d2 = [["xiaowang",22,10083],["xiaoming",25,10084]] t2 = pd.DataFrame(d2) print(t2) print('*'*25+'合并结果如下(默认是上下堆叠)'+'*'*25) t = pd.concat([t1,t2]) print(t)
运行结果:
0 1 2 0 xiaolei 20 10081 1 xiaowu 30 10082 ************************************************** 0 1 2 0 xiaowang 22 10083 1 xiaoming 25 10084 ********************合并结果如下(默认是上下堆叠)******************** 0 1 2 0 xiaolei 20 10081 1 xiaowu 30 10082 0 xiaowang 22 10083 1 xiaoming 25 10084