导入numpy、pandas包
import pandas as pd import numpy as np df=pd.read_csv('train-left-up.csv')
将data文件夹里面的所有数据都载入,观察数据的之间的关系
df1=pd.read_csv('train-left-up.csv') df2=pd.read_csv('train-left-down.csv') df3=pd.read_csv('train-right-up.csv') df4=pd.read_csv('train-right-down.csv')
df1.tail()
df2.head()
df3.tail()
df4.head()
由此可知:df2接在df1的下方,df3接在df1的右侧,df4接在df3的下方。
使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_up
result_up= pd.concat([df1,df3], axis=1) result_up
使用concat方法:将train-left-down和train-right-down横向合并为一张表,并保存这张表为result_down。然后将上边的result_up和result_down纵向合并为result
result_down= pd.concat([df2,df4], axis=1) result_down
result= pd.concat([result_up,result_down], axis=0,ignore_index=True) result
使用DataFrame自带的方法join方法和append:完成任务二和任务三的任务
result_up= df1.join(df3) result_up result_down= df2.join(df4) result_down result=result_up.append(result_down,ignore_index=True) result
使用Panads的merge方法和DataFrame的append方法:完成任务二和任务三的任务
result_up=pd.merge(df1,df3,left_index=True,right_index=True) result_up result_down=pd.merge(df2,df4,left_index=True,right_index=True) result_down result=result_up.append(result_down,ignore_index=True) result
merge、join以及concat的方法的不同以及相同
concat:可用于两个或多个df间行方向(增加行,下同)或列方向(增加列,下同)进行内联或外联拼接操作,默认行拼接,取并集.
merge:可用于两个df间行方向(一般用join代替)或列方向的拼接操作,默认列拼接,取交集(即:存在相同主键的df1和df2的列拼接)
join:可用于df间列方向的拼接操作,默认左列拼接,how=’left’
将我们的数据变为Series类型的数据
参考:
[1]https://blog.csdn.net/weixin_42782150/article/details/89546357