目录
一、问题
二、代码
三、步骤总结
虽然excel里分列很简单但是要批量操作的话还是有点烦的。
在CSDN上找到很多使用pandas的分列教程,但是我想要达成的效果是:
原始数据共三列,第一列是我希望分列的,后面两列不想分,如何一起输出?
注:数据仅为示例并非真实数据
该表为各街道建设用地批而未供数据控规类型,希望得到的格式是:
第一列--街道
第二列--年份
第三列--类型
第四列--数量
第五列--面积
这里我使用了easygui进行原数据输入
# 输入原始数据 msg = '输入' title = '选择输入的excel文件' filename = '*' filetypes = ["*.xls"] fileinpath = easygui.fileopenbox(msg, title, filename, filetypes) df = pd.read_excel(fileinpath) # 分列 df = pd.DataFrame((x.split('_') for x in df['tj']), columns=['Jiedao', 'Data', 'Feature']) # 读取原始表格后面的2列 cols = [1, 2] df2 = pd.read_excel(fileinpath, usecols=cols) df2.head() df2 = pd.DataFrame(df2, columns=['Cnt_tj', 'Sum_AREA']) # 合并,这里result是分列后得到的五列数据 result = pd.concat([df, df2], axis=1)
concat可以对两个数据框合并,axis参数是合并的方向。我这里相当于是两个数据框左右合并,就是1.如果是两部分希望上下合并的话参数设置为0.
输出excel
# 写出分列后的表格 msg = '分列后表格输出' title = '' filename = '*.xls' filetypes = ["*.xls"] fileoutpath1 = easygui.filesavebox(msg, title, filename, filetypes) result.to_excel(fileoutpath1, index=False)
实现功能其实很简单,分为以下几步:
1、pandas读取原始数据,将需要分列的那一列在Dataframe里用split分列
2、读取原数据无需分列的部分
3、concat函数合并
4、pandas输出 to_excel