实际使用过程中:数据预处理(数据分析和建模方面)使用pandas模块;若要设置excel表格中的样式、追加数据则使用openpyxl模块
python自动化处理excel表格,主要有以下几个模块:
库名 | 安装 | 支持 | 功能 | 官网 |
xlwt | pip install xlwt | Excel:xls(2003版);.xls最多只能支持256列 | excel表格写入 | https://pypi.org/project/xlwt/ |
xlrd | pip install xlrd | Excel:xlsx(2007版)与xls(2003版) | excel表格读取 | https://pypi.org/project/xlrd/ |
xlsxwriter | pip install xlsxWriter | Excel:xlsx(2007+) | excel表格写入 | https://xlsxwriter.readthedocs.io/ |
openpyxl | pip install openpyxl | Excel:xlsx(2010) | excel表格读写 | https://pypi.org/project/openpyxl/ |
pandas | pip insatll pandas | excel、txt、csv、json、mysql | 数据分析和建模 | http://www.pypandas.cn/ |
Excel表格几个对象:
Python在数据处理和准备方面一直做得很好,但在数据分析和建模方面就没那么好了。Pandas帮助填补了这一空白,使您能够在Python中执行整个数据分析工作流程,而不必切换到更特定于领域的语言,如R
pandas中excel表格,可以指定对应的excel处理引擎,默认为xlsxwriter, 也可以指定openpyxl。其中xlsxwriter只能覆盖原始数据,而openpyxl是可以对数据进行增加的
import pandas as pd import numpy as np import os out_excel = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'source/out.xlsx') try: writer = pd.ExcelWriter(out_excel, engine='openpyxl') df.to_excel(writer, sheet_name='student', header=True, index=True, startrow=0, startcol=0) writer.save() except Exception as e: print(e) '''>>> df2 = df1.copy() >>> with pd.ExcelWriter('output.xlsx') as writer: # doctest: +SKIP ... df1.to_excel(writer, sheet_name='Sheet_name_1') ... df2.to_excel(writer, sheet_name='Sheet_name_2') To set the library that is used to write the Excel file, you can pass the `engine` keyword (the default engine is automatically chosen depending on the file extension): >>> df1.to_excel('output1.xlsx', engine='xlsxwriter') # doctest: +SKIP '''
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。