在使用 CSV 文件进行数据分析时,我们可能需要处理大型数据集。在这些情况下,我们必须将所有数据合并到一个 CSV 文件中。按照下面给出的示例,我们将学习如何使用 Python 连接 CSV 文件。
如果您的计算机上还没有最新版本的 Python,请下载并安装它。
下载链接: https://www.python.org/downloads/
安装成功后,我们必须安装pandas包。
安装熊猫
打开终端并使用以下命令安装 pandas。
点安装熊猫
现在让我们假设您有一个包含各种标题的 CSV 文件。然后必须合并标题名称。
例子
第一个 CSV
第二个 CSV
第三个 CSV
例如,您需要提取下面列出的标头值。
CompanyType、companySize、域、成立、tagLine、网站
导入所有需要的包。
从 csv 导入 DictReader 导入全局 进口我们 将熊猫导入为 pd
获取 CSV 文件夹路径。
路径 = os.getcwd() csv_files = glob.glob(os.path.join(path, "*.csv"))
定义输出 CSV 标头。
modifiedHeaders = ['CompanyType', 'companySize', 'domain', 'founded', 'tagLine,website']
从指定文件夹读取 CSV 文件并将它们写入单个文件。
完整的脚本
带有所选标头的 formatted.csv 文件将包含最终输出。
我希望它对您有很大帮助,并为您节省大量时间。请关注我的页面并对我的帖子发表评论。
谢谢 !!
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明
本文链接:https://www.qanswer.top/7568/13300108