Python教程

今日份Python小应用:PyPDF2,Python合并多份pdf为一份文件

本文主要是介绍今日份Python小应用:PyPDF2,Python合并多份pdf为一份文件,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

文章目录

  • Python合并多份pdf文件为一份
    • PyPDF2库说明
    • PDF文件合并思路:
    • PyPDF2库安装
    • 示例代码

Python合并多份pdf文件为一份

PyPDF2库说明

PyPDF2官方文档
PyPDF2库可以很方便的处理 pdf 文件,提供读,割,合并,文件转换等多种pdf文件操作。

PDF文件合并思路:

  • step1:os.listdir方法(函数)获取指定路径目录下所有pdf文件名称
  • step2:.path.join方法拼接成绝对路径
  • step3:创建PdfFileMerger对象,这是专门用来合并pdf文件的对象
  • step4:append()将所有文件
  • step5:最后,使用write()方法(函数)将所有pdf文件写入到一个文件

PyPDF2库安装

pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

示例代码

import os
from PyPDF2 import PdfFileMerger

# 定义即将读取的指定PDF文件路径,注意文件的顺序,正斜杠/
target_path = 'C:/Users/zero/JupyterProject/data/tempPDF'

pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

# 合并pdf文件
file_merger = PdfFileMerger()
for pdf in pdf_lst:
    file_merger.append(pdf)     

# 合并pdf文件,并输出到指定路径
file_merger.write("D:/zero/Desktop/OutputMerge.pdf") 
这篇关于今日份Python小应用:PyPDF2,Python合并多份pdf为一份文件的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!