1.能够处理pdf文档;
2.能够解压zip、rar形式的压缩文件;
3.补充了一些需要用到的方法;
4.docx文档中的元素部分按序识别;
5.尝试混淆工具修改指定内容。
体现在方法集合pick_method中,以下为更新的方法:
get_file_name
get_pdf_text
get_pdf_picture
get_tail
get_compressed_files
get_path
get_picture_text
get_text_picture_not_table
get_all_in_docx
网络查重