-
大小: 3KB文件類型: .py金幣: 2下載: 1 次發(fā)布日期: 2021-01-06
- 語言: Python
- 標簽: python??pdf轉(zhuǎn)word??
資源簡介
python實現(xiàn)pdf轉(zhuǎn)word,支持中英文轉(zhuǎn)換,轉(zhuǎn)換精度高,可以達到使用效果。
代碼片段和文件信息
#!/usr/bin/python
#?-*-?coding:?utf-8?-*-
#?author:zhoulong_GISER
#?-*-?coding:?utf-8?-*-
#?blog:https://blog.csdn.net/qq_33356563
#?!/usr/bin/python
#?-*-?coding:?utf-8?-*-
import?sys
import?importlib
importlib.reload(sys)
from?pdfminer.pdfparser?import?PDFParser?PDFDocument
from?pdfminer.pdfinterp?import?PDFResourceManager?PDFPageInterpreter
from?pdfminer.converter?import?PDFPageAggregator
from?pdfminer.layout?import?*
from?pdfminer.pdfinterp?import?PDFTextExtractionNotAllowed
‘‘‘
解析pdf文件,獲取文件中包含的各種對象
‘‘‘
#?解析pdf文件函數(shù)
def?parse(pdf_path):
????fp?=?open(pdf_path?‘rb‘)??#?以二進制讀模式打開
????#?用文件對象來創(chuàng)建一個pdf文檔分析器
????parser?=?PDFParser(fp)
????#?創(chuàng)建一個PDF文檔
????doc?=?PDFDocument()
????#?連接分析器?與文檔對象
????parser.set_document(doc)
????doc.set_parser(parser)
?
評論
共有 條評論