資源簡介
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
from?pdfminer.pdfparser?import?PDFParser
from?pdfminer.pdfdocument?import?PDFDocument
from?pdfminer.pdfpage?import?PDFPage
from?pdfminer.pdfpage?import?PDFTextExtractionNotAllowed
from?pdfminer.pdfinterp?import?PDFResourceManager
from?pdfminer.pdfinterp?import?PDFPageInterpreter
from?pdfminer.pdfdevice?import?PDFDevice
from?pdfminer.layout?import?*
from?pdfminer.converter?import?PDFPageAggregator
import?os
#?os.chdir(r‘F:\test‘)
fp=open(r‘笨方法學Python.PDF‘‘rb‘)
#來創建一個pdf文檔分析器
parser?=?PDFParser(fp)
#創建一個PDF文檔對象存儲文檔結構
document?=?PDFDocument(parser)
#?檢查文件是否允許文本提取
if?not?document.is_extractable:
????raise?PDFTextExtractionNotAllowed
else:
????#?創建一個PDF資源管理器對象來存儲共賞資源
????rsrcmgr=PDFResourceManager()
????#?設定參數進行分析
????laparams=LAParams()
????#?創
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件?????1017966??2019-12-02?17:51??笨方法學Python.PDF
?????文件????????1705??2019-12-03?09:24??pdf2txt.py
評論
共有 條評論