91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡介

首先安裝這個 pip install pdfminer3k

然后將 附件中 1-297.pdf文件 放到 D:/test 目錄下

然后在 python 3.6 環境下 運行 ParserPdf.py文件,即可看到如下效果

資源截圖

代碼片段和文件信息

#!/usr/bin/env?python
#?encoding:?utf-8

“““
@author:?guoliang
@software:?PyCharm
@file:?prase_pdf.py
@time:?2018/1/25
“““
import?sys
import?importlib
importlib.reload(sys)

from?pdfminer.pdfparser?import?PDFParserPDFDocument
from?pdfminer.pdfinterp?import?PDFResourceManager?PDFPageInterpreter
from?pdfminer.converter?import?PDFPageAggregator
from?pdfminer.layout?import?LTTextBoxHorizontalLAParams
from?pdfminer.pdfinterp?import?PDFTextExtractionNotAllowed

‘‘‘
?解析pdf?文本,保存到txt文件中
‘‘‘
path?=?r‘D:\test\1-297.pdf‘

def?parse():
????contentText?=?““
????fp?=?open(path?‘rb‘)?#?以二進制讀模式打開
????#用文件對象來創建一個pdf文檔分析器
????praser?=?PDFParser(fp)
????#?創建一個PDF文檔
????doc?=?PDFDocument()
????#?連接分析器?與文檔對象
????praser.set_document(doc)
????doc.set_parser(praser)

????#?提

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????目錄???????????0??2018-03-23?11:28??pdf_parser\
?????文件?????8357064??2018-01-22?16:57??pdf_parser\1-297.pdf
?????文件????????4547??2018-03-23?11:27??pdf_parser\ParserPdf.py

評論

共有 條評論