Python（模块+PDF）

16 阅读 0 评论 0 点赞

import pdfplumber
with pdfplumber.open('四级听力词汇.pdf') as pdf:
    for i in pdf.pages:
        print(i.extract_text()) #用extract_text()提取内容
        print(f'------第{i.page_number}页结束')

在使用这段代码之前要先在终端下载pdfplumber 模块，如果直接使用pip install pdfplumber下载会非常慢。可以在浏览器里搜索清华镜像源地址，找到pypi，复制你要下载的到你的终端先下载，这样后面下载模块的时候会非常快。

也可以直接复制粘贴一下到你的终端：

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

在文件夹里的PDF不能直接被pycharm搜索到，可以将文件夹里的，复制粘贴到pycharm以上代码相同文件夹下。或者直接给出PDF在文件夹里的位置。

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

转载请注明出处：免费源码网-免费的源码资源网站 » Python（模块+PDF）

点赞(0) 打赏

本文分类：文章资讯
本文标签：Python（模块+PDF）
浏览次数：16 次浏览
本文链接：https://freeymw.com/article/20674.html

上一篇 > PDF密码移除技巧：五大 PDF 密码移除器
下一篇 > 从根儿上学习spring 四之run方法启动第一段

评论列表共有 0 条评论

暂无评论

Python（模块+PDF）

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复