Python 识别图片形式pdf的尝试（未解决）

52 阅读 0 评论 0 点赞

想识别出pdf页面右下角某处的编号。pdf是图片形式页面。查了下方法，有源码是先将页面提取成jpg，再用pytesseract提取图片文件中的内容。

直接用图片来识别。纯数字的图片，如条形码，可识别。带中文的不可以，很乱。

识别为：

如何形成wps图片中的文字识别效果呢？

import pytesseract
from PIL import Image

def extract_text_from_image(image_path):
    image = Image.open(image_path)
    text = pytesseract.image_to_string(image)
    return text

image_path = r"D:\11.png"
text = extract_text_from_image(image_path)
print(f"图片内容:\n{text}\n")

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

转载请注明出处：免费源码网-免费的源码资源网站 » Python 识别图片形式pdf的尝试（未解决）

点赞(0) 打赏

本文分类：文章资讯
本文标签：Python 识别图片形式pdf的尝试（未解决）
浏览次数：52 次浏览
本文链接：https://freeymw.com/article/10834.html

上一篇 > 【ArcGIS微课1000例】0118：一文讲清楚tif（geotiff）栅格数据格式
下一篇 > Flink 基于 TDMQ Apache Pulsar 的离线场景使用实践

Python 识别图片形式pdf的尝试（未解决）

评论列表共有 0 条评论

发表评论取消回复

Python 识别图片形式pdf的尝试（未解决）

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复