本篇文章給大家分享的是有關怎么在Python中利用OCR對PDF圖片進行識別,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

使用圖片識別可以快速提取圖片中的信息,方便高效。
Python并不能直接對PDF進行識別,所以如果是識別PDF的話,需要先將PDF轉化為圖片,然后再進行識別。
Python
可以安裝3.7及以上版本
tesseract-ocr
下載地址: https://github.com/UB-Mannheim/tesseract/wiki 使用新版本即可
需要用到的庫
pip install pillow pip install opencv-python pip install fitz pip install PyMuPDF pip install pytesseract
from PIL import Image import os import pytesseract import cv2 as cv import fitz def pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設置縮放和旋轉系數 trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+".png") #pm.writePNG(imgPath) pdf.close() pdf_path ='D:/123.pdf' img_path ='D:/123.png' pdf_image(pdf_path,img_path,5,5,0) # 依賴opencv img=cv.imread(img_path) text=pytesseract.image_to_string(Image.fromarray(img),lang='chi_tra') # 不依賴opencv寫法 # text=pytesseract.image_to_string(Image.open(img_path)) print(text)
以上就是怎么在Python中利用OCR對PDF圖片進行識別,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注創新互聯行業資訊頻道。
分享標題:怎么在Python中利用OCR對PDF圖片進行識別-創新互聯
URL鏈接:http://www.js-pz168.com/article2/gdgic.html
成都網站建設公司_創新互聯,為您提供網站內鏈、手機網站建設、域名注冊、網站改版、網站制作、自適應網站
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯