// Popular Articles

#tesseract
#542025-03-23

OCRmyPDF: CLI open-source biến PDF scan thành tài liệu searchable mà không làm hỏng ảnh gốc

OCRmyPDF (v17.4.1, 33.3k sao GitHub) là công cụ dòng lệnh chuyên thêm lớp OCR ẩn vào PDF scan, xuất PDF/A chuẩn lưu trữ, giữ nguyên độ phân giải ảnh, và thường cho file nhỏ hơn bản gốc. Battle-tested trên hàng triệu PDF, hỗ trợ 100+ ngôn ngữ qua Tesseract, cắm thêm được EasyOCR / PaddleOCR / Apple Vision.

ocrmypdfocrpdf
7 phút đọc