← Tất cả bài viết

Tag: #ocr

3 bài viết

Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí
#2582026-04-11

Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí

VSE (Video Subtitle Extractor) trích xuất hardcoded subtitle từ video sang file SRT chỉ bằng OCR local - không cần API. Hỗ trợ 87 ngôn ngữ, 4 chế độ tăng tốc phần cứng (CUDA, DirectML, ONNX, CPU). Phiên bản 2.2.0 có 8.800+ GitHub stars, Apache-2.0, hoàn toàn miễn phí không giới hạn.

video-toolsocrsubtitle
6 phút đọc
AI Screenshot Translator: Dịch PDF Scan và Công Thức LaTeX Chỉ Bằng Một Phím Tắt
#2302026-04-03

AI Screenshot Translator: Dịch PDF Scan và Công Thức LaTeX Chỉ Bằng Một Phím Tắt

AI-Screenshot-Translator (GPL-3.0) dịch text trong ảnh chụp màn hình bằng AI, hỗ trợ OpenAI, Gemini và Claude. Điểm nổi bật là render LaTeX chuẩn xác qua KaTeX - thứ hầu hết công cụ OCR truyền thống thất bại hoàn toàn. v1.0.5-beta phát hành 2/4/2026, đạt 174 sao GitHub trong 10 tuần. Miễn phí GPL-3.0, cần API key riêng để dùng AI.

ai-screenshot-translatorocropen-source
5 phút đọc
OCRmyPDF: CLI open-source biến PDF scan thành tài liệu searchable mà không làm hỏng ảnh gốc
#0482025-03-23

OCRmyPDF: CLI open-source biến PDF scan thành tài liệu searchable mà không làm hỏng ảnh gốc

OCRmyPDF (v17.4.1, 33.3k sao GitHub) là công cụ dòng lệnh chuyên thêm lớp OCR ẩn vào PDF scan, xuất PDF/A chuẩn lưu trữ, giữ nguyên độ phân giải ảnh, và thường cho file nhỏ hơn bản gốc. Battle-tested trên hàng triệu PDF, hỗ trợ 100+ ngôn ngữ qua Tesseract, cắm thêm được EasyOCR / PaddleOCR / Apple Vision.

ocrmypdfocrpdf
7 phút đọc