Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí
VSE (Video Subtitle Extractor) trích xuất hardcoded subtitle từ video sang file SRT chỉ bằng OCR local - không cần API. Hỗ trợ 87 ngôn ngữ, 4 chế độ tăng tốc phần cứng (CUDA, DirectML, ONNX, CPU). Phiên bản 2.2.0 có 8.800+ GitHub stars, Apache-2.0, hoàn toàn miễn phí không giới hạn.
AI Screenshot Translator: Dịch PDF Scan và Công Thức LaTeX Chỉ Bằng Một Phím Tắt
AI-Screenshot-Translator (GPL-3.0) dịch text trong ảnh chụp màn hình bằng AI, hỗ trợ OpenAI, Gemini và Claude. Điểm nổi bật là render LaTeX chuẩn xác qua KaTeX - thứ hầu hết công cụ OCR truyền thống thất bại hoàn toàn. v1.0.5-beta phát hành 2/4/2026, đạt 174 sao GitHub trong 10 tuần. Miễn phí GPL-3.0, cần API key riêng để dùng AI.
OCRmyPDF: CLI open-source biến PDF scan thành tài liệu searchable mà không làm hỏng ảnh gốc
OCRmyPDF (v17.4.1, 33.3k sao GitHub) là công cụ dòng lệnh chuyên thêm lớp OCR ẩn vào PDF scan, xuất PDF/A chuẩn lưu trữ, giữ nguyên độ phân giải ảnh, và thường cho file nhỏ hơn bản gốc. Battle-tested trên hàng triệu PDF, hỗ trợ 100+ ngôn ngữ qua Tesseract, cắm thêm được EasyOCR / PaddleOCR / Apple Vision.