// Popular Articles

#pdf-parsing
#4672025-10-16

LiteParse: PDF parser của LlamaIndex đánh bại ML layout bằng một lưới monospace

LlamaIndex vừa open-source LiteParse — PDF parser chạy local, không GPU, không Python, ~100ms/page. Bí mật không phải model AI, mà là thuật toán 'grid projection' chiếu text lên lưới ký tự monospace để LLM đọc cột như đọc ASCII table.

liteparsellamaindexpdf-parsing
8 phút đọc
LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM
#4352025-09-30

LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM

LlamaIndex vừa open-source LiteParse — CLI Node.js parse PDF, Office, ảnh ngay trên máy bằng thuật toán grid projection thuần heuristic. Không VLM, không API key, không GPU. Chạy mili-giây mỗi trang nhưng vẫn giữ được layout đa cột và bảng nguyên vẹn cho LLM đọc.

liteparsellamaindexpdf-parsing
8 phút đọc