// Popular Articles
LiteParse: PDF parser của LlamaIndex đánh bại ML layout bằng một lưới monospace
LlamaIndex vừa open-source LiteParse — PDF parser chạy local, không GPU, không Python, ~100ms/page. Bí mật không phải model AI, mà là thuật toán 'grid projection' chiếu text lên lưới ký tự monospace để LLM đọc cột như đọc ASCII table.
LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM
LlamaIndex vừa open-source LiteParse — CLI Node.js parse PDF, Office, ảnh ngay trên máy bằng thuật toán grid projection thuần heuristic. Không VLM, không API key, không GPU. Chạy mili-giây mỗi trang nhưng vẫn giữ được layout đa cột và bảng nguyên vẹn cho LLM đọc.