// Popular Articles
LiteParse: PDF parser của LlamaIndex đánh bại ML layout bằng một lưới monospace
LlamaIndex vừa open-source LiteParse — PDF parser chạy local, không GPU, không Python, ~100ms/page. Bí mật không phải model AI, mà là thuật toán 'grid projection' chiếu text lên lưới ký tự monospace để LLM đọc cột như đọc ASCII table.
LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM
LlamaIndex vừa open-source LiteParse — CLI Node.js parse PDF, Office, ảnh ngay trên máy bằng thuật toán grid projection thuần heuristic. Không VLM, không API key, không GPU. Chạy mili-giây mỗi trang nhưng vẫn giữ được layout đa cột và bảng nguyên vẹn cho LLM đọc.
LlamaIndex đổi mệnh: tất tay vào Document OCR cho AI Agents
LlamaIndex vừa tung website mới với tuyên bố gọn một câu: sứ mệnh cốt lõi là dùng AI giải bài toán Document OCR. LlamaParse, LiteParse, ParseBench đều gom về một hướng — biến tài liệu phức tạp thành ngữ cảnh mà agent thực sự đọc được.
LiteParse có landing page riêng: Vũ khí OSS của LlamaIndex cho AI agent đọc tài liệu
LlamaIndex vừa nâng LiteParse — bộ parse tài liệu model-free, chạy local, hỗ trợ 50+ định dạng — lên hạng landing page riêng. Đây là trụ cột OSS cho sứ mệnh xây nền tảng xử lý tài liệu tốt nhất cho AI agent.