// Popular Articles

#liteparse
#4672025-10-16

LiteParse: PDF parser của LlamaIndex đánh bại ML layout bằng một lưới monospace

LlamaIndex vừa open-source LiteParse — PDF parser chạy local, không GPU, không Python, ~100ms/page. Bí mật không phải model AI, mà là thuật toán 'grid projection' chiếu text lên lưới ký tự monospace để LLM đọc cột như đọc ASCII table.

liteparsellamaindexpdf-parsing
8 phút đọc
LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM
#4352025-09-30

LiteParse: parser PDF mã nguồn mở của LlamaIndex chạy local, không cần LLM

LlamaIndex vừa open-source LiteParse — CLI Node.js parse PDF, Office, ảnh ngay trên máy bằng thuật toán grid projection thuần heuristic. Không VLM, không API key, không GPU. Chạy mili-giây mỗi trang nhưng vẫn giữ được layout đa cột và bảng nguyên vẹn cho LLM đọc.

liteparsellamaindexpdf-parsing
8 phút đọc
LlamaIndex đổi mệnh: tất tay vào Document OCR cho AI Agents
#2602025-07-04

LlamaIndex đổi mệnh: tất tay vào Document OCR cho AI Agents

LlamaIndex vừa tung website mới với tuyên bố gọn một câu: sứ mệnh cốt lõi là dùng AI giải bài toán Document OCR. LlamaParse, LiteParse, ParseBench đều gom về một hướng — biến tài liệu phức tạp thành ngữ cảnh mà agent thực sự đọc được.

llamaindexllamaparseliteparse
7 phút đọc
LiteParse có landing page riêng: Vũ khí OSS của LlamaIndex cho AI agent đọc tài liệu
#762025-04-03

LiteParse có landing page riêng: Vũ khí OSS của LlamaIndex cho AI agent đọc tài liệu

LlamaIndex vừa nâng LiteParse — bộ parse tài liệu model-free, chạy local, hỗ trợ 50+ định dạng — lên hạng landing page riêng. Đây là trụ cột OSS cho sứ mệnh xây nền tảng xử lý tài liệu tốt nhất cho AI agent.

liteparsellamaindexopen-source
6 phút đọc