// Popular Articles

#document-parsing
ParseBench: Benchmark Đầu Tiên Đo Khả Năng Hiểu Chart Của VLM Trong Enterprise Documents
#3862025-09-06

ParseBench: Benchmark Đầu Tiên Đo Khả Năng Hiểu Chart Của VLM Trong Enterprise Documents

LlamaIndex công bố ParseBench — benchmark đầu tiên đánh giá khả năng parse tài liệu (bao gồm chart) của AI agent trên ~2.000 trang enterprise document với 167.000+ test rule. LlamaParse Agentic dẫn đầu 84.9% trong khi hầu hết specialized parser chết dưới 6% ở hạng mục chart.

parsebenchllamaindexdocument-parsing
8 phút đọc
dots.ocr: A 1.7B Vision-Language Model That Beats GPT-4o at Document Parsing
#2572025-07-03

dots.ocr: A 1.7B Vision-Language Model That Beats GPT-4o at Document Parsing

rednote-hilab's dots.ocr packs SOTA OmniDocBench performance into a 1.7B-parameter VLM, outperforming Qwen2-VL-72B and GPT-4o on key OCR benchmarks while running on a single GPU.

dots-ocrvision-language-modeldocument-parsing
7 phút đọc
LiteParse có landing page riêng: Vũ khí OSS của LlamaIndex cho AI agent đọc tài liệu
#762025-04-03

LiteParse có landing page riêng: Vũ khí OSS của LlamaIndex cho AI agent đọc tài liệu

LlamaIndex vừa nâng LiteParse — bộ parse tài liệu model-free, chạy local, hỗ trợ 50+ định dạng — lên hạng landing page riêng. Đây là trụ cột OSS cho sứ mệnh xây nền tảng xử lý tài liệu tốt nhất cho AI agent.

liteparsellamaindexopen-source
6 phút đọc