← Tất cả bài viết

Tag: #ai-infrastructure

7 bài viết

Nghiên cứu: Harness phức tạp hơn không có nghĩa là AI agent tốt hơn
#7222026-05-26

Nghiên cứu: Harness phức tạp hơn không có nghĩa là AI agent tốt hơn

432 lần thử nghiệm cho thấy Gemini 2.5 Flash mất 29-38 điểm VTSR khi harness phức tạp hơn. Qwen3.5-122B đạt đỉnh 91.7% VTSR chính xác ở strict harness - ngược hoàn toàn kỳ vọng. Model 2B Gemma4:e2B ổn định 91.7% khắp mọi điều kiện - ngang với model mạnh hơn nhiều.

llm-agentharness-engineeringai-infrastructure
7 phút đọc
10 Lớp Kiến Trúc để Autonomous Agents Thực Sự Tự Hành - Không Chỉ Generate Output
#6862026-05-20

10 Lớp Kiến Trúc để Autonomous Agents Thực Sự Tự Hành - Không Chỉ Generate Output

Autonomous agents cần 3 mặt phẳng - 10 lớp để trở thành asset class thực sự: từ danh tính (ERC-8004 với 128,000 agents trên 24 chain) đến thanh toán (x402 xử lý 15 triệu giao dịch/tháng). Gartner dự báo 40%+ dự án agentic AI sẽ bị hủy trước 2028 vì thiếu governance. EU AI Act enforcement tháng 8/2026 - phạt tới €35M hoặc 7% doanh thu toàn cầu.

autonomous-agentsagentic-aierc-8004
9 phút đọc
PAI: Khi AI không còn là chatbot mà trở thành hệ điều hành cuộc sống của bạn
#5912026-05-12

PAI: Khi AI không còn là chatbot mà trở thành hệ điều hành cuộc sống của bạn

PAI (Personal AI Infrastructure) v5.0.0 đạt 12,400+ GitHub stars với 45 skills, 171 workflows và 37 hooks - không phải chatbot mà là Life Operating System xây trên Claude Code. Hệ thống nhớ mọi quyết định, tự tổng hợp briefing mỗi sáng và tiết kiệm 30-90 phút làm việc mỗi ngày. Miễn phí, MIT license, cài trong 1 lệnh.

personal-aiai-infrastructureclaude-code
7 phút đọc
HelixDB: Kết hợp Graph và Vector Database trong một nền tảng duy nhất cho AI apps
#5402026-05-07

HelixDB: Kết hợp Graph và Vector Database trong một nền tảng duy nhất cho AI apps

HelixDB là open-source graph-vector database viết bằng Rust, kết hợp semantic search và relationship traversal trong một DB thay vì hai. Benchmark trên AWS cho thấy nhanh hơn Neo4j 16x cho graph lookups và 5.9x cho traversal với dataset 4 triệu edges. YC W25 backed, 4,100+ GitHub stars, license AGPL-3.0, self-hosted miễn phí.

helixdbgraph-databasevector-database
6 phút đọc
OpenAI ra mắt MRC - Giao thức mạng mới cho siêu máy tính AI
#4742026-05-06

OpenAI ra mắt MRC - Giao thức mạng mới cho siêu máy tính AI

MRC (Multipath Reliable Connection) là giao thức mạng mới của OpenAI, giải quyết tắc nghẽn trong các cụm GPU cực lớn. Phun gói tin qua 128-256 đường dẫn đồng thời, đạt 96% băng thông lý thuyết (770 Gb/s) và phục hồi sự cố trong vài chục micro-giây. Đang chạy production tại Microsoft Fairwater và Oracle Abilene với 42.000+ GPU, đã train ChatGPT và Codex. Mở hoàn toàn qua Open Compute Project - không độc quyền.

openainetworkingmrc
7 phút đọc
The AI Paradox: Rising Investment, Lagging ROI
Featured#2432026-04-07

The AI Paradox: Rising Investment, Lagging ROI

Năm 2025, thế giới chi 1,76 nghìn tỷ USD cho AI - Gartner dự báo con số tăng thêm 47% lên 2,59 nghìn tỷ vào 2026. Nhưng nghiên cứu từ MIT chỉ ra 95% tổ chức có ROI bằng 0 dù đã đổ 30-40 tỷ USD vào Generative AI. Chỉ 6% thu hồi vốn trong dưới 1 năm, trong khi công nghệ thông thường hoàn vốn sau 7-12 tháng. Big Tech không thể dừng vì FOMO - 91% doanh nghiệp có kế hoạch tăng ngân sách AI tiếp đến tháng 8/2026.

airoibig-tech
7 phút đọc
Exa Deep Max: Agentic Search SOTA với Latency Nhanh Hơn 20 Lần
#0732025-06-27

Exa Deep Max: Agentic Search SOTA với Latency Nhanh Hơn 20 Lần

Exa vừa công bố Deep Max — endpoint agentic search kết hợp frontier LLM với hàng chục lời gọi Exa Search song song, đạt state-of-the-art trên HLE-Search, FRAMES, Deep Search QA, với độ trễ nhanh hơn đối thủ tới 92 lần.

exa-aiagentic-searchllm-tools
6 phút đọc