// Posts
Claude Code có hai điểm mù lớn. Đây là cách fix cả hai
#1242026-01-05

Claude Code có hai điểm mù lớn. Đây là cách fix cả hai

web_fetch của Claude Code không trả raw content - nó chạy qua Haiku và chỉ trả về summary với giới hạn 125 ký tự. Bright Data fix vấn đề web scraping. InsForge fix vấn đề backend integration. Cả hai tool đều open-source và có thể cài trong 1 lệnh.

claude-codebright-datainsforge
7 phút đọc
Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P3: Multi-Agent, Memory và 3 Bước Làm Ngay
#1232026-01-03

Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P3: Multi-Agent, Memory và 3 Bước Làm Ngay

Multi-Agent không phải càng phức tạp càng tốt: 3 trong 6 topology là đủ cho hầu hết use case (Single Agent, Peer-to-Peer, Supervisor). Memory có 3 tầng: Session (hết conversation là mất), State (hết task là xóa), Memory (persistent cross-session dùng vector DB). Level 2 single Agent với Reflection và Context Engineering đã đủ cho 80% bài toán thực tế - đừng vội lên Level 3.

ai-agentmulti-agentmemory
8 phút đọc
Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P2: Context Engineering và Reflection Pattern
#1222026-01-02

Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P2: Context Engineering và Reflection Pattern

Context Engineering không phải Prompt Engineering: thay vì nghĩ "hỏi như thế nào", bạn phải nghĩ "Agent thấy gì trước khi hỏi" - gồm 4 lớp: system prompt, external data, implicit data và feedback loop. Reflection Pattern dùng 2 Agent riêng biệt (Producer + Critic) với system prompt khác nhau - cùng một LLM tự review bản thân sẽ luôn nói "ổn rồi".

ai-agentcontext-engineeringreflection-pattern
7 phút đọc
Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P1: Bạn Đang Xây Agent hay Chatbot?
#1212026-01-01

Agentic Design Patterns: 21 Pattern để Xây AI Agent Thực Sự - P1: Bạn Đang Xây Agent hay Chatbot?

Antonio Gullí (Engineering Director, Google) hệ thống hóa 21 design patterns để xây AI Agent trong quyển sách 472 trang. Điểm đau nhất trong sách: hầu hết thứ mọi người gọi là "AI Agent" thực ra là Level 0 - LLM trần, không tool, không memory. Sách cover code examples trên 3 framework: LangChain/LangGraph, Crew AI, Google ADK.

ai-agentdesign-patternsllm
7 phút đọc
10 Công Cụ AI Open-Source Miễn Phí Thay Thế Hoàn Toàn Các Tool Trả Phí
Featured#1202026-01-01

10 Công Cụ AI Open-Source Miễn Phí Thay Thế Hoàn Toàn Các Tool Trả Phí

10 công cụ open-source miễn phí thay thế Midjourney, ChatGPT, Figma, Notion, Zapier, Calendly, Firebase và Cursor - tổng chi phí SaaS tương đương: $300-500/tháng. Fooocus chạy trên laptop cá nhân, chỉ 3 bước từ download đến tạo ảnh. OpenVoice của MIT clone giọng nói từ 10 giây audio, MIT license dùng thương mại miễn phí. n8n đạt định giá $2.3 tỷ USD tháng 8/2025, hơn 400 tích hợp, tự host = workflows không giới hạn.

open-sourceai-toolsdevtools
7 phút đọc
SLA vs SLO vs SLI: ba khái niệm dễ nhầm, và vì sao đặt bằng nhau là tự sát
#1192026-01-01

SLA vs SLO vs SLI: ba khái niệm dễ nhầm, và vì sao đặt bằng nhau là tự sát

SLI đo, SLO nhắm, SLA hứa. Đặt SLO = SLA nghĩa là giây phút bạn miss mục tiêu nội bộ cũng là giây phút hợp đồng khách hàng bị vi phạm. Đây là cách ba con số này khác nhau, cách tính error budget, và những cạm bẫy thường gặp.

sresla-slo-slireliability
7 phút đọc
"Constant GPU memory" trong LLM inference: bạn không làm bài toán biến mất, chỉ dời nó sang CPU
#1182025-12-30

"Constant GPU memory" trong LLM inference: bạn không làm bài toán biến mất, chỉ dời nó sang CPU

Các paper như RetroInfer và ScoutAttention quảng cáo inference long-context với "constant GPU memory" nhờ offload KV cache sang CPU DRAM và kéo lại qua PCIe mỗi decode step. Đẹp trên slide — nhưng có điều kiện nhỏ: bạn cần 36+ CPU cores chạy ANN search liên tục. Apple Silicon và RTX 4090 không có cửa.

llm-inferencekv-cachegpu-memory
6 phút đọc
Dagster: Vì sao orchestrator "asset-centric" đang định nghĩa lại data pipeline 2026
#1172025-12-25

Dagster: Vì sao orchestrator "asset-centric" đang định nghĩa lại data pipeline 2026

Dagster — open-source orchestrator (Apache-2.0, 15.4k sao GitHub) — không quản task như Airflow, mà quản trực tiếp các "data asset": bảng, model ML, report. Kết quả: lineage tự động, smart caching, và những con số như HIVED đạt 99.9% reliability suốt 3 năm zero incident.

dagsterdata-orchestrationdata-pipeline
7 phút đọc
Microsoft đã mở mã toàn bộ toolkit Sentinel — và hầu hết team Azure không biết
#1162025-12-23

Microsoft đã mở mã toàn bộ toolkit Sentinel — và hầu hết team Azure không biết

Repo Azure/Azure-Sentinel trên GitHub chứa 1000+ rule threat detection, hunting query, playbook tự động, workbook dashboard và connector cho hàng trăm nguồn dữ liệu. License MIT. Miễn phí. Đã public từ 2019 — nhưng nhiều team vẫn đang tự viết KQL từ zero.

microsoft-sentinelazurethreat-detection
7 phút đọc
DevOps vs MLOps vs LLMOps: 3 ops, 3 bài toán khác nhau — đừng lấy playbook DevOps áp vào app LLM
#1142025-12-21

DevOps vs MLOps vs LLMOps: 3 ops, 3 bài toán khác nhau — đừng lấy playbook DevOps áp vào app LLM

DevOps kiểm tra code chạy hay không. MLOps canh data drift và model decay. LLMOps thì phải soi hallucination, token cost, bias và human feedback — và evaluation loop feedback ngược cả 3 đường prompt/RAG/fine-tune cùng lúc. Không còn là linear pipeline nữa.

llmopsmlopsdevops
7 phút đọc