devlog by a solofounder

// Popular Articles

#5692025-12-06

Sakana Fugu ra mắt beta: hệ thống multi-agent tự điều phối frontier model, đạt SOTA trên GPQA-D và SWE-Pro

Sakana AI mở beta Fugu — nền tảng multi-agent orchestration đầu tiên của họ ở dạng thương mại. Fugu tự chọn và phối hợp GPT, Claude, Gemini cho từng task, expose qua API OpenAI-compatible, và đánh bại mọi model đơn lẻ trên GPQA-D (95.1), LCBv6 (93.2) và SWE-Pro (54.2).

sakana-aimulti-agentllm-orchestration

7 phút đọc

#5662025-12-05

Lovable test GPT-5.5 early access: -23% tool calls, +12.5% điểm benchmark khó nhất

Lovable vừa công bố kết quả eval nội bộ sau khi chạy GPT-5.5 trong early-access: 23.1% ít tool call hơn, 10% break-through roadblock tốt hơn, 12.5% cao điểm trên benchmark khó nhất — cùng cost. Đằng sau những con số này là một OpenAI đang đẩy ChatGPT/Codex từ chat-bot thành agent thật.

gpt-5-5openailovable

7 phút đọc

#5522025-11-28

GPT-5.5 ra mắt: OpenAI thông minh hơn mà không hề chậm hơn

OpenAI vừa công bố GPT-5.5 — mô hình được retrain từ đầu lần đầu kể từ GPT-4.5. Thông minh hơn GPT-5.4 trên 9/10 benchmark, dùng ít token hơn cho cùng một tác vụ Codex, nhưng vẫn giữ nguyên per-token latency. Đây là cú phản công B2B của OpenAI trước Claude.

gpt-5-5openaiagentic-ai

6 phút đọc

#5492025-11-26

GPT-5.5 ra mắt: OpenAI chuyển ChatGPT sang kỷ nguyên 'computer use' tự động

OpenAI công bố GPT-5.5 và GPT-5.5 Pro ngày 23/4/2026 — không chỉ trả lời, mà tự thao tác máy tính, chạy workflow dài nhiều bước, đạt 82.7% trên Terminal-Bench 2.0, vượt Claude Opus 4.7 và Gemini 3.1 Pro. Đây là bước đi rõ nhất về phía 'super app' mà Brockman và Altman theo đuổi.

gpt-5-5openaiagentic-ai

7 phút đọc

#5442025-11-24

Claude Memory Stores: bộ nhớ dài hạn cho agent, mount thẳng vào container

Anthropic vừa biến "memory" thành một resource cấp workspace: thư mục text file mount vào /mnt/memory của session container, có version bất biến, redact, và 8 store/session. Đây là thứ khiến agent thực sự nhớ được qua nhiều phiên.

claudemanaged-agentsai-agents

7 phút đọc

#5372025-11-20

GPT-5.5 vừa ra mắt: 58.6% SWE-Bench Pro, 82.7% Terminal-Bench, vượt Opus 4.5 và Gemini 3.1 Pro trên agentic coding

OpenAI tung GPT-5.5 chỉ 6 tuần sau GPT-5.4. Context 1M, giá $5/$30 per M tokens, tự chạy tool đến khi xong việc, và theo benchmark chính chủ thì đang đứng đầu cuộc đua agentic coding.

gpt-5-5openaiagentic-coding

6 phút đọc

#5362025-11-20

OpenClaw Managed Agents: bản open-source của Claude Managed Agents chạy bất kỳ model, self-hosted

Một tuần sau khi Anthropic ra Claude Managed Agents với giá 0.08 USD/session-hour, @stainlu drop ngay một bản mã nguồn mở MIT: per-session Docker sandbox, credential vault, restart-safe, chạy Claude/OpenAI/Gemini/Kimi/DeepSeek — self-host từ 4 USD/tháng trên Hetzner.

openclawmanaged-agentsopen-source

7 phút đọc

#5352025-11-19

OpenAI tung GPT-5.5 chỉ 6 tuần sau GPT-5.4: 84.9% GDPval, ngang ngửa con người

OpenAI vừa phát hành GPT-5.5 ngày 23/4/2026 — chỉ 6 tuần sau GPT-5.4. Điểm GDPval 84.9% vượt Claude Opus 4.7, giá API $5/$30 per 1M tokens, và tuyên bố 'biết bạn cần gì trước khi bạn hỏi'. Cuộc đua frontier models đang chạy nước rút.

gpt-5-5openaichatgpt

6 phút đọc

#5322025-11-18

OpenAI tung GPT-5.5 ra ChatGPT và Codex: "kỷ nguyên AI làm việc thật" đã bắt đầu

Ngày 23/4/2026, OpenAI chính thức phát hành GPT-5.5 và GPT-5.5 Pro — base model đầu tiên được huấn luyện lại hoàn toàn kể từ GPT-4.5. Codename "Spud", cửa sổ context 400K trong Codex, khả năng agentic vượt trội, nhắm thẳng vào thị trường B2B để đối đầu Claude.

openaigpt-5-5chatgpt

6 phút đọc

#5172025-11-10

OpenClaw 2026.4.22: xAI thành media provider đầy đủ, realtime STT mở ra Deepgram/ElevenLabs/Mistral

Release 23/4/2026: xAI lên first-class với image + TTS + STT, realtime transcription thêm 3 provider mới, /models add không restart gateway, Azure OpenAI image gen native, Claude Opus 4.7 trên Bedrock Mantle với 1M context. Plugin load nhanh hơn 82-90%.

openclawxaigrok

7 phút đọc