devlog by a solofounder

// Popular Articles

#642025-03-28

PicoClaw: AI Assistant đầy đủ chạy trên phần cứng $10, tốn chưa tới 10MB RAM

Sipeed vừa open-source PicoClaw — một AI assistant viết bằng Go, chạy single binary dưới 10MB RAM, boot <1 giây trên board RISC-V $9.9. 99% nhỏ hơn OpenClaw, 98% rẻ hơn Mac mini, và 95% code do AI tự viết.

picoclawsipeedrisc-v

6 phút đọc

#632025-03-28

Firecrawl mở mã nguồn web-agent: tự build agent nghiên cứu web có cấu trúc

Firecrawl vừa open-source web-agent — foundation nhẹ để fork và tự deploy AI agent nghiên cứu web. Chạy trên LangChain Deep Agents, tích hợp sẵn Search, Scrape, Interact, bash, kèm 3 template Next.js / Express / Library. License MIT, tự chọn model, tự host.

firecrawlweb-agentopen-source

7 phút đọc

#582025-03-25

Grok Voice, TTS & STT API: Rẻ nhất thị trường, đang viết lại luật chơi voice AI

xAI vừa hoàn tất bộ ba Voice Agent + TTS + STT API: $0.05/phút (Voice), $4.20/1M ký tự (TTS), $0.10/giờ (STT batch) — đồng thời dẫn đầu Big Bench Audio với 92.3% accuracy. Đây là cú đánh trực diện vào OpenAI Realtime, ElevenLabs và Deepgram.

grok-voicexaispeech-to-text

7 phút đọc

#542025-03-23

OCRmyPDF: CLI open-source biến PDF scan thành tài liệu searchable mà không làm hỏng ảnh gốc

OCRmyPDF (v17.4.1, 33.3k sao GitHub) là công cụ dòng lệnh chuyên thêm lớp OCR ẩn vào PDF scan, xuất PDF/A chuẩn lưu trữ, giữ nguyên độ phân giải ảnh, và thường cho file nhỏ hơn bản gốc. Battle-tested trên hàng triệu PDF, hỗ trợ 100+ ngôn ngữ qua Tesseract, cắm thêm được EasyOCR / PaddleOCR / Apple Vision.

ocrmypdfocrpdf

7 phút đọc

#522025-03-22

MOSS-TTS-Nano: Open TTS 100M params chạy local, 48kHz stereo, không cần GPU

OpenMOSS vừa thả model TTS 0.1B params Apache-2.0, streaming realtime trên CPU 4-core, 48kHz stereo, 20 ngôn ngữ. Bản ONNX mới chạy mượt trên 1 core MacBook Air M4. Đây là bước ngoặt cho on-device voice AI.

moss-tts-nanoopenmossopen-source-tts

7 phút đọc

#512025-03-22

Google mở mã Magika: model AI nhận diện file type 99% chính xác, 5ms trên CPU

Google vừa open-source Magika — model deep learning 1MB phát hiện 200+ loại file với F1 99%, nhanh 5ms/file chỉ trên CPU. Đang chạy scan hàng trăm tỷ file/tuần trên Gmail, Drive, Safe Browsing và VirusTotal. Version 1.0 vừa ra mắt với engine Rust mới.

magikagoogleopen-source

8 phút đọc

#502025-03-21

BigQuery nói chuyện được: AI.FORECAST và AI.DETECT_ANOMALIES giờ gọi bằng natural language

Google vừa đưa Conversational Analytics vào BigQuery (Preview) — chat tiếng Anh, agent tự sinh SQL, tự gọi AI.FORECAST và AI.DETECT_ANOMALIES với TimesFM. Không cần SQL, không cần chọn model, insight ra trong vài giây.

bigquerygoogle-cloudconversational-analytics

7 phút đọc

#432025-03-18

WTI rớt về $87, đang tiến sát 'benchmark Landman $78' của Billy Bob Thornton

Giá dầu WTI vừa giảm gần 8% trong tuần, thủng mốc $90 và hướng về $78 — đúng con số mà Tommy Norris trong series Landman gọi là 'perfect'. Goldman Sachs cũng vừa ra forecast 2026 trùng chính xác $78/thùng. Trùng hợp hay red line của cả ngành dầu?

wti-oillandmanoil-market

7 phút đọc

#402025-03-16

DeepSeek Mega MoE: viết lại cách Mixture-of-Experts chạy trên GPU

Ngày 16/04/2026, DeepSeek tung bản DeepGEMM mới gom toàn bộ forward path của MoE — dispatch, linear1, SwiGLU, linear2, combine — vào một mega-kernel duy nhất, chồng NVLink traffic lên Tensor Core MMAs. Không còn chuỗi compute–wait–transfer. GPU đỡ idle, scaling multi-GPU MoE sạch hơn hẳn.

deepseekdeepgemmmixture-of-experts

7 phút đọc

#392025-03-16

FrontierSWE: Benchmark 20 giờ mà AI coding agent vẫn không giải nổi

Proximal vừa ra FrontierSWE — 17 bài toán khó cỡ kỹ sư giỏi (tối ưu compiler, viết server PostgreSQL trên SQLite, train model dự đoán tính chất lượng tử của phân tử). Mỗi agent có 20 giờ. GPT-5.4 và Claude Opus 4.6 dẫn đầu nhưng vẫn hiếm khi hoàn thành task.

frontier-swecoding-agentsai-benchmark

7 phút đọc