Open Generative AI: Studio Tạo Ảnh & Video Miễn Phí Với 200+ Model, Không Filter
Open Generative AI đạt 15.5k GitHub stars, cung cấp 200+ model AI tạo ảnh và video hoàn toàn miễn phí, không content filter, MIT license. Runway Standard $12/tháng chỉ cho khoảng 62 giây Gen-4 video trước khi hết credits - Open Generative AI không giới hạn và không tốn phí subscription. Hỗ trợ 5 studio: Image, Video, Lip Sync, Cinema, Workflow - chạy được local inference trên Mac, Windows, Linux. Dữ liệu và ảnh tham chiếu ở hoàn toàn trên máy bạn, không gửi cloud.
OpenReel Video: Trình Chỉnh Sửa Video Mã Nguồn Mở Chạy Thẳng Trên Trình Duyệt, Không Cần Cài Đặt
OpenReel Video là trình chỉnh sửa video MIT license, chạy 100% trên trình duyệt, không upload file lên server. Hỗ trợ timeline đa track, xuất 4K @ 60fps miễn phí, không watermark, không tài khoản. Xây dựng trên WebCodecs + WebGPU, đạt 2.300+ GitHub stars chỉ sau vài tháng beta. Thay thế trực tiếp CapCut cho người dùng cần quyền riêng tư hoặc ở quốc gia bị hạn chế.
Paper2Video: AI tự động biến bài báo khoa học thành video presentation
PaperTalker - hệ thống multi-agent từ NUS - tự động tạo video presentation từ paper LaTeX với chi phí $0.001/video. Đạt PresentQuiz 84.2%, vượt human-made 10%. Mã nguồn mở MIT, chấp nhận tại NeurIPS 2025 Workshop. Yêu cầu GPU 48GB VRAM để self-host.
FFmpeg và VLC: Hai phần mềm open source đang vận hành mọi video trên internet
FFmpeg và VLC là backbone vô hình của mọi video bạn xem mỗi ngày - từ YouTube, Netflix đến tàu thám hiểm Perseverance trên Sao Hỏa. VLC đã đạt 6 tỷ lượt tải, dav1d (AV1 decoder) chứa 240.000 dòng handwritten Assembly với tốc độ nhanh hơn C đến 62 lần. Toàn bộ hạ tầng khổng lồ này được xây và duy trì bởi khoảng 15-20 tình nguyện viên, không lương.
VLMaxxing: Dạy Video VLM Bỏ Qua Những Gì Không Thay Đổi - Không Cần Training
VLMaxxing (arXiv 2605.03351) dạy video VLM tái sử dụng trạng thái visual thay vì xử lý lại mọi frame giống hệt nhau. Kỹ thuật training-free đạt 14.90-35.92x tăng tốc cho follow-up query trên Qwen2.5-VL-7B, không drift độ chính xác qua 93 câu hỏi. C-VISION pruning trên Gemma 4-E4B đạt 54 fps, giảm 42.2% thời gian xử lý vision tower. Mã nguồn mở tại github.com/jfbastien/VLMaxxing.
VectCutAPI: Mở Khóa CapCut Bằng Code - Công Cụ AI Agent Làm Video Hàng Loạt
VectCutAPI là open-source Python API kết nối thẳng vào CapCut/Jianying engine, cho phép AI agent tự động tạo video qua 35+ REST endpoint và 11 MCP tool. Là công cụ đáng chú ý nhất để build workflow video tự động với Coze, Dify, N8N, hoặc Claude Code. Apache-2.0, miễn phí hoàn toàn, chạy local.
Open Design - Alternative Open-Source cho Claude Design đạt 32k Stars trong 10 Ngày
Open Design đạt 31.9k stars GitHub chỉ trong 10 ngày sau khi ra mắt cuối tháng 4/2026. Chạy trên 16 coding agent CLI (Claude Code, Codex, Gemini...) với 31 Skills và 72 Design Systems sẵn dùng, local-first, miễn phí, Apache-2.0. Export được HTML, PDF, PPTX, MP4 - bao gồm HyperFrames video cinematics zero prompt engineering.
Hermes Video Agent: pipeline tự động "1 URL vào - 1 clip (đã sub) ra", vừa open-source MIT
Một dev solo vừa mở mã Hermes-video-agent: bỏ vào 1 URL YouTube/TikTok/Douyin, AI agent tự tải, transcribe bằng Whisper, dịch bằng Kimi K2.6, OCR thay text trên màn, ghép phụ đề song ngữ bằng FFmpeg, rồi auto-post lên X. Toàn bộ chạy local, MIT, không khoá API key.
Jellyfish AI - P2: Cách Cài Đặt, Workflow Chi Tiết và Cơ Hội Kiếm Tiền Từ Phim Ngắn
Jellyfish cài đặt qua Docker Compose chỉ cần 3 lệnh, không yêu cầu kỹ năng lập trình đặc biệt. Workflow 5 bước từ kịch bản đến phim hoàn chỉnh giải quyết bài toán nhất quán nhân vật - điểm yếu lớn nhất của AI video. Thị trường phim ngắn AI đang trả revenue share cho creator solo, với nền tảng Hongguo phân bổ 5 tỷ NDT ngân sách content năm 2026.
LTX IC-LoRA biến video phẳng thành 360° equirectangular ngay trong ComfyUI
Creator @CitizenPlain vừa khoe một workflow ComfyUI dùng LTX IC-LoRA để chuyển footage quay phẳng thông thường thành video 360° equirectangular VR-ready — không cần camera 360, không cần stitching. Đây là hướng đi rất khác so với các LoRA 360 text-to-video đang phổ biến.
3 Công Cụ AI Nổi Bật Tuần Này: Seedance 2.0, CLAUDE.md và Understand Anything
Seedance 2.0 của ByteDance hạ rào cản làm video AI xuống mức người thường có thể tạo phim ngắn viral chỉ từ text, độ phân giải 2K, nhanh hơn 30% so với Kling AI. File CLAUDE.md 65 dòng từ Karpathy đạt 91.200 stars GitHub, đang được cộng đồng copy vào global custom instructions của Codex để chấm dứt thói quen AI tự ý sửa code. Understand Anything - #1 GitHub Trending với 21.8k stars - biến codebase 200k dòng thành knowledge graph tương tác trong khoảng 10 phút.
Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí
VSE (Video Subtitle Extractor) trích xuất hardcoded subtitle từ video sang file SRT chỉ bằng OCR local - không cần API. Hỗ trợ 87 ngôn ngữ, 4 chế độ tăng tốc phần cứng (CUDA, DirectML, ONNX, CPU). Phiên bản 2.2.0 có 8.800+ GitHub stars, Apache-2.0, hoàn toàn miễn phí không giới hạn.