Lộ Trình AI Engineer Miễn Phí 14 Tuần - Phần 2: Deep Learning, LLM Engineering và Deploy
Phần 2 của lộ trình AI Engineer 14 tuần miễn phí, bao gồm Deep Learning với Karpathy, LLM Engineering với RAG và quantization xuống 4-bit, AI Agents với Microsoft (62.600 stars) và Anthropic MCP, cùng cách deploy và đánh giá hệ thống AI production. mlabonne/llm-course (79.400 stars) là tài nguyên gần nhất với một LLM engineering curriculum open-source đầy đủ hiện có. Trong tuyển dụng AI hiện đại, GitHub thường quan trọng hơn CV - đây là lý do lộ trình này buộc bạn phải build và deploy thực sự.
Xây dựng LLM Architecture từ đầu - Phần 1: Python, Neural Networks và Transformer
LLM engineer senior hiện kiếm $200K-$320K/năm và freelance $175-250/giờ - premium 30-60% so với ML engineer thông thường. Bài Phần 1 hướng dẫn 3 nền tảng không thể bỏ qua: Python chuyên sâu, Neural Networks và kiến trúc Transformer ra đời từ bài báo lịch sử 'Attention Is All You Need'. Không cần PhD, không cần Silicon Valley.
Foundations of Large Language Models - Cuốn sách 247 trang miễn phí bạn nên đọc ngay
Foundations of Large Language Models là sách học thuật 247 trang, miễn phí trên arXiv, bao phủ 5 trụ cột kỹ thuật từ pre-training đến inference. Tác giả Tong Xiao và Jingbo Zhu dùng ký hiệu toán học chuẩn với Q/K/V matrices, KL divergence, RLHF formal derivations. Chương 5 gồm inference-time scaling kiểu o1 - rare trong sách giáo khoa foundational. License CC BY-NC 4.0, tải PDF miễn phí tại arxiv.org/abs/2501.09223.
Andrej Karpathy vừa cho bạn khoá học LLM tốt nhất thế giới - miễn phí trên YouTube
Karpathy phát hành video 3h31m "Deep Dive into LLMs like ChatGPT" - bao trọn pipeline từ tokenization, transformer đến RLHF và DeepSeek-R1, hoàn toàn miễn phí. GPT-2 từng tốn $40,000 để train năm 2019, Karpathy tái tạo lại với $672 và chứng minh con số đó có thể xuống $100 hôm nay. Không cần background lập trình, không cần toán - chỉ cần 3 tiếng rưỡi đầu tư một lần.
WiFi-3D-Fusion: Dùng sóng WiFi để nhìn thấy người - không cần camera
WiFi-3D-Fusion là tool open-source (GPL-2.0) dựng skeleton 3D người trong thời gian thực từ CSI signal, không cần camera. Chạy 10 FPS, phân giải 6cm trên băng 5GHz, xây trên nền nghiên cứu Person-in-WiFi-3D tại CVPR 2024. Phần cứng tối thiểu chỉ cần ESP32 hoặc USB WiFi adapter RTL8812AU - miễn phí hoàn toàn.
Stanford CS336: Bài giảng giải mã toàn bộ kiến trúc LLM mainstream trong 3 năm qua
Stanford CS336 Spring 2026 Lecture 3 là bài giảng miễn phí của GS Tatsu Hashimoto phân tích 19+ mô hình LLM từ 2017-2025 - từ GPT đến LLaMA 4, DeepSeek V3, Gemma 3. Kết luận chính: phần lớn LLM hiện đại hội tụ về cùng tập thiết kế - Pre-norm, RMS Norm, SwiGLU, RoPE, GQA. Llama 4 đạt context 10 triệu token; DeepSeek V3 dùng MLA để nén KV cache - hai ngoại lệ nổi bật trong xu hướng chung. Toàn bộ course CS336 miễn phí trên YouTube.
Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí
VSE (Video Subtitle Extractor) trích xuất hardcoded subtitle từ video sang file SRT chỉ bằng OCR local - không cần API. Hỗ trợ 87 ngôn ngữ, 4 chế độ tăng tốc phần cứng (CUDA, DirectML, ONNX, CPU). Phiên bản 2.2.0 có 8.800+ GitHub stars, Apache-2.0, hoàn toàn miễn phí không giới hạn.
Google mở mã Magika: model AI nhận diện file type 99% chính xác, 5ms trên CPU
Google vừa open-source Magika — model deep learning 1MB phát hiện 200+ loại file với F1 99%, nhanh 5ms/file chỉ trên CPU. Đang chạy scan hàng trăm tỷ file/tuần trên Gmail, Drive, Safe Browsing và VirusTotal. Version 1.0 vừa ra mắt với engine Rust mới.