Tag: #deep-learning

8 bài viết

#6272026-05-15

Lộ Trình AI Engineer Miễn Phí 14 Tuần - Phần 2: Deep Learning, LLM Engineering và Deploy

Phần 2 của lộ trình AI Engineer 14 tuần miễn phí, bao gồm Deep Learning với Karpathy, LLM Engineering với RAG và quantization xuống 4-bit, AI Agents với Microsoft (62.600 stars) và Anthropic MCP, cùng cách deploy và đánh giá hệ thống AI production. mlabonne/llm-course (79.400 stars) là tài nguyên gần nhất với một LLM engineering curriculum open-source đầy đủ hiện có. Trong tuyển dụng AI hiện đại, GitHub thường quan trọng hơn CV - đây là lý do lộ trình này buộc bạn phải build và deploy thực sự.

ai-engineerdeep-learningllm-engineering

8 phút đọc

#5942026-05-12

Xây dựng LLM Architecture từ đầu - Phần 1: Python, Neural Networks và Transformer

LLM engineer senior hiện kiếm $200K-$320K/năm và freelance $175-250/giờ - premium 30-60% so với ML engineer thông thường. Bài Phần 1 hướng dẫn 3 nền tảng không thể bỏ qua: Python chuyên sâu, Neural Networks và kiến trúc Transformer ra đời từ bài báo lịch sử 'Attention Is All You Need'. Không cần PhD, không cần Silicon Valley.

llmpythondeep-learning

6 phút đọc

#5352026-05-07

Foundations of Large Language Models - Cuốn sách 247 trang miễn phí bạn nên đọc ngay

Foundations of Large Language Models là sách học thuật 247 trang, miễn phí trên arXiv, bao phủ 5 trụ cột kỹ thuật từ pre-training đến inference. Tác giả Tong Xiao và Jingbo Zhu dùng ký hiệu toán học chuẩn với Q/K/V matrices, KL divergence, RLHF formal derivations. Chương 5 gồm inference-time scaling kiểu o1 - rare trong sách giáo khoa foundational. License CC BY-NC 4.0, tải PDF miễn phí tại arxiv.org/abs/2501.09223.

llmmachine-learningnlp

7 phút đọc

#5212026-05-07

Andrej Karpathy vừa cho bạn khoá học LLM tốt nhất thế giới - miễn phí trên YouTube

Karpathy phát hành video 3h31m "Deep Dive into LLMs like ChatGPT" - bao trọn pipeline từ tokenization, transformer đến RLHF và DeepSeek-R1, hoàn toàn miễn phí. GPT-2 từng tốn $40,000 để train năm 2019, Karpathy tái tạo lại với $672 và chứng minh con số đó có thể xuống $100 hôm nay. Không cần background lập trình, không cần toán - chỉ cần 3 tiếng rưỡi đầu tư một lần.

andrej-karpathyllmai-education

7 phút đọc

#4872026-05-06

WiFi-3D-Fusion: Dùng sóng WiFi để nhìn thấy người - không cần camera

WiFi-3D-Fusion là tool open-source (GPL-2.0) dựng skeleton 3D người trong thời gian thực từ CSI signal, không cần camera. Chạy 10 FPS, phân giải 6cm trên băng 5GHz, xây trên nền nghiên cứu Person-in-WiFi-3D tại CVPR 2024. Phần cứng tối thiểu chỉ cần ESP32 hoặc USB WiFi adapter RTL8812AU - miễn phí hoàn toàn.

wifi-sensingcsi3d-motion-detection

6 phút đọc

#2992026-04-17

Stanford CS336: Bài giảng giải mã toàn bộ kiến trúc LLM mainstream trong 3 năm qua

Stanford CS336 Spring 2026 Lecture 3 là bài giảng miễn phí của GS Tatsu Hashimoto phân tích 19+ mô hình LLM từ 2017-2025 - từ GPT đến LLaMA 4, DeepSeek V3, Gemma 3. Kết luận chính: phần lớn LLM hiện đại hội tụ về cùng tập thiết kế - Pre-norm, RMS Norm, SwiGLU, RoPE, GQA. Llama 4 đạt context 10 triệu token; DeepSeek V3 dùng MLA để nén KV cache - hai ngoại lệ nổi bật trong xu hướng chung. Toàn bộ course CS336 miễn phí trên YouTube.

stanford-cs336llm-architecturesai-education

7 phút đọc

#2582026-04-11

Video Subtitle Extractor: Trích xuất subtitle từ video hoàn toàn offline, miễn phí

VSE (Video Subtitle Extractor) trích xuất hardcoded subtitle từ video sang file SRT chỉ bằng OCR local - không cần API. Hỗ trợ 87 ngôn ngữ, 4 chế độ tăng tốc phần cứng (CUDA, DirectML, ONNX, CPU). Phiên bản 2.2.0 có 8.800+ GitHub stars, Apache-2.0, hoàn toàn miễn phí không giới hạn.

video-toolsocrsubtitle

6 phút đọc

#0962025-11-07

Google mở mã Magika: model AI nhận diện file type 99% chính xác, 5ms trên CPU

Google vừa open-source Magika — model deep learning 1MB phát hiện 200+ loại file với F1 99%, nhanh 5ms/file chỉ trên CPU. Đang chạy scan hàng trăm tỷ file/tuần trên Gmail, Drive, Safe Browsing và VirusTotal. Version 1.0 vừa ra mắt với engine Rust mới.

magikagoogleopen-source

8 phút đọc