← Tất cả bài viết

Tag: #transformer

2 bài viết

Xây dựng LLM Architecture từ đầu - Phần 1: Python, Neural Networks và Transformer
#5942026-05-12

Xây dựng LLM Architecture từ đầu - Phần 1: Python, Neural Networks và Transformer

LLM engineer senior hiện kiếm $200K-$320K/năm và freelance $175-250/giờ - premium 30-60% so với ML engineer thông thường. Bài Phần 1 hướng dẫn 3 nền tảng không thể bỏ qua: Python chuyên sâu, Neural Networks và kiến trúc Transformer ra đời từ bài báo lịch sử 'Attention Is All You Need'. Không cần PhD, không cần Silicon Valley.

llmpythondeep-learning
6 phút đọc
Stanford CS336: Bài giảng giải mã toàn bộ kiến trúc LLM mainstream trong 3 năm qua
#2992026-04-17

Stanford CS336: Bài giảng giải mã toàn bộ kiến trúc LLM mainstream trong 3 năm qua

Stanford CS336 Spring 2026 Lecture 3 là bài giảng miễn phí của GS Tatsu Hashimoto phân tích 19+ mô hình LLM từ 2017-2025 - từ GPT đến LLaMA 4, DeepSeek V3, Gemma 3. Kết luận chính: phần lớn LLM hiện đại hội tụ về cùng tập thiết kế - Pre-norm, RMS Norm, SwiGLU, RoPE, GQA. Llama 4 đạt context 10 triệu token; DeepSeek V3 dùng MLA để nén KV cache - hai ngoại lệ nổi bật trong xu hướng chung. Toàn bộ course CS336 miễn phí trên YouTube.

stanford-cs336llm-architecturesai-education
7 phút đọc