// Popular Articles

#huggingface
#7352026-02-28

huggingface_hub v1.12.0: unified CLI output and server-side bucket search

Hugging Face's Python client just shipped v1.12.0. Two changes matter for anyone scripting against the Hub: a single --format flag across every hf buckets command (with a new agent mode for LLM tooling), and server-side bucket search so you stop listing 10k buckets just to grep for one.

huggingfacehuggingface-hubcli
6 phút đọc
#4242025-09-25

OpenAI mở mã Privacy Filter: mô hình 1.5B (50M active) chuyên phát hiện PII, chạy được trên laptop

OpenAI vừa bất ngờ ra mắt Privacy Filter trên HuggingFace dưới giấy phép Apache 2.0 — không phải LLM mới, mà là một token classifier 1.5B tham số (chỉ 50M active nhờ MoE) chuyên tìm và bôi đen dữ liệu cá nhân. 96% F1 trên PII-Masking-300k, 128k context, chạy được cả trong browser qua WebGPU.

openaiprivacy-filterpii-detection
6 phút đọc
#2332025-06-21

A 2B Model for Mongolian: Why Small, Specialized LLMs Matter for Low-Resource Languages

A 2B-parameter model fine-tuned specifically for Mongolian is quietly doing something the giant multilingual LLMs can't: making high-quality NLP cheap, local, and accessible for an underrepresented language. Here's why the small-and-specialized tier is the real story.

mongolian-nlpsmall-language-modellow-resource-languages
7 phút đọc