Chuyển tới nội dung chính

Yêu Cầu Hệ Thống

Yêu Cầu Tối Thiểu

Thành PhầnYêu Cầu
Python3.10+
RAM2 GB (GGUF Q4)
Ổ Cứng~500 MB (mô hình tự tải)
eSpeak NGBắt buộc

Khuyên Dùng (CPU)

Thành PhầnKhuyến Nghị
CPUi5/i7/M1+ hiện đại
RAM4 GB+
Mô HìnhGGUF Q4 hoặc Q8

Độ trễ phát trực tuyến: dưới 300ms cho chunk đầu tiên trên i3/i5 hiện đại.

Khuyên Dùng (GPU)

Thành PhầnKhuyến Nghị
GPUNVIDIA với 4GB+ VRAM
Driver>= 570.65 (CUDA 12.8+)
Mô HìnhPyTorch 0.5B hoặc 0.3B
BackendLMDeploy để đạt tốc độ tối đa

GPU Intel Arc

Hỗ trợ qua PyTorch XPU (đã kiểm tra trên Arc B580, A770 trên Windows):

run setup_xpu_uv.bat
run run_xpu.bat

Mẹo: Intel Arc có băng thông bộ nhớ cao — giữ batch size lớn và giảm thiểu ký tự mỗi chunk.

Kích Thước Mô Hình

Mô HìnhỔ CứngRAM Sử Dụng
0.5B PyTorch~2 GB~3 GB
0.3B PyTorch~1.2 GB~2 GB
0.3B GGUF Q8~350 MB~500 MB
0.3B GGUF Q4~200 MB~300 MB

Mô hình được lưu cache tại ~/.cache/huggingface/hub/ sau lần tải đầu tiên.