Yêu Cầu Hệ Thống
Yêu Cầu Tối Thiểu
| Thành Phần | Yêu Cầu |
|---|---|
| Python | 3.10+ |
| RAM | 2 GB (GGUF Q4) |
| Ổ Cứng | ~500 MB (mô hình tự tải) |
| eSpeak NG | Bắt buộc |
Khuyên Dùng (CPU)
| Thành Phần | Khuyến Nghị |
|---|---|
| CPU | i5/i7/M1+ hiện đại |
| RAM | 4 GB+ |
| Mô Hình | GGUF Q4 hoặc Q8 |
Độ trễ phát trực tuyến: dưới 300ms cho chunk đầu tiên trên i3/i5 hiện đại.
Khuyên Dùng (GPU)
| Thành Phần | Khuyến Nghị |
|---|---|
| GPU | NVIDIA với 4GB+ VRAM |
| Driver | >= 570.65 (CUDA 12.8+) |
| Mô Hình | PyTorch 0.5B hoặc 0.3B |
| Backend | LMDeploy để đạt tốc độ tối đa |
GPU Intel Arc
Hỗ trợ qua PyTorch XPU (đã kiểm tra trên Arc B580, A770 trên Windows):
run setup_xpu_uv.bat
run run_xpu.bat
Mẹo: Intel Arc có băng thông bộ nhớ cao — giữ batch size lớn và giảm thiểu ký tự mỗi chunk.
Kích Thước Mô Hình
| Mô Hình | Ổ Cứng | RAM Sử Dụng |
|---|---|---|
| 0.5B PyTorch | ~2 GB | ~3 GB |
| 0.3B PyTorch | ~1.2 GB | ~2 GB |
| 0.3B GGUF Q8 | ~350 MB | ~500 MB |
| 0.3B GGUF Q4 | ~200 MB | ~300 MB |
Mô hình được lưu cache tại ~/.cache/huggingface/hub/ sau lần tải đầu tiên.