Chuyển tới nội dung chính

Yêu Cầu Hệ Thống

Yêu Cầu Tối Thiểu

Thành Phần	Yêu Cầu
Python	3.10+
RAM	2 GB (GGUF Q4)
Ổ Cứng	~500 MB (mô hình tự tải)
eSpeak NG	Bắt buộc

Khuyên Dùng (CPU)

Thành Phần	Khuyến Nghị
CPU	i5/i7/M1+ hiện đại
RAM	4 GB+
Mô Hình	GGUF Q4 hoặc Q8

Độ trễ phát trực tuyến: dưới 300ms cho chunk đầu tiên trên i3/i5 hiện đại.

Khuyên Dùng (GPU)

Thành Phần	Khuyến Nghị
GPU	NVIDIA với 4GB+ VRAM
Driver	>= 570.65 (CUDA 12.8+)
Mô Hình	PyTorch 0.5B hoặc 0.3B
Backend	LMDeploy để đạt tốc độ tối đa

GPU Intel Arc

Hỗ trợ qua PyTorch XPU (đã kiểm tra trên Arc B580, A770 trên Windows):

run setup_xpu_uv.bat
run run_xpu.bat

Mẹo: Intel Arc có băng thông bộ nhớ cao — giữ batch size lớn và giảm thiểu ký tự mỗi chunk.

Kích Thước Mô Hình

Mô Hình	Ổ Cứng	RAM Sử Dụng
0.5B PyTorch	~2 GB	~3 GB
0.3B PyTorch	~1.2 GB	~2 GB
0.3B GGUF Q8	~350 MB	~500 MB
0.3B GGUF Q4	~200 MB	~300 MB

Mô hình được lưu cache tại ~/.cache/huggingface/hub/ sau lần tải đầu tiên.

Yêu Cầu Tối Thiểu
Khuyên Dùng (CPU)
Khuyên Dùng (GPU)
GPU Intel Arc
Kích Thước Mô Hình