Chế Độ Fast (LMDeploy)
Suy luận tăng tốc GPU sử dụng LMDeploy để đạt thông lượng tối đa.
Yêu Cầu
- GPU NVIDIA với 4GB+ VRAM
- CUDA 12.8+ và NVIDIA GPU Computing Toolkit
Sử Dụng
from vieneu import Vieneu
tts = Vieneu(
mode="fast",
backbone_repo="pnnbao-ump/VieNeu-TTS", # hoặc VieNeu-TTS-0.3B
)
audio = tts.infer(text="Xin chào bạn")
tts.save(audio, "output.wav")
Khi Nào Nên Dùng
- Xử lý hàng loạt khối lượng lớn
- Triển khai phía máy chủ
- Tốc độ suy luận tối đa trên GPU
Nếu chỉ dùng CPU, hãy dùng chế độ standard với mô hình GGUF.