Chuyển tới nội dung chính

Chế Độ Fast (LMDeploy)

Suy luận tăng tốc GPU sử dụng LMDeploy để đạt thông lượng tối đa.

Yêu Cầu

GPU NVIDIA với 4GB+ VRAM
CUDA 12.8+ và NVIDIA GPU Computing Toolkit

Sử Dụng

from vieneu import Vieneu

tts = Vieneu(
    mode="fast",
    backbone_repo="pnnbao-ump/VieNeu-TTS",  # hoặc VieNeu-TTS-0.3B
)

audio = tts.infer(text="Xin chào bạn")
tts.save(audio, "output.wav")

Khi Nào Nên Dùng

Xử lý hàng loạt khối lượng lớn
Triển khai phía máy chủ
Tốc độ suy luận tối đa trên GPU

Nếu chỉ dùng CPU, hãy dùng chế độ standard với mô hình GGUF.

Yêu Cầu
Sử Dụng
Khi Nào Nên Dùng