Chuyển tới nội dung chính

Chế Độ Fast (LMDeploy)

Suy luận tăng tốc GPU sử dụng LMDeploy để đạt thông lượng tối đa.

Yêu Cầu

  • GPU NVIDIA với 4GB+ VRAM
  • CUDA 12.8+ và NVIDIA GPU Computing Toolkit

Sử Dụng

from vieneu import Vieneu

tts = Vieneu(
mode="fast",
backbone_repo="pnnbao-ump/VieNeu-TTS", # hoặc VieNeu-TTS-0.3B
)

audio = tts.infer(text="Xin chào bạn")
tts.save(audio, "output.wav")

Khi Nào Nên Dùng

  • Xử lý hàng loạt khối lượng lớn
  • Triển khai phía máy chủ
  • Tốc độ suy luận tối đa trên GPU

Nếu chỉ dùng CPU, hãy dùng chế độ standard với mô hình GGUF.