Nhân Bản Giọng Tức Thì
Nhân bản bất kỳ giọng nói nào chỉ với 3-5 giây âm thanh tham chiếu. Zero-shot — không cần fine-tuning.
Streaming Thời Gian Thực
Phát âm thanh trước khi câu kết thúc. Độ trễ dưới 300ms trên CPU hiện đại.
Hoàn Toàn Offline
Chạy hoàn toàn trên thiết bị. Không cần API đám mây, không cần internet sau khi tải model.
Nhiều Model
Từ 0.5B (chất lượng tốt nhất) đến Q4 quantized (tốc độ cực cao). Chọn phù hợp với phần cứng của bạn.
Tiếng Việt + Tiếng Anh
Tiếng Việt bản địa với khả năng chuyển đổi liền mạch sang tiếng Anh trong cùng một câu.
Backend Linh Hoạt
PyTorch, GGUF, LMDeploy, Remote API, Intel XPU. Một SDK, nhiều tùy chọn triển khai.
Python API Đơn Giản
Ba dòng code để tạo giọng nói. Hỗ trợ nhân bản giọng, streaming, xử lý hàng loạt và nhiều hơn nữa.
from vieneu import Vieneu
tts = Vieneu()
audio = tts.infer(text="Xin chào bạn!")
tts.save(audio, "output.wav")