Bắt Đầu Nhanh
Giao Diện Web
Cách nhanh nhất để thử VieNeu-TTS:
uv run vieneu-web
Mở http://127.0.0.1:7860 — nhập văn bản, chọn giọng nói, nhấn tạo.
Phát Trực Tuyến Thời Gian Thực
Để phát trực tuyến với độ trễ cực thấp (tối ưu CPU):
uv run vieneu-stream
Mở http://localhost:8001 — âm thanh bắt đầu phát trước khi câu hoàn chỉnh được tạo xong.
SDK Python
Sử Dụng Cơ Bản
from vieneu import Vieneu
tts = Vieneu()
# Tạo giọng nói với giọng mặc định
audio = tts.infer(text="Xin chào, tôi là VieNeu.")
tts.save(audio, "output.wav")
Nhân Bản Giọng Nói
audio = tts.infer(
text="Đây là giọng nói được clone.",
ref_audio="duong_dan/den/am_thanh_mau.wav",
ref_text="Nội dung của âm thanh mẫu."
)
tts.save(audio, "cloned.wav")
Sử Dụng Giọng Đặt Sẵn
# Liệt kê các giọng có sẵn
voices = tts.list_preset_voices()
for description, voice_id in voices:
print(f"{voice_id}: {description}")
# Sử dụng giọng cụ thể
voice = tts.get_preset_voice("ten_giong")
audio = tts.infer(text="Chào bạn!", voice=voice)
Phát Trực Tuyến
for audio_chunk in tts.infer_stream(text="Một đoạn văn dài..."):
# Xử lý từng đoạn âm thanh khi được tạo
phat_am_thanh(audio_chunk)
Xử Lý Hàng Loạt
texts = ["Câu một.", "Câu hai.", "Câu ba."]
audios = tts.infer_batch(texts)
for i, audio in enumerate(audios):
tts.save(audio, f"output_{i}.wav")