Chuyển tới nội dung chính

Bắt Đầu Nhanh

Giao Diện Web

Cách nhanh nhất để thử VieNeu-TTS:

uv run vieneu-web

Mở http://127.0.0.1:7860 — nhập văn bản, chọn giọng nói, nhấn tạo.

Phát Trực Tuyến Thời Gian Thực

Để phát trực tuyến với độ trễ cực thấp (tối ưu CPU):

uv run vieneu-stream

Mở http://localhost:8001 — âm thanh bắt đầu phát trước khi câu hoàn chỉnh được tạo xong.

SDK Python

Sử Dụng Cơ Bản

from vieneu import Vieneu

tts = Vieneu()

# Tạo giọng nói với giọng mặc định
audio = tts.infer(text="Xin chào, tôi là VieNeu.")
tts.save(audio, "output.wav")

Nhân Bản Giọng Nói

audio = tts.infer(
text="Đây là giọng nói được clone.",
ref_audio="duong_dan/den/am_thanh_mau.wav",
ref_text="Nội dung của âm thanh mẫu."
)
tts.save(audio, "cloned.wav")

Sử Dụng Giọng Đặt Sẵn

# Liệt kê các giọng có sẵn
voices = tts.list_preset_voices()
for description, voice_id in voices:
print(f"{voice_id}: {description}")

# Sử dụng giọng cụ thể
voice = tts.get_preset_voice("ten_giong")
audio = tts.infer(text="Chào bạn!", voice=voice)

Phát Trực Tuyến

for audio_chunk in tts.infer_stream(text="Một đoạn văn dài..."):
# Xử lý từng đoạn âm thanh khi được tạo
phat_am_thanh(audio_chunk)

Xử Lý Hàng Loạt

texts = ["Câu một.", "Câu hai.", "Câu ba."]
audios = tts.infer_batch(texts)

for i, audio in enumerate(audios):
tts.save(audio, f"output_{i}.wav")