---
language:
- ru
pipeline_tag: text-to-speech
tags:
- voxcpm
- tts
- russian
- audio
license: apache-2.0
---

# VoxCPM 0.5B: Русская версия (Fine-Tuned)

Это модель **VoxCPM 0.5B**, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи.
Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи.

**Шаг чекпоинта:** 5600

## Установка

Убедитесь, что у вас установлен пакет `voxcpm` (из [репозитория VoxCPM](https://github.com/OpenBMB/VoxCPM)):

```bash
git clone https://github.com/OpenBMB/VoxCPM.git
cd VoxCPM
pip install -e .
```

## Использование

Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования).

### Пример кода на Python

```python
import soundfile as sf
from voxcpm import VoxCPM

# Загрузка модели
# Модель будет автоматически скачана из Hugging Face
model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)

# Текст для озвучивания
text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM."

# Генерируем аудио
# Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом
wav = model.generate(text, prompt_wav_path=None)

# Сохраняем результат
sample_rate = model.tts_model.sample_rate
sf.write("output.wav", wav, sample_rate)
print(f"Файл output.wav сохранен с частотой {sample_rate}Гц")
```