ALEKAS
/

VoxCPM-0.5B-Russian-5600

@@ -10,16 +10,16 @@ tags:
 license: apache-2.0
 ---
-# VoxCPM 0.5B Russian Fine-Tune (Step 5600)
-This is a **VoxCPM 0.5B** model fine-tuned on Russian speech corpus (Full Fine-Tuning).
-It adapts the tokenizer-free VoxCPM architecture to the Russian language.
-**Checkpoint Step:** 5600
-## Installation
-Ensure you have the `voxcpm` package installed (from the [VoxCPM repository](https://github.com/OpenBMB/VoxCPM)):
 ```bash
 git clone https://github.com/OpenBMB/VoxCPM.git
@@ -27,28 +27,29 @@ cd VoxCPM
 pip install -e .
 ```
-## Usage
-This model is fine-tuned to generate Russian speech in a specific voice. It works best in standard generation mode.
-### Python Code
 ```python
 import soundfile as sf
 from voxcpm import VoxCPM
-# Load the model
-# Replace 'ALEKAS/VoxCPM-0.5B-Russian-5600' with your actual HF Repo ID or local path
 model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
-# Text to generate
-text = "Привет! Это пример синтеза речи на русском языке с использованием VoxCPM."
-# Generate audio (no prompt needed for fine-tuned voice)
 wav = model.generate(text, prompt_wav_path=None)
-# Save to file
 sample_rate = model.tts_model.sample_rate
 sf.write("output.wav", wav, sample_rate)
-print(f"Saved output.wav with sample rate {sample_rate}Hz")
 ```

 license: apache-2.0
 ---
+# VoxCPM 0.5B: Русская версия (Fine-Tuned)
+Это модель **VoxCPM 0.5B**, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи.
+Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи.
+**Шаг чекпоинта:** 5600
+## Установка
+Убедитесь, что у вас установлен пакет `voxcpm` (из [репозитория VoxCPM](https://github.com/OpenBMB/VoxCPM)):
 ```bash
 git clone https://github.com/OpenBMB/VoxCPM.git
 pip install -e .
 ```
+## Использование
+Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования).
+### Пример кода на Python
 ```python
 import soundfile as sf
 from voxcpm import VoxCPM
+# Загрузка модели
+# Модель будет автоматически скачана из Hugging Face
 model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
+# Текст для озвучивания
+text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM."
+# Генерируем аудио
+# Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом
 wav = model.generate(text, prompt_wav_path=None)
+# Сохраняем результат
 sample_rate = model.tts_model.sample_rate
 sf.write("output.wav", wav, sample_rate)
+print(f"Файл output.wav сохранен с частотой {sample_rate}Гц")
 ```