Upload README.md with huggingface_hub
Browse files
README.md
CHANGED
|
@@ -10,16 +10,16 @@ tags:
|
|
| 10 |
license: apache-2.0
|
| 11 |
---
|
| 12 |
|
| 13 |
-
# VoxCPM 0.5B
|
| 14 |
|
| 15 |
-
|
| 16 |
-
|
| 17 |
|
| 18 |
-
|
| 19 |
|
| 20 |
-
##
|
| 21 |
|
| 22 |
-
|
| 23 |
|
| 24 |
```bash
|
| 25 |
git clone https://github.com/OpenBMB/VoxCPM.git
|
|
@@ -27,28 +27,29 @@ cd VoxCPM
|
|
| 27 |
pip install -e .
|
| 28 |
```
|
| 29 |
|
| 30 |
-
##
|
| 31 |
|
| 32 |
-
|
| 33 |
|
| 34 |
-
### Python
|
| 35 |
|
| 36 |
```python
|
| 37 |
import soundfile as sf
|
| 38 |
from voxcpm import VoxCPM
|
| 39 |
|
| 40 |
-
#
|
| 41 |
-
#
|
| 42 |
model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
|
| 43 |
|
| 44 |
-
#
|
| 45 |
-
text = "Привет! Это пример синтеза речи на русском языке с использованием VoxCPM."
|
| 46 |
|
| 47 |
-
#
|
|
|
|
| 48 |
wav = model.generate(text, prompt_wav_path=None)
|
| 49 |
|
| 50 |
-
#
|
| 51 |
sample_rate = model.tts_model.sample_rate
|
| 52 |
sf.write("output.wav", wav, sample_rate)
|
| 53 |
-
print(f"
|
| 54 |
```
|
|
|
|
| 10 |
license: apache-2.0
|
| 11 |
---
|
| 12 |
|
| 13 |
+
# VoxCPM 0.5B: Русская версия (Fine-Tuned)
|
| 14 |
|
| 15 |
+
Это модель **VoxCPM 0.5B**, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи.
|
| 16 |
+
Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи.
|
| 17 |
|
| 18 |
+
**Шаг чекпоинта:** 5600
|
| 19 |
|
| 20 |
+
## Установка
|
| 21 |
|
| 22 |
+
Убедитесь, что у вас установлен пакет `voxcpm` (из [репозитория VoxCPM](https://github.com/OpenBMB/VoxCPM)):
|
| 23 |
|
| 24 |
```bash
|
| 25 |
git clone https://github.com/OpenBMB/VoxCPM.git
|
|
|
|
| 27 |
pip install -e .
|
| 28 |
```
|
| 29 |
|
| 30 |
+
## Использование
|
| 31 |
|
| 32 |
+
Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования).
|
| 33 |
|
| 34 |
+
### Пример кода на Python
|
| 35 |
|
| 36 |
```python
|
| 37 |
import soundfile as sf
|
| 38 |
from voxcpm import VoxCPM
|
| 39 |
|
| 40 |
+
# Загрузка модели
|
| 41 |
+
# Модель будет автоматически скачана из Hugging Face
|
| 42 |
model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
|
| 43 |
|
| 44 |
+
# Текст для озвучивания
|
| 45 |
+
text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM."
|
| 46 |
|
| 47 |
+
# Генерируем аудио
|
| 48 |
+
# Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом
|
| 49 |
wav = model.generate(text, prompt_wav_path=None)
|
| 50 |
|
| 51 |
+
# Сохраняем результат
|
| 52 |
sample_rate = model.tts_model.sample_rate
|
| 53 |
sf.write("output.wav", wav, sample_rate)
|
| 54 |
+
print(f"Файл output.wav сохранен с частотой {sample_rate}Гц")
|
| 55 |
```
|