ALEKAS commited on
Commit
32c0949
·
verified ·
1 Parent(s): c936e6a

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +17 -16
README.md CHANGED
@@ -10,16 +10,16 @@ tags:
10
  license: apache-2.0
11
  ---
12
 
13
- # VoxCPM 0.5B Russian Fine-Tune (Step 5600)
14
 
15
- This is a **VoxCPM 0.5B** model fine-tuned on Russian speech corpus (Full Fine-Tuning).
16
- It adapts the tokenizer-free VoxCPM architecture to the Russian language.
17
 
18
- **Checkpoint Step:** 5600
19
 
20
- ## Installation
21
 
22
- Ensure you have the `voxcpm` package installed (from the [VoxCPM repository](https://github.com/OpenBMB/VoxCPM)):
23
 
24
  ```bash
25
  git clone https://github.com/OpenBMB/VoxCPM.git
@@ -27,28 +27,29 @@ cd VoxCPM
27
  pip install -e .
28
  ```
29
 
30
- ## Usage
31
 
32
- This model is fine-tuned to generate Russian speech in a specific voice. It works best in standard generation mode.
33
 
34
- ### Python Code
35
 
36
  ```python
37
  import soundfile as sf
38
  from voxcpm import VoxCPM
39
 
40
- # Load the model
41
- # Replace 'ALEKAS/VoxCPM-0.5B-Russian-5600' with your actual HF Repo ID or local path
42
  model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
43
 
44
- # Text to generate
45
- text = "Привет! Это пример синтеза речи на русском языке с использованием VoxCPM."
46
 
47
- # Generate audio (no prompt needed for fine-tuned voice)
 
48
  wav = model.generate(text, prompt_wav_path=None)
49
 
50
- # Save to file
51
  sample_rate = model.tts_model.sample_rate
52
  sf.write("output.wav", wav, sample_rate)
53
- print(f"Saved output.wav with sample rate {sample_rate}Hz")
54
  ```
 
10
  license: apache-2.0
11
  ---
12
 
13
+ # VoxCPM 0.5B: Русская версия (Fine-Tuned)
14
 
15
+ Это модель **VoxCPM 0.5B**, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи.
16
+ Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи.
17
 
18
+ **Шаг чекпоинта:** 5600
19
 
20
+ ## Установка
21
 
22
+ Убедитесь, что у вас установлен пакет `voxcpm` (из [репозитория VoxCPM](https://github.com/OpenBMB/VoxCPM)):
23
 
24
  ```bash
25
  git clone https://github.com/OpenBMB/VoxCPM.git
 
27
  pip install -e .
28
  ```
29
 
30
+ ## Использование
31
 
32
+ Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования).
33
 
34
+ ### Пример кода на Python
35
 
36
  ```python
37
  import soundfile as sf
38
  from voxcpm import VoxCPM
39
 
40
+ # Загрузка модели
41
+ # Модель будет автоматически скачана из Hugging Face
42
  model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False)
43
 
44
+ # Текст для озвучивания
45
+ text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM."
46
 
47
+ # Генерируем аудио
48
+ # Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом
49
  wav = model.generate(text, prompt_wav_path=None)
50
 
51
+ # Сохраняем результат
52
  sample_rate = model.tts_model.sample_rate
53
  sf.write("output.wav", wav, sample_rate)
54
+ print(f"Файл output.wav сохранен с частотой {sample_rate}Гц")
55
  ```