--- language: - ru pipeline_tag: text-to-speech tags: - voxcpm - tts - russian - audio license: apache-2.0 --- # VoxCPM 0.5B: Русская версия (Fine-Tuned) Это модель **VoxCPM 0.5B**, прошедшая полное дообучение (Full Fine-Tuning) на русскоязычном корпусе речи. Модель адаптирует архитектуру VoxCPM (tokenizer-free) для синтеза качественной русской речи. **Шаг чекпоинта:** 5600 ## Установка Убедитесь, что у вас установлен пакет `voxcpm` (из [репозитория VoxCPM](https://github.com/OpenBMB/VoxCPM)): ```bash git clone https://github.com/OpenBMB/VoxCPM.git cd VoxCPM pip install -e . ``` ## Использование Модель обучена генерировать русскую речь определенным голосом. Для получения наилучшего результата рекомендуется использовать стандартный режим генерации без подмены голоса (клонирования). ### Пример кода на Python ```python import soundfile as sf from voxcpm import VoxCPM # Загрузка модели # Модель будет автоматически скачана из Hugging Face model = VoxCPM.from_pretrained("ALEKAS/VoxCPM-0.5B-Russian-5600", load_denoiser=False) # Текст для озвучивания text = "Привет! Это пример синтеза речи на русском языке с использованием модели VoxCPM." # Генерируем аудио # Важно: prompt_wav_path=None, чтобы модель говорила своим "родным" обученным голосом wav = model.generate(text, prompt_wav_path=None) # Сохраняем результат sample_rate = model.tts_model.sample_rate sf.write("output.wav", wav, sample_rate) print(f"Файл output.wav сохранен с частотой {sample_rate}Гц") ```