Главная · Блог · ElevenLabs русский голос
AI База

ElevenLabs для русского голоса: гайд для создателей

Клонировать свой голос за 2 минуты и озвучить им подкаст, рилс или аудиокнигу — реально. Расскажу, как добиться качества, которое не отличить от живой записи.

25 апреля 2026·8 минут чтения·Никита Титов
TL;DR ElevenLabs клонирует русский голос с 2024 года. Для качества нужны: чистая запись-донор (1+ мин без эха), модель Multilingual v2, правильные настройки stability 50–65 / similarity 75–85, обязательная редактура акцентов в проблемных словах.

Зачем клонировать голос

Раньше создатель контента упирался в свой собственный темп речи. Запись подкаста — час времени плюс монтаж. Озвучка рилса — 5 дублей до приличного. Аудиоверсия статьи — отдельный день в студии. Клон голоса убирает это бутылочное горлышко: текст превращается в твой голос за минуту.

Сценарии, где это уже стандарт у топовых блогеров:

2 типа клонирования: что выбрать

Instant Voice Cloning (IVC)

Загружаешь 1–3 минуты речи. Через 30 секунд — рабочий клон. Качество хорошее, но не идеальное: иногда теряется характер интонации в эмоциональных местах. Подходит для сторис, коротких рилсов, тестов.

Professional Voice Cloning (PVC)

Загружаешь 30 минут разнообразной речи (монолог, диалог, эмоции, чтение списков). Обработка занимает несколько часов. На выходе — клон, который держит интонацию, ставит ударения, понимает паузы. Стоит дороже подписки. Имеет смысл, если планируешь регулярные подкасты или аудиокниги.

Запись-донор: правила для качества

90% качества клона решается на этапе записи материала. Делай так:

  1. Тихая комната. Нет фонового шума: компьютер, кондиционер, улица. Идеально — гардероб с одеждой (естественная звукоизоляция).
  2. Один микрофон. Не USB-наушники, не встроенный в ноут. Минимум — конденсаторный микрофон от 50€ (Audio-Technica AT2020, Samson Q2U).
  3. Постоянная дистанция. 15–20 см от микрофона, не двигайся в процессе.
  4. Естественный темп. Не читай шёпотом, не кричи. Говори как в обычной беседе с другом.
  5. Разнообразие. Включи в запись: декларативные фразы, вопросы, восклицания, числа, имена собственные. Это учит модель твоей вариативности.

Настройки: stability и similarity

Это два главных ползунка ElevenLabs. От них зависит, будет голос звучать как живой или как робот.

Stability (стабильность)

Низкая (30–45%) — больше эмоций, разных интонаций, но иногда «срывы». Подходит для художественной озвучки, диалогов.

Средняя (50–65%) — баланс. Универсальная настройка для подкастов и образовательного контента.

Высокая (75–90%) — монотонно, но предсказуемо. Подходит для длинных текстов, где важна ровность.

Similarity (похожесть на оригинал)

Низкая (40–60%) — модель «уходит» от донора. Иногда полезно, если донор записан с искажениями.

Высокая (75–90%) — максимально близко к твоему голосу. Дефолт для большинства задач.

Слишком высокая (95%+) — может усиливать дефекты записи. Не ставь на максимум вслепую.

Хочешь начать с базовых ИИ-инструментов?

Тренинг «AI База» — освоение ElevenLabs, Claude, Kie.ai, HeyGen и Suno. От первой подписки до рабочего стека за неделю. Без воды, только то, что используется каждый день.

Перейти к тренингу →

Лайфхаки для естественности

1. Используй разметку SSML

ElevenLabs понимает простые теги пауз: <break time="0.5s"/>. Расставляй их там, где хочешь логические паузы. Без них модель иногда говорит «на одном дыхании».

2. Расставляй ударения вручную

В сложных словах с двойным ударением (за́мок/замо́к) — пиши с заглавной ударную гласную: «зАмок» или «замОк». Модель почти всегда правильно интерпретирует.

3. Англицизмы — латиницей

«Claude», «ElevenLabs», «vibe-coding» оставляй на английском. Модель распознаёт лучше, чем русскую транслитерацию.

4. Цифры — словами

Не «250€», а «двести пятьдесят евро». Модель прочтёт цифры, но интонация будет хуже, чем у написанных слов.

5. Тестируй короткими кусками

Не озвучивай сразу 10 минут текста. Проверяй абзацами. Если 2 абзаца идут отлично — продолжай. Если есть «срывы» — крути настройки.

Типичные ошибки

Ошибка 1. Записать донор на телефон в кафе

Шум, эхо, реверберация — клон вытащит всё это в каждое слово. Перезапись в тихой комнате решает 80% проблем.

Ошибка 2. Использовать дефолтные настройки на длинном тексте

Дефолт ElevenLabs — usable, не perfect. Под свой голос всегда нужно настраивать stability и similarity.

Ошибка 3. Не редактировать сложные места

Если ты слышишь, что фраза прозвучала странно — переформулируй и сгенерируй заново. ElevenLabs — не «загрузил и забыл», а итеративный инструмент.

Ошибка 4. Игнорировать этику

Клон твоего голоса — это твой голос. Клон чужого без согласия — мошенничество и уголовка во многих странах. Только свой или с явного письменного разрешения.

Сколько стоит и какой тариф взять

FAQ

Понимает ли ElevenLabs русский?

Да, с 2024 в Multilingual v2. Качество близко к нативной озвучке.

Сколько записать для клонирования?

1 минута для IVC, 30 минут для PVC.

Можно ли использовать коммерчески?

Да на Creator и выше. На бесплатном — только для личных проектов.

Почему голос звучит роботом?

Чаще всего — плохая запись-донор. Перезапиши в тихой комнате.

Какая модель лучше для русского?

Multilingual v2 — баланс качества и скорости. Turbo v2.5 — быстрее, но теряет интонацию.

Готов собрать полный AI-стек?

В тренинге «AI База» — пошаговое освоение 5 главных инструментов 2026: ElevenLabs, Claude, HeyGen, Suno, Kie.ai. От подписки до интеграции в рабочий процесс — за неделю.

Забрать тренинг →
Курс AI БазаБазовый стек инструментов с практическими разборами.
Открыть курс →