Меню Рубрики

Установка голосового движка алена

* MyTTS

Форум о преобразовании текста в речь

Регистрация через социальные сети

Alyona TTS

Alyona TTS

Сообщение evmir_troll-hunter » 19 июн 2018 20:13

Acapela Alyona

Для открытия файла(ов) нужен пароль

Женский голосовой движок, который получил название Алёна разработанный компанией Acapela. Работает на SAPI5SAPI4 с частотой 22 КГц, по качеству синтезируемой речи Алёна опережает аналогичные русские голоса, имея намного приятнее тембр голоса и интонацию.

Голос имеет поддержку SAPI4 и SAPI5 стандартные программные интерфейсы, и совместим со множеством речевых приложений для чтения с экрана и т.п. В наличии имеется полный набор инструментов для контроля параметров голоса таких как: скорость чтения, громкость, высота, паузы, настройки эквалайзера и режима чтения (чтение фразы, чтение отдельных слов и посимвольное чтение).

Вместе с движком поставляются:

  1. Voice Manager — редактор голоса с помощью которого легко создавать пользовательские голоса с любимыми настройками;
  2. Lexicon Manager — редактор словарей, который позволяет изменять произношение слов как буквенно, так и фонетически;
  3. KeySpeaker — приложение для чтения набираемого текста или текста из буфера обмена в реальном масштабе времени;
  4. SpeechPad — приложение для чтения текстовых файлов, поддерживающий SAPI4 теги.

Технические требования:
OS: Windows XP, Windows Vista и Windows 7, 8, 10
Оборудование: Pentium II 350 MHz, 128 MB RAM, от 100MB до 300MB места на жестком диске.

Для работы на Windows 8 и выше, скопируйте с заменой файл acattssapi5.dll в папку C:\Program Files\Acapela Group\Infovox Desktop 2.2.

Установка:

  1. InfovoxDesktop2.220Engine
  2. Russian_ID2220.exe — голос Алёны
  3. IDSP_203 — патч голосового движка
  4. с помощью генератора лицензий создайте лицензию, при этом появится лицензионный файл Infovox.lic
  5. запустите License Manager:
    C:\Program Files\Acapela Group\Infovox Desktop 2.2 файл BabLicMan.exe
    или
    Пуск\все программы\Acapela Group файл License Manager
  6. нажмите «импортировать лицензию» и укажите файл Infovox.lic.

Ошибка установки:
Error Number: 0x80040702
Description: Failed to Load DLL: Aca Tts Sapi4.
Setup will now terminate. (Номер ошибки: 0x80040702
Описание: Не удалось загрузить библиотеку DLL: Aca TTS SAPI4.
Установка будет завершена.)

и
Ошибка синтезирования речи:
OLE error 80045001

Ошибки связаны с неполным удалением записей из реестра при деинсталлировании предыдущих версий голосового движка. Для устранения ошибок удалите все записи с Infovox и Acapela из реестра и затем повторите установку снова.

Для автоматической очистки реестра от данных записей можете запустить батник delete.bat или импортировать файл реестра speech.reg
Инструкции в архиве. Пароль на архив: mytts
Помните, что файлы создавались в 08-10гг. для ХР\Висты — на новых ОС не проверялись!

Clean registry

Ошибка импорта лицензии:
The file cannot be added to the License Manager. (-32)
The file cannot be added to the Licence Manager. (-44)

После запуска License Manager перед тем как выполнить установите курсор на Alyona22K, т.к. по умолчанию он находится в корне дерева.

Возникает из-за ошибки в реестре вызванной, возможно, неправильной установкой\удалением предыдущих версий, сбоями в работе компьютера при установке, блокировке доступа к реестру антивирусными программами и т.п.

Также можно воспользоваться спецфайлом для импорта ветки реестра. Пароль на архив: mytts

Error license

Справка по работе с лексиконами для голоса Alyona:

Русский
Английский

Re: Alyona TTS

Сообщение evmir_troll-hunter » 30 июн 2018 00:34

Неожиданный вопрос, заставил задуматься что написать. Думал долго, поэтому прошу прошенья за многословность.
Вопрос «когда познакомился», наверное, требует отступления чуть назад, чтобы понять причину и следствие, так сказать «потребности заставляют искать возможности».

Я очень люблю читать, но проживаю в сельской местности, поэтому запас интересующих меня книг в местной библиотеке и даже в районной был довольно таки ограничен. Интернет у нас тоже развивался довольно таки плохо и боле или менее в общих масштабах, а не у нескольких человек, появился только ближе к 2010 году. Обрадовавшись такой возможности, я стал запоем скачивать и читать электронные книги, поскольку они мало весили. О каких-то больших объемах тогда и речи не было и сильно каралось рублем.

Только ближе к 2013 проводной интернет стал «безлимитным» а мобильные операторы установили приемлемые цены, настало время торрентов, и я сразу же подумал об аудиокнигах. Со временем книга стали заканчиваться (на то время их было тоже не так много) и я стал замечать, что в описание некоторых указана «компьютерная начитка» и я подумал, что почему бы мне тогда самому это не попробовать сделать. Тогда балом конечно рулила Алёна mytts/wink . Но по незнанию вопроса я установил голый движок и начал «озвучивать». Результат меня не впечатлил, и я отказался от этой идеи, благо что активизировались чтецы «любители» и книг стало больше.

Читайте также:  Установка аузк бесшовных труб

Тут стоит, наверное, приостановиться и ответить на ваш вопрос о моих предпочтениях. Читаю разные, но по большей части обобщу это как романы-фэнтези, притом предпочтительно серии книг, поскольку одну, если не сдержусь могу, прочитать и за день, а серии хоть подольше хватает. Для примера указать: Роберт Сальваторе – Сага о Темном эльфе, Урсула Ле Гуин – Средеземье, Роберт Джоран – Колесо Времени Терри Гудкайнд – Правило Волшебника и многие другие подобного жанра. Из современных это Брендон Сандерсон, Патрик Ротфусс, Джордж Мартин.

Итак, по тихоньку-помаленьку наступил 2016 год. И вот когда я приступил к очередной серии книг за авторством Робин Хобб – Сага о Видящих, оказалось, что озвучена только первая книга. Но поскольку книга мне понравилась, я решил вернуться к вопросу голосовых движков, полагая, что за столько времени должны же были разработчики что-то улучшить. Методом поиска попал на ваш форум, сначала стал пробовать сам, благо как я уже сказал инструкции довольно таки подробные и понятные, потом стал задавать вопросы (ник на прошлом форуме Andrei1389).

[. ]
Как вы выразились «аудиохарактеристики» Алёны мне как раз и больше нравятся, у Татьяны действительно есть «акцент» который поначалу смушал, но когда послушаешь подольше, то привыкаешь и уже не замечаешь. Татьяна читает более «плавно» что ли и правильно, хотя как я понял Максим читает ещё «правильнее» если можно так выразиться, но мужской голос мне не привычен. К Алёне я конечно за несколько лет привык и поэтому если у вас есть советы по её улучшению, то буду вам благодарен за ваш опыт.

» Плавность» чрезвычайно субъективная вещь. я уже писал, где правильная пунктуация (у классиков), там Алёна прям журчит.
А вот у современных писателей со знаками препинания беда.

Кому как конечно, но для меня запятые служат как бы указующими знаками, эмоционально выделяющими части предложения.
Когда читаю глазами, внимания на пунктуацию не обращаю, а в школе ненавидел все эти правила препинания — ещё ж надо было для 2 языков учить, украинского и русского!

Жаль, что нет Retigor’а; он когда-то анализировал АЧХ движков.
Возможно у Вас сбились настройки паузирования в Voice Manager. Попробуйте сделать паузы длиннее после точек и короче — после запятых. Или наоборот.
Ускорьте темп, вкл. зквалайзер (правда он слабый). Всё это позволит подобрать что-то приемлимое.

[. ]
Громкость также настраивается в Voice Manager, но по-моему она всегда должна там быть на 100%.
А так можно всё регулировать в системном Микшере громкости. У меня напр. сисзвуки = 10%, Алёна = 6%, а звук прибоя (мне его нравится слушать во время прослушивания книги) — равен 15%.

Я подготовил семпл, но это абсолютно субъективно:

< Acapela Алёна > Р. Хобб — Судьба Убийцы (proper v.)

Характеристики:
Темп — 104
Громкость — 100%

Пауза посл точки — medium
Все пр. паузы — very short

Фрагмент текста обработан корректором, несколько омографов изменены вручную, для чёткости добавлены пару-тройку запятых.
Программа Демагог, mp3, битрейт — 40000.

Diablerro писал(а): Mar 14 2018

Установил Алену от Акапеллы, лексиконы к ней, установил Демагог и множество словарей из рекомендованых на форуме.
Однако есть вопросы по подготовке текста к озвучке.

Как я понял, текст книги можно и нужно править перед озвучкой в самом tts редакторе.
Убирать ненужные объекты, менять озвучиваемый текст в расчете на аудио, а не на визуальное восприятие и т.п.

Но как быть с самой озвучкой, допустимо ли решать проблемы звучания правкой самого текста или все нужно стараться решить через словари?

Например, нужно ли в тексте вручную расставлять окончания числительных в тексте — «Глава 3 -я «, «в 1917 -ом году»?
Или это стоит решать через словарь регекспов?

Как решать озвучку инициалов в тексте?
Например при чтении «А . С . Пушкин» я получаю две длинные паузы конца предложения.
Надо удалять точки в тексте или правильнее опять же создать регесп например?

Где можно посмотреть мануалы по словарям в формате dic, а то меня смущают строчки начинающиеся со знака #, они случайно не закоментарены?

При озвучке всей книги можно ли tts редактору указать разбить выходные файлы именно по главам а не по объему текста?

В каких случаях нужно стараться править словари tts редактора, а в каких нужно лезть в лексикон самого голоса?

И пара конкретных вопросов для примера.

При озвучке перечислении глав у меня на фразе «Глава 3-я» глотается окончание «я», получается — «глава треть».

Мне не нравится, как движок озвучивает слово «Россия», глотается удвоение «с».

Читайте также:  Установка кондиционера на газель 3302

Подскажите пару примеров, как этого избечь через словари?

Главное принимать Алёну какой она есть. снисходительно и по-дружески, не стремиться к недостижимому.

Пр. правила:

  1. правильно подключить лексы
  2. правильно подключить словари к Демагогу, Балаболке. (как описано в соот. темах)
  3. настроить голос по своим предпочтениям (не ждите многого!)
  4. обязательно создать свой лекс и свой словарь замен (форумские материалы будут обновляться, и при замене файлов Вы можете потерять свои правки)
  5. перед применением Литературного текста выделите всё и сдвиньте текст вправо — Ctrl+Alt+ъ
  6. мне не нравится применение словарей » на лету» во время чтения. предпочитаю обрабатывать книгу предварительно. Для пакетной, поочерёдной замены воспользуйтесь скриптом Pronunciation adjustment.lua
  7. в настройках Демагога (вкладка Чтение) опция читать текст последовательными блоками с кол.
    символов — поставьте 5700

6 мин.

  • такое же значение пропишите во вкладке Сериалы. Там же отметьте опцию добавлять в начале и в конце название файла и номер части. При копировании на карты памяти файлы часто перемешиваются, а на плеерах не всегда есть дисплей. Название можно сократить
  • Доп. советы тут

    Алёна весьма капризна в разных TTS-программах некоторые слова, фразы она читает по-разному.

    В одном-двух случаях это можно подправить, но в третьем контексте снова будет не так. Мало того, есть свидетельства о влиянии на звучание конфигурации аудиокарты. и чисто субъективно наличие в системе др. голосов.

    Повторюсь ; не гонитесь за совершенством. у голоса множество минусов, но есть и немало плюсов. Вы же спрашивали про мудрости выработанные годами упорных медитаций . У меня это 9 лет уже. За это время Алёна сберегла моё зрение, и прочла полные собрания сочинений Кафки, Коэльо, Мураками, Льосы, Памука, Горького + отдельные книги других не менее именитых писателей.

    Подключите всё правильно, подготовьте текст предварительно. вкл. Читать и — абстрагируйтесь. Окунитесь в мир сюжета, на мелкие неувязки не обращайте внимания, к крупным отнеситесь как к насекомому — прожужжит и нет его.
    Тренируйтесь, через три-четыре месяца восприятие будет лучше. Желаю Вам отличных впечатлений от книг в исполнении Alyona Acapela. берегите глаза.

    Алёной не получится серьёзно озвучить терминологическую, экономическую и т. д. литературу (ещё одно эмпирическое правило).
    Все синт. голоса годны лишь для худ. литературы — любовь моя к Алёне велика, но Платона слушаю в исполнении И. Прудовского.

    а что программа не обновляет’ся больше с 2006 года?

    В сети много сборок давней в. Алёны. А так:

    «В 2013 разработана программа синтеза речи Infovox4 с аппаратным USB ключом активации.
    Infovox4 является инновационным программным обеспечением, позволяющим слабовидящим пользователям прослушивать текстовую информацию используя высококачественный синтезатор речи.

    Программное обеспечение Infovox4 представляет собой USB накопитель, позволяя пользователю подключиться к любому компьютеру без предварительной установки. Кроме того, infovox4 может быть предустановлен на 3-х ПК.
    Предустановленные версии программы будут работать независимо от наличия флеш-накопителя. ПО infovox4 включает в себя программы чтения с экрана, программу создания голосовых MP3-файлов, а также широкий диапазон выбора языков и голоса.

    [. ]
    в infovox 4 рекламируются голоса Colibri — как я понял, повышение темпа речи + улучшенная чёткость.

    01.07.13
    Ajaja пишет:
    For some of the voices there are 2 versions available.
    • High Quality (HQ), with a larger download file and providing a more natural voice and pleasant reading
    • Colibri (CO), with a smaller download file, a slightly more robotic sound, but more flexible and higher intelligibility at faster reading speed.

    Алена версии Colibri проигрывает HQ по всем статьям, включая разборчивость на больших скоростях. Кажется, ее прикручивали к Colibri одной левой. Там даже бегунок Pitch не работает (хотя, я не понял, чем эта нстройка вообще от Shaping/VocalTract должна была отличаться).

    Что касается HQ голоса, то небольшие отличия есть. И в произношении, и в интонациях. Но в целом голос звучит малоотличимо от версии в Infovox3. И старые глюки остались. Например, «когда мы имеем» все так же говорит как «когда же мы имеем» или «думает на протяжении» как «думает что на протяжении». Кстати, в Colibri этих глюков нет.

    balabolka писал(а): Apr 13 2018

    Fabe
    Версия Infovox4 была выпущена в 2013 году. После этого выходили обновления; например, в 2013 году интерфейс всех утилит в составе Infovox4 перевели на русский язык; в том же году добавили 2 английских голоса, испанский и польский голоса (причем, английский и испанский голоса озвучивал один и тот же человек).
    В 2015 году добавили 12 детских голосов (русского нет), добавили поддержку Windows 10.
    В 2016 году улучшили ударение в словах, а также научили голоса читать специальные символы (например, греческие буквы в математических формулах).
    В основном, выходят мелкие обновления Infovox4, касающиеся поддержки NVDA.

    Программный продукт стоит 400 евро. Лицензия позволяет скачивать и устанавливать любые голоса (для этого в составе Infovox4 есть загрузчик Download Manager). Правда, шведские и норвежские голоса продаются отдельно, в скандинавской версии Infovox4, которая стоит 900 евро.

    Сохранились файлы-образцы, демонстрирующие звучание Alyona infovox4, предоставленные P@S@f для анализа и оценки — вирусов не обнаружено (проверялось ESET Smart Security Premium, в. 11.1.42.0).

    Alyona22k (HQ)
    Alyona22k (CO)

    источник

    Установка голосового движка алена

    Голосовой движок Acapela Alyona (русский) — самый лучший на сегодняшний день.
    Компания Acapela выпустила новый русский, женский голосовой движок, который получил название Алёна, работает на SAPI-5 с частотой 22 КГц , по качеству синтезируемой речи, тембр голоса и интонация по мнению пользователей приятны на слух! Так же добавлю что лично мне движок понравился — произношение просто отличное, но встречаются ошибки — поэтому составление словаря должно исправить положение.

    ICE Book Reader Professional может всё, что нужно для комфортного чтения:
    — Имеется три режима просмотра: плавный скроллинг, режим автоматического листания и режим ручного листания.
    — Может читать тексты из TXT, HTML, XML, RTF, документы Microsoft Word, книги PALM (.PDB и .PRC), книги PSION/EPOC (.TCR), книги Microsoft Reader (.LIT), Microsoft HELP files (.CHM) и FictionBook файлы (все версии) (.FB2, .XML).
    — Чтение книг с большого расстояния от монитора, как если Вы смотрите телевизор Вы можете лечь на диван или сесть в кресле на расстоянии 2-3 метров от монитора. Ваш позвоночник не будет уставать от длительного сидения на стуле.
    — Имеет «книжный» режим, позволяющий использовать скины, создаваемые пользователем и показывать рядом 1, 2, 3 или более страниц с произвольным их положением на экране и произвольного размера.
    — Может читать файлы напрямую из архивов: ZIP, RAR, ARJ, LZH и HA. Внешние архиваторы не требуются.
    — Ультра плавный скроллинг текста со скоростью от 1 до 500 линий в секунду. Прецизионный контроль скорости скроллинга необходим для комфортного чтения. Скроллинг текста реализованный в других приложениях используя третью кнопку мыши не позволяет точно контролировать скорость скроллинга.
    — Помнит положение в файле для каждого файла. Также для каждого можно сделать неограниченное число закладок.
    — Имеется полная поддержка чтения вслух, используя Speech API SAPI4.0 и SAPI5.1
    — Может создавать MP3/WAV файлы из книг. Поддерживается автоматическое деление файлов.
    — Имеет встроенный будильник.
    — Может создавать видео книги, которые можно читать используя любой DVD плеер и многое другое.
    — Вместе с движком поставляется Lexicon Manager — редактор словарей, который позволяет изменять произношение слов как буквенно, так и фонетически.

    Text-to-speech engine или движки синтеза речи — это программы выполненные в виде системного драйвера, предназначенные для преобразования текста в речь. Движки синтеза речи не имеют внешнего интерфейса, поэтому для того, чтобы Ваш компьютер заговорил, недостаточно установить только движок. Для использования движка необходима программа синтеза речи (TextAloud, Cool Reader, Balabolka и т.д), которая выполняет роль интерфейса, позволяет работать с движком, изменять его настройки, звучание речи, использует дополнительные возможности. В нашем случае это программа Ice Book Reader.
    — Программa для всех тех, кто предпочитает читать электронные версии книг вместо их бумажных аналогов. ICE Book Reader Professional поддерживает множество форматов (TXT, RTF, HTML, MS Word, PALM books (.PDB и .PRC), LIT), умеет читать файлы из архивов ZIP, RAR, ARJ, LZH, HA без использования внешних архиваторов.
    — Создан для того, чтобы сделать чтение текстовых файлов (электронных книг) удобным и комфортным. Почему это важно ? Чтение HTML страниц, документации или почты сильно отличается от чтения электронных книг. Чтение книг требует гораздо больше времени. Поэтому нагрузка на глаза гораздо сильнее. Кроме того, чтение книг это процесс обычно непрерывный. В то время как во время чтения HTML страниц, чтение постоянно чередуется с коротким отдыхом. Это означает, что для чтения книг следует создавать более комфортные условия. В противном случае глаза будут быстро уставать и появляется серьезный риск ухудшить свое зрение. Основная задача ICE Book Reader Professional — это сделать все возможное для предотвращение ухудшения зрения во время длительного чтения.

    Операционные системы: Windows 2000,Windows XP,Windows Vista, Windows 7
    Год выпуска: 2009
    Разработчик: Acapela, Inc.
    Размер файла: 177 Мб

    Мне больше нравится : Голосовой движок Ольга и Loquendo TTS7 Voice Experience 7.4.0 (Он есть на этом сайте)


  • Deposit Files:
    Ссылка нажимай

    источник