WebSound.ru Home
    Главная | Комментарии | Архив выпусков | Форум и чат | AudioTag.info | Музоблог | reTracked | Авторский блог  



  Поиск:

Поиск по WebSound.Ru:
Поиск в Интернете:
Powered by




  Партнеры, реклама:




Audio watermarking
TrustedAudio.com



 

Синтез речи - некоммерческий авторский "движок"

Друзья, совсем недавно ко мне обратился читатель Grygoriy Yusim вот с таким письмом (позволю себе его процитировать):

Уважаемый Александр!
Недавно прочитал Ваш краткий обзор "Синтез речи" (165-й номер), который был написан ещё в 2007-м году. Прежде всего, замечу (и, видимо, это известно и Вам), что в последнее время появились достаточно неплохие новые синтезаторы русской речи такие, например, как Acapela-Group (Алёна), Loquendo (Ольга) и другие. На ряде сайтов, например, на http://mytts.forum2x2.ru русскоязычные пользователи активно разрабатывают для этих программ различного рода вспомогательные средства (словари ударений, фонетические транскрипции слов, ё-фикацию и др.) Основным недостатком этих программ является то, что они являются коммерческими и поддерживаются зарубежными фирмами. Пожалуй, единственной отечественной (точнее, белорусской) разработкой является программа Sakrament, которая, к сожалению, также является коммерческой. Свой обзор Вы справедливо завершаете выводом о том, что ни один из рассмотренных Вами некоммерческих "проектов по качеству речи не дотягивает и близко к коммерческим конкурентам. Про русский язык - и речи нет..." Полностью с Вами согласен. Тем не менее хочу предложить
для Вашего рассмотрения синтезатор русской речи, который в течение ряда лет разрабатывался мною в рамках общественной организации "Окно в мир" (г. Киев), вице-президентом которой я являюсь. Эта организация  ориентирована на компьютерную поддержку незрячих и слабовидящих пользователей. 
...
...
Если Вас этот синтез в какой-то мере заинтересует, то я готов выложить инсталляционные файлы синтезатора с
SAPI 5 интерфейсом для того, чтобы Вы могли посмотреть его работу с озвучиванием произвольных текстов. Кроме того, в будущем я готов передать и исходные тексты. Поверьте мне, что это большой объём кода в Visual 7 C ++, и мне в связи с моим возрастом и состоянием здоровья одному очень сложно поддерживать эту разработку. А здесь есть ещё много, над чем нужно поработать. И мне кажется, что работа над подобным проектом была бы весьма интересной в рамках Вашего авторитетного журнала.

Меня конечно же заинтересовала данная разработка и я с радостью согласился опубликовать её и разместить в базе программ WebSound.Ru. Программа разместилась на страничке с речевыми программами.

Итак,

вашему вниманию предлагается версия некоммерческой программы синтеза русской речи RusEngineS5_22. Предлагаемая программа позволяет озвучивать произвольные тексты, написанные на русском языке, с возможными  англоязычными вставками. Работает в операционных системах Windows 95/98/Me/2000/NT/XP/Vista при наличии установленного пакета SAPI5.  Программа позволяет работать  с различными Windows-приложениями, совместимыми с SAPI5 интерфейсом. В частности, данная программа  обеспечивает возможность работы с  программами чтения экрана, предназначенными для людей с проблемами зрения (такими, например, как JAWS for Windows, Virgo  и др.). Программа обеспечивает автоматическую простановку ударений в словах, ё-фикацию, а также перевод, транскрибирование или спеллинг встречающихся в русском  тексте английских и слов и сочетаний. Для установки программы запустите файл RusEngineS5_22.msi и следуйте соответствующим инструкциям.

Эта версия программы разрабатывалась мною на общественных началах в период 2005-2008 г.г. на базе моих разработок, выполняемых в общественной организации «Викно в Свит» (Окно в мир) г. Киева, начиная с 2000 г. В работе над данной версией программы мне оказывал существенную поддержку мой коллега, инвалид 1-й группы по зрению (тотально незрячий) – Олег Ростиславович Кутищев, в честь которого и назван голос синтезатора («Олег»). Реально же  звуковая аллофонная  база синтеза создавалась на основе студийной записи заданного набора слов голосом  диктора областного радио г. Житомира Николая Черевко, которому автор выражает искреннюю признательность.

Разумеется, автор отдаёт себе отчёт в том, что данному синтезатору сложно конкурировать с появившимися в последнее время  коммерческими синтезаторами зарубежных фирм (Acapela Group-Алёна, Loquendo-Ольга, ScanSoft-Катерина). Тем не менее, данная разработка, по его мнению, имеет хорошие потенциальные возможности для  её улучшения, и в рамках определённого некоммерческого проекта с привлечением заинтересованных людей можно было бы существенно продвинуться в направлении создания более качественного синтеза.

Я установил к себе на компьютер этот движок и он сразу же заработал (кстати, под Windows 7). Я предлагаю вам послушать в качестве примера синтезированную речь с текстом из шапки WebSound: example-oleg.mp3 (81 Kb). На мой взгляд, эта речь звучит однозначно не хуже того же самого Digalo.

Как упоминал сам Григорий, он вполне готов раскрыть исходные коды программы, если появятся желающие дорабатывать и доводить её до ума. Я думаю, что это тот редкий случай, когда появляется возможность получить исходные тексты вполне жизнеспособной и полезной программы, и общими усилиями довести её до ума.

Если есть желающие/заинтересованные в этой затее - пишите в комментариях и, я думаю, всё можно будет организовать.



 

Читать весь 190-й номер 
Перейти в архив выпусков WebSound.Ru 



Ниже располагаются комментарии к этой заметке

Пожалуйста, обратите внимание! Если вы хотите что-то сообщить автору WebSound.Ru, лучше сделать это не здесь, а направить ваше сообщение по e-mail. Пожалуйста, составляйте свои комментарии в вежливой форме. Не засоряйте сайт бессодержательными и невежливыми сообщениями.


comments powered by Disqus