eSpeak

Покрай Виктор Кирилов от много време знам, че незрящите спокойно работят с компютри, като слушат изписаното на екрана през гласови синтезатори. Дълго време това ги обвързваше към DOS, тъй като свестен синтезатор за български език имаше само за него. От няколко години вече има прилични синтезатори и за Windows. За Linux обаче няма и до момента, и това принуждава повечето незрящи да използват Windows – дори тези, които биха предпочели свободния софтуер.

Затова и се зарадвах, като Виктор наскоро ми писа за един чудесен гласов синтезатор, който е свободен софтуер – eSpeak. Проектът ми изглежда изключително добре премислен и пипнат. Единственият му недостатък е, че все още няма възможност да синтезира български език.

А хубавото е, че това не е никак трудно да се добави. Разработчиците са изявили желание да помогнат. Нужен им е единствено филолог, който да им даде нужния фонетичен анализ за българския език. Намери ли се такъв, немалко незрящи ще са щастливи.

Затова се обръщам с молба към всички, които четат това: разпитайте дали около вас няма такъв човек. По възможност да не е от най-биещите се в гърдите. (Не защото ми се зловиди, а защото когато ръцете ти са заети с биене в гърдите, нямаш с какво да вършиш работа.) Ако случайно откриете такъв, помогнете му да се свърже с разработчиците на eSpeak. Ако не знаете как, пишете ми – ще помогна за свързването с удоволствие. (Адресът ми е григор@гачев.инфо, на латиница, както в домейна на сайта.)

Благодаря предварително на всички, и от сърце!

23 thoughts on “eSpeak

  1. Виктор

    Всъщност вече има български в eSpeak. Дори е доста добър, като се има предвид, че е правен от човек, който не знае български. Молбата на човека е за хора, които имат представа от тия неща, българи, които да му помогнат.

    Reply
  2. Васил Колев

    Тия дни бях тръгнал да търся на Борислав Захариев програмата за произнасяне на български език и пак забравих, но си мисля, че даже и тя се справяше много добре – българският е сравнително лесен за произнасяне (нищо общо с ужаса на английския). Оня source дали би свършил работа?

    Reply
  3. CTEHATA

    Захариев синтезираше честоти и ги модулираше, имитирайки модулациите от език, зъби, устни и т.н.
    Днешните синтезатори по-скоро сглабят предварително записани фонеми, доколкото знам.

    Reply
  4. Виктор

    Васил Колев, Борислав Захариев, да е жив и здрав, никога не ни е давал сорсове. Вярно, по едно време Хюсеин Исмаил (с нулево зрение) си соурсва сам нещо, трябваше нещо да попреправим, но сам си го затри тоя соурс без да иска. После Торос Хованесян преправя малко програмата, даже я нещо шифрова и компресира, но това беше колкото да не е без хич. Правилата, вкарани в тоя синтезатор, прочее наричан най-накрая Betsy, могат да се видят, така да се каже с просто око, даже и ако самото exe се отвори с вюър. Но аз не зная бъкел английски, та не мога да помогна дори с това на човека с eSpeak. Ето я програмата на Захариев тука http://bezmonitor.com/toros.zip
    Програмата е писана на асемблер. Да го напиша и това, че много хора са ни искали соурса, като са мислили, че е например на C. 🙂
    В българския голям проблем са ударенията, защото за много малко думи могат да се сложат някакви правила, така че, трябва голям-голям речник с ударения. В Захариевия синтезатор ударения няма, но като го послуша човек, свиква и не му прави впечатление, че няма ударения. (Има ударения на десетина думи, та като на другите няма, думите с ударения дори леко дразнят.) В SpeechLab, съвременния български хубав синтезатор, има речник с ударения, и затова той е толкова добър, че наистина се приближава до говор на жив човек.
    CTEHATA, Днешните синтезатори са и от двата вида. И такива със записван човешки глас и после сглобяван от фонеми или каквото е там, а и също такива като на Захариев, формантни, (ако се не лъжав точния термин). Специално eSpeak е синтезиран, не е с човешки глас, но все пак от онова време насам компютрите станаха по-мощни, та има синтезатори, в които човешки глас не е използван, но са си добри, дори много добри, като Eloquence for JAWS. Човек, (Ивайло Маринов), който участва в правенето на SpeechLab ми каза, че носещата честота на eSpeak не е добра, което и аз чувам, но не съм вътре в терминологията, та не мога повече да кажа. Във всеки случай, поне в момента, синтезаторът на Захариев е много по-добър от ESpeak, по отношение на звука. Но за съжаление работи само в ДОС и в промпта на 98.
    Ето и две файлчета
    http://bezmonitor.com/betsy.mp3
    Това е синтезаторът на Захариев, но аз съм се постарал, написах даже ударения в думите, че да звучи по-добре конкретният файл.
    http://dhv.hit.bg/temp/espeak_bgvoice_demo.mp3
    А ето и българския на eSpeak, но трябва да се има предвид, че този файл изобщо не е нагласяван, просто младежът Костадин Колев от Пещера, който прочее ни каза за тая разработка, пусна през eSpeak едно от писмата си до пощенския ни списък http://groups.yahoo.com/group/bezmishka/message/16537?var=1

    Reply
  5. Ивайло Вълков

    Може да се обадиш в пощенския списък на преводачите на свободен софтуер – dict at fsa-bg.org. Някой може да се отзове там.
    В уикито на проекта за превод на GNOME има „Грандиозни задачи“ [1], където има списък със синтезатори на глас, добавени от координатора Александър Шопов. Свободен софтуер са. В момента нямаме сили да реализираме синтезиране на български език. Не ми е известно някой да работи по това.

    [1] http://fsa-bg.org/project/gtp/wiki/ToDo

    Reply
  6. Шapкан

    Гриша, извинявай за офтопа…
    интересно ми е твоето разсъждение как ще се отрази на света катастрофата в Япония. Интерсно ми е и мнението на обичайните коментатори на твоя блог.

    По темата: мога само да се радвам, че има софтуер, който разширява достъпа както до компютър, така и до мрежата.
    И понеже същата Япония се смята за лидер в системите, клонящи към изкуствен интелект, как стоят там нещата с компютрите за незрящи?
    Изчетох някои неща от рунета по въпроса, но не мога да им дам достатъчно компетентна оценка.

    Благодаря.

    Reply
  7. Атанас Боев

    А някой знае ли какво се случва с Борислав Захариев? В Канада ли е?

    Reply
  8. Виктор

    Не зная нищо за Япония и софтуерът им, Шаркане. Един приятел ми разказваше, че като били на … май на олимпиада беше, някаква японка ги развеждала нещо там, и някакъв лаптоп с Уйндоус разнасяла. Нашият човек, за да се направи на българин, натиснал от Run command, май 98 беше тогава, и написал dir и още нещо, та японката помислила, че й е скапал компютъра, притеснила се, ама нашият праснал едно exit и тя се усмихнала, взела го за голям хакер. Поне така ми разправяше.
    Силно се надявам земетресението в Япония да направи ядрените централи по-сигурни, само дано не даде фира някой реактор. Дано тия проблеми сега да са достатъчно подсещане от Дядо Боже за всички.
    Атанас, за Захариев аз нищо не зная, преди 5-6 години един приятел каза, че му е отговорил по и-мейл, от Канада, нещо по повод синтезатора беше. Обаче си спомням как говорих по телефона със Захариев малко преди да замине и му пожелах някак най-невинно да се върне скоро. Той обаче подчерта дебело, че заминава и не иска да се връща.

    Reply
  9. Djgeorgie

    Григор, аз не мога да помогна с познат лингвист, но искам да подчертая нещо. Повечето незрящи хора в България, а и не само, не са напреднали потребители, което прави нещата малко сложни с използването на Линукс от тях, ако и с перфектен глас да е той. Просто свободните програми не са стандартизирани до степента в която те са стандартизирани в Windows или Mac. Факт е, че има много добри свободни програми които биха работили чудесно на Убунту дистрибуция с Гном и Orca, напр. но повечето се справят ужасно с достъпността и наистина системата става адски нестабилна и реално неизползваема за комерсиални и не само цели. Тествал съм какво ли не, но от опит ти казвам, че колкото и несимпатични да са ми Microsoft, по-добро от Windows и JAWS на Freedomscientific поне в близките 10-тина години, не вярвам да се появи, което да е някаква макар и близка алтернатива. В момента има един нов и безплатен screenreader, който се казва NVDA, обаче и той още не е напълно читав и има още какво да се желае от него, макар, че е класи над Orca все пак. Голямата дилема на Линукс дистрибуциите е, че различните програми имат различен интерфейс, което направо ошашква повечето начинаещи и средно-напреднали потребители, защото, представи си как ще си визуализираш в мозъка интерфейс на програма, която не използва стандартния интерфейс на операционната система с който ти си свикнал до болка, ако никога не си виждал какво е toolbar или slider. Между другото, точно същото нещо се получи и когато Microsoft промениха изгледа на Office 2007 от стандартния. Макар и достъпен, повечето слепи потребители отказаха да го използват поради точно тази причина. В Windows има адски много недостъпни програми също, тъй-като просто за Windows има огромен брой заглавия, но пък най-популярните и често използвани, в повечето случай или се поддържат от JAWS или имат написани скриптове за тях, които при добавянето им към JAWS просто правят нещата абсолютно поносими за работа и стандартизирани.
    За Мак не ми се и коментира въобще, просто Apple са на светлинни години със out of the box достъпността на продуктите си и от Windows. Удоволствие е да се работи с Mac или iPhone и наистина си пожелавам от все сърце, някой ден, да имам щастието да работя с такъв кеф и на Ubuntu и Windows без да се налага да използвам screenreader който струва, нещо от сорта на 10 Български заплати или който трябва да настройвам часове чрез конфигурационни файлове, за да го подкарам както аз си искам.

    Reply
  10. Виктор

    Какво ще рече нестабилна, Георги, почва да гърми като Уйндоус ли?
    Иначе, и аз не съм виждал нито тулбар, нито слайдър, ослепях преди да се появят, но през скрийн рийдърите си ги ползвам. Е, все още ми е по-лесно да си сверя часовника през промпта, отколкото през графична среда, ама какво да се прави.

    Reply
  11. Божо

    @Djgeorgie – извинявай, но какви програми според тебе ползва един незрящ, за да трябва да бъде “напреднал потребител”. 😀
    Като те графичните програми въобще не ги ползват, по обясними причини. Всъщност реално нямат нужда от графична среда 😉
    Пак тия митове, колко неудобен бил Линукс за “ненапреднали” потребители.
    Виктор отдавна беше писал изчерпателно по въпроса:
    http://bezmonitor.com/pc_blind.htm

    Reply
  12. Виктор

    Божо, това, което сочиш на сайта ми остаря много, нещата се промениха, което е много хубаво, щото се промениха към по-добро. Иначе, ползваме графични неща, няма как, не защото ни харесват, а защото неграфичните остаряха, с тях почти никаква работа не може да се свърши. Имам предвид разбира се неща като IE, Файърфокс, всички слепи вече тях ползват, даже аз вече много рядко пускам Lynx. Фотошоп не ползваме, не може, естествено, но най-популярните програми стават за ползване от слепи, благодарение на модерните скрийн рийдъри. Почти няма вече сляп човек, който да не владее чата в Скайп много по-добре отколкото някой мейл-клиент. Това става с две патерици, така да се каже, скрийн рийдър и още специални скриптове към него, та между слепия и Скайп застават две неща, които са посредници, и така… За съжаление нямам време да си пиша по сайта, разчитам, че ме замества http://bezmishka.org

    Reply
  13. Виктор

    ОЩе нещо да кажа: Младежът Георги Живанкин по-горе е прав за почти съвсем всичко, но той е от хората, които са вътре в компютрите, даже май това учи сега в UK, дори попрограмирва малко нещо на PHP, а може и на друго, но не общуваме често, та не знам повече. Основната причина, поради която писах на Григор за българския говор в eSpeak е, че вече има, а когато стане и по-добър, още повече ще има, така да се каже, българска реч в Линукс. Много слепи хора, които не са вътре в компютрите, както Георги, вероятно биха предпочели все пак Линукс, въпреки недостатъците му за слепи спрямо Уйндоус. На много слепи хора ще е достатъчно да си четат книги, да си гледат пощата и да си ходят по интернета с Линукс. Няма да купуват ни Уйндоус, ни скрийн рийдър, нито пък ще се разправят с антивируси, които напоследък май са по-голям проблем от вирусите. Досега ги спираше това, че нямаше българска реч в Линукс, и изключително радващото е, че вече има eSpeak с български. Когато стане по-добър тоя говор, ще има и повече слепи българи, които ще ползват Линукс. Малко разхвърляно се изразявам, понеже бързам, та прощавайте.

    Reply
  14. Захари Юруков

    Всичко е въпрос на навици, според мен.
    А за хора които нямат такива е още по-лесно.
    Е, в началото винаги е трудно, но същото се отнася и за windows.
    а да не забравяме и проекта vinux ( http://vinux.org.uk ).
    все от някъде трябва да започне разчупването на модела windows-Jaws.
    вече се спомена и за nvda.
    Мога да ви уверя, че с малко упражнения работата не е по-трудна или по-лоша от тази с jaws.
    най-важното е да имаме някакъв избор, апък кой какво ще избере си е негова работа.

    Reply
  15. Виктор

    Захари, много зависи на кой какво му трябва, кой какво иска да прави. Понякога почти няма избор. Ако ти трябва нещо, без което няма да се справиш, и това нещо е само едно, избор няма. И ние всичките говорим, слепите, ама всичките сме с най-доброто, най-скъпото, нищо, че имаме избор и много обичаме свободния софтуер.

    Reply
  16. Djgeorgie

    Всичко което Виктор ви е написал е абсолютно вярно. Ето само един пример. Скайп за Linux е абсолютно недостъпен в тази си форма. Голям процент от слепите хора са си купили компютър за да ползват Скайп. Сега, зная, че ICQ, MSN и прочее са алтернативи, проблемът е, че не става въпрос за алтернативите, а за точен работещ аналог на нещо работещо в Windows. Ако това нещо го няма или няма работещ аналог, как да стане компромисът, как напр. аз да убедя начинаещ сляп потребител, че да, това е много хубаво нещо Линукса, обаче той няма да може да си ползва Скайп за да си пише с приятелите, няма да може да си ползва плейъра за филми който му чете субтитрите щото просто такъв плейър няма дето да може да чете субтитри в Линукс и т.н. и т.н. Въобще, нещата са комплексни и далеч не са толкова елементарни.

    Божо, в днешно време всички слепи потребители ползваме графичен софтуер, малко са тези които са свикнали с команден интерфейс, а някои дори никога не са виждали какво изобщо представлява това животно и точно от това идва проблема, че ако дадения софтуер не е скриптиран така, че всички графични елементи в него да са описани и скриптирани, той е абсолютно неизползваем. В това отношение Freedomscientific за момента се справят най-добре, тъй-като са създали система чрез която карат техния четец да работи с различните програми, версии и Windows операционни системи по идентичен начин и благодарение на това, слепите хора в момента се радват на достъпност, невиждана до момента.

    Иначе съм съгласен, че трябва да се тръгне все от някъде и направата на хубав Български глас за Линукс би било едно наистина добро начало на този процес.

    Reply
  17. Pingback: Grigor Gatchev – A Weblog » Blog Archive » Земетресението в Япония – фактите и изводите

  18. Ивайло Вълков

    @Djgeorgie, това, което пишеш за Скайпа е вярно основно, защото не е свободен софтуер (някои му казват отворен код, но не е съвсем същото). Проблемът не е в GNU/Линукс, а в това, че от Скайп не са го програмирали за твоите нужди. Вероятно точно това е проблемът. Не знам със сигурност, не ползвам Скайп.

    Например графичната среда GNOME има слой за достъпност, който позволява (теоретично) използването на програмите от всеки. Никога не съм използвал тази възможност и не знам в какво състояние е наистина. Не съм незрящ.

    Хубавото при свободния софтуер, е че всеки може да се включи, както се случва с eSpeak.

    Reply
  19. Захари Юруков

    Здравейте,
    с цел информация, координация и избягване на дублация,
    регистрирах следния пощенски списък:
    espeak-bg@freelists.org

    Можете да се запишете като изпратите писмо на:
    espeak-bg-request@freelists.org със subject ‘subscribe’
    или от страницата на списъка:
    http://www.freelists.org/list/espeak-bg

    Всеки на когото му допада този проект и иска да се ангажира в развитието му е добре дошъл.
    Списъка има и публичен архив чрез който всеки може да следи как се движат нещата.
    Новите постове може да се следят и чрез RSS.

    Reply
  20. Djgeorgie

    @Ивайло Вълков:
    Съгласен съм с това, че проблемът в този случай е не, свободният софтуер, а Скайп. За Gnome – да, има слой за достъпност и от време на време го тествам на виртуална машина за да съм горе-долу наясно до къде са стигнали нещата. За жалост не съм програмист на c++ или c, а разбирам от PHP, SQL и от тоя сорт неща и просто няма как да се включа в разработката на достъпен и свободен софтуер, иначе бих го направил на драго сърце.

    Reply
  21. Николай Филипов

    Здравейте!
    Ето, че „кръгът се затвори“: пиша от машина Asus Eee PC 701 4G, която от известно време възстанових и подкарах с УСУ 7.0.22. Първоначално имах проблеми с ограниченото място, но успях да реша всички въпроси, в т.ч. да подменя пакета Офис от варианта Нетбук на УСУ с Офис към варианта Мини на УСУ 7. И като последно добавих гласовете от eSpeak 1.46.16 в УСУ. В резултат на това Gespeaker проговори български.

    Но да се върнем в началото. А началото е, че младежът Костадин Колев (човекът писал до разработчика на eSpeak) е мой приятел. Заслугите са негови. Той е незрящият, не аз. Но някак винаги съм искал да помагам и да насърчавам незрящите. Познавам и Ивайло Маринов. Още от времето, когато нямаше SpeechLab. Знам за всички усилия, но бих искал в този коментар да отговоря на Ивайло Вълков. И така да „затворя кръга“. С нещото, от което започна всичко…

    Познавам Коста от Скайп. Аз съм единия от двамата български преводачи. Бетатестер също. Благодарение на Коста, а и на други незрящи потребители, бяха оправени много грешки и несъвместимости. Не искам да се спирам. Станахме и приятели. Без да сме се виждали. Та много се радвам, че има такива хора, като него, защото сега разгледах българския списък на eSpeak и „се запознах“ с чудесния двигател на проекта Захари Юруков. Също незрящ. Вярвам, че те ще успеят. И всички трябва да ги подкрепяме.

    Но мен лично много ме огорчава мисленето на г-н Вълков: с това делене на наше и ваше затова сме дотук. С това цепене на съществителни и отглаголни/повелителни сме се докарали дотам, че като ползваш Уиндоус и Мак на български е едно, а ако минеш на Линукс почваш да учиш български от начало. Болно ми е също, че всичко се мисли и прави на парчеи с конретна цел. Никой не мисли какво ще стане по-нататък.

    Говоря като преводач на софтуер, но същото може да се отнесе и до разработката, мисля.

    И сега на въпроса за достъпността на Скайп: най-добра е тя в клиентите за Mac OS X и iOS. После в клиента за Wndows. И накрая някаква в Linux. За другите клиенти не мога да говоря (засега не поддържаме мобилен клиент на български). Какзвам някаква, защото си говоря с хора, които са незрящи и тестват програмата за Linux, но те нямат софтуер, с който да проверят как стоят нещата на български. Нито могат да ползват локализирана на български дистрибуция. С Коста съм говорил да ме свърже с такъв българин, но няма и няма. Значи причината е другаде (както основателно посочи Djgeorgie). С достатъчно аргументи.

    В ежедневието си иначе съм потребител на Mac. Ползвам и останалите, но предимно OSX и iOS. Мисля, че не съм пристрастен, но достъпността е политика. Политика на Apple. Три примера:
    1. За превода на прост диалог с 5-6 реда в OSX имаме поне още толкова, а понякога 2-кратно повече низове под формата на gTooltip или Accessibility.
    2. При прехода от Skype 5.5 към 5.6 за Windows бяха включени стотици специални редове за поддръжка на достъпността. И се увеличават в следващите спринтове.
    3. В момента правим нещо по клиента за Linux. Не наблюдавам подобен процес.

    Правете си изводите сами. Иначе съм във възхита от УСУ. И аз искам незрящите да се освободят от игото на Майкрософт. И аз искам с 1 милион поне от тия пари, които ще им подарят, да се разработва глас и морфология, които да не са само за ена платформа, а да стъпят на всички и да са безлатни за българите, но първо трябва да се подобрят нещата при отворения код (инструментариума) и да pomognem българския da stane официален език на eSpeak.

    A Г-н Вълков нека „не ползва, и нека да знае“, че Скайп е недостъпна програма, но реалността е съвсем друга: преди време с Коста си говорехме по проблеми за достъпността на Скайп и той ми спомена за eSpeak…

    🙂

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *