Организация Wikimedia Sweden и Королевский технологический институт (Швеция) объявили о разработке совместного проекта Wikispeech по созданию системы синтеза речи для Wikipedia.
Организация Wikimedia Sweden и Королевский технологический институт (Швеция) объявили о разработке совместного проекта Wikispeech по созданию системы синтеза речи для Wikipedia.
Разработка ведётся при участии Йоакима Густафсона (Joakim Gustafson), профессора, возглавляющего центр речевых технологий, наработки которой используются в таких проектах как GNU Speech и Snack Sound Toolkit. Система будет развиваться в качестве открытого проекта и сможет быть легко интегрирована на любой сайт, использующий движок MediaWiki.
В первую очередь возможность голосового чтения содержимого страниц свободной энциклопедии будет востребована людьми, имеющими проблемы со зрением. При этом, технология может оказаться полезной и обычным посетителям - по данным Wikimedia Sweden, около 25% посетителей Wikipedia, а это около 125 млн человек в месяц, предпочтут, чтобы статья была прочитана компьютером.
В первую очередь будет обеспечена поддержка шведского, английского и арабского языков, поддержка которых будет готова к сентябрю 2017 года. После отладки системы на этих языках планируется реализовать поддержку оставшихся 280 языков, на которых имеются статьи в Wikipedia.
По аналогии с совместным развитием статей Wikipedia, к усовершенствованию акустических моделей планируется привлечь сообщество.
В качестве отдельного сопутствующего проекта также упоминается работа по улучшению моделирования фразовых интонаций в системах синтеза речи. Сформированные для синтезатора наборы данных будут свободно распространяться в соответствии с правилами Wikimedia Commons.