CCBot/2.0 (http://commoncrawl.org/faq/)
Статьи
08.09.2017
 Как выбрать станок ЧПУ
Чтобы ответить на этот вопрос, нужно, как минимум, обладать многолетним стажем и опытом работ с подобной техникой.

Интервью
03.02.2017
 Как вентиляция и канализация могут сделать вашу жизнь не только удобней, но и богаче
КУРГУЗОВ
Игорь
генеральный директор
ООО «Оборудование Профессионалам»
О том, почему дела с ЖКХ в России обстоят плохо и что с этим делать

Центр Речевых Технологий создал первую технологию по распознаванию слитной русской речи

Добавлена: 29.01.2008

Компания «Центр Речевых Технологий» первой в истории завершила работу над технологией распознавания слитной русской речи на 30,000 словоформ – «Руссограф». Инновационная разработка российской компании открывает новые возможности в общении человека с техникой на русском языке. Работы над проектом продолжались более 3 лет, а собственные инвестиции компании в разработку составили порядка $5 млн. Новая технология позволит компании выйти на рынок с целым рядом принципиально новых продуктов.

Оригинальная российская технология распознавания «Руссограф» создавалась с учетом фонетических и грамматических особенностей русского языка. Существующие на западе системы распознавания созданы для работы с английским, испанским и другими популярными языками и малоприменимы в работе с русской речью. Это связано с тем, что русский язык принципиально отличается от других языков не только фонетически (например звуком «ы»), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не представляется возможным.

Для разработки технологии «Руссограф» ЦРТ создал научно-исследовательскую группу из специалистов в лингвистике, фонетике, математике, обработке сигналов и программировании. Для работы над проектом в ЦРТ использовали уникальный для России набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи. Для создания языковых моделей в ЦРТ была собрана текстовая база русского языка объемом 35 миллионов слов. Поскольку создание качественной системы распознавания невозможно без обширных экспериментальных исследований, в ЦРТ был развернут мощный вычислительный кластер с производительностью около 1012 операций в секунду. Важной частью проекта стало создание базового речевого декодера, который используя оригинальные акустические и языковые модели русского языка преобразовывает речевой сигнал в текст.

Промышленное внедрение технологии распознавания «Руссограф» отрывает новые возможности голосового управления компьютерной и бытовой техникой, промышленным оборудованием и транспортом; управления службами и сервисами по телефону; систематизации фонограмм и поиска по аудио архивам, а также обеспечения безопасности людей и объектов. Особенно актуальной новая разработка может стать для тех русскоговорящих людей, чьи физические возможности ограничены.

Сейчас ЦРТ работает над аппаратной реализацией технологии. Уже в 2008 году компания предложит несколько продуктов построенных на основе технологии распознавания, в частности систему интерактивного голосового управления для контакт центров, а так же системы управления промышленными объектами.

В перспективе компания планирует создание на базе технологий распознавания и синтеза карманного переводчика устной русской речи. Данный продукт может быть подготовлен уже к Олимпиаде-2014 в Сочи. Таким образом, участники и гости Олимпиады из разных стран смогут говорить и понимать друг друга без посторонней помощи, даже не зная иностранного языка.

Напомним, что в начале этого года, в своих прогнозах на развитие компьютерных технологий второго цифрового десятилетия, Билл Гейтс назвал создание естественного интерфейса одной из приоритетных задач человечества, отметив, что технологическое будущее – за голосовым управлением и распознаванием речи. Благодаря технологиям разработанным в ЦРТ, Россия вошла в число мировых лидеров в области речевых технологий.

«Технология распознавания русской речи «Руссограф», разработанная в ЦРТ, создает основу для создания целой линейки инновационных продуктов в одном из наиболее перспективных сегментов рынка. Думаю, очень скоро общение с компьютером и другой техникой с помощью русской речи будет так же естественно как разговор между двумя людьми» – говорит Генеральный директор «Центра Речевых Технологий» Михаил Хитров.


Более подробную информацию о разработках компании Вы можете получить обратившись в главный офис «Центра Речевых Технологий» к Алексею Хитрову по телефону (812) 325 8848 доб. 6643, e-mail: akhitrov@speechpro.com


Справка

Центр Речевых Технологий – петербургская инновационная компания, разработчик высокотехнологичных решений и продуктов в области речевых технологий, записи и компьютерной обработки звука. ЦРТ является признанным лидером российского рынка речевых технологий и входит в тройку мировых технологических лидеров по компьютерной обработке голосовой информации.

Комментарии

Оставить комментарий с помощью…
  • Equipnet (0)
  • Вконтакте (0)
  • Facebook (0)
Логотип компании
Комментариев пока нет

Вы можете разместить вашу новость в нашей новостной ленте на коммерческой основе
Наш телефон: +7 (495) 120-37-32. E-mail: manager@equipnet.ru

/news/other/other_10115.html 0
Управление предприятием
09.08.2017
 Какой матрас лучше – с пружинами или без?
Простые ответы на вечные вопросы при выборе спальных принадлежностей.


Присоединяйтесь, и будьте в курсе!
  • Почему доллар будет стоить 50 рублей?
  • Как зарабатывать по 3 000 000 рублей в месяц?
  • Где купить станок, который делает деньги?
Ответы на эти и другие вопросы ищи в рассылке EquipNet.ru