Звуковой тренажёр

Веб-приложение «Звуковой тренажёр» предназначено для обучения правильному произношению звуков русского языка.

Архитектура

На рисунке 1 представлена программная архитектура приложения, в основе которой лежит концепция «клиент — веб-сервер — сервер приложений».

Рис. 1. Архитектура системы

Система состоит из следующих компонентов:

  • Клиентом является приложение, написанное на платформе Adobe Flash и встроенное в веб-страницу.
  • Программный фреймворк клиентского приложения Adobe Flex 4.
  • Веб-сервер nginx
  • Сервер приложений — медиа-сервер Red5.
  • Распознаватель речи Nuance Recognizer 9.
  • В ходе работы приложения на стороне сервера также используется ПО для кодирования и декодирования медиа-информации ffmpeg.

Фреймворк Adobe Flex 4, сервера nginx и Red5, ffmpeg являются ПО с открытым исходным кодом и, соответственно, распространяются бесплатно.

Интерфейс

На рисунке 2 изображен интерфейс главного окна приложения.

Рис. 2. Интерфейс приложения.

В левом верхнем углу (1, рис. 2) находится ссылка для перехода на страницу с дополнительной справочной информацией по приложению и звукам русского языка. На панели выбора (2) пользователь может выбрать интересующий звук, после чего, отобразится детальная информация по данному звуку (3). Информация о звуке включает в себя:

  • схематическую анимацию речевого тракта в момент произнесения звука (а);
  • видео, показывающее положение губ (б, в);
  • Crowdизображения импульсно-кодовой модуляции эталонного звука (д);
  • подробную текстовую информацию об особенностях артикуляции (е).

Для запуска анимации и видео роликов предусмотрена кнопка «Демонстрация звука» (д). Если к компьютеру подключена вэб-камера, то изображение с камеры будет выведено на экран (4), благодаря чему, пользователь сможет проконтролировать движение своих губ. Чтобы оценить произношение, необходимо нажать кнопку «Проверить произношение» (5). Появится диалоговое окно (рис. 3), сигнализирующее о начале записи.

Рис. 3. Начало записи

После окончания записи и анализа звука будет выведены результаты (рис. 4) работы, которые состоят из:

  • оценки соответствия произнесённого звука эталонному по 100 бальной шкале (1);
  • одно из пяти изображений соответствующее оценке по пятибалльной шкале (2);
  • изображения импульсно-кодовой модуляции произнесённого звука (красный) и эталонного (синий) (3).

Рис. 4. Результаты

При нажатии на ссылку «Подробнее о приложении» в вкладке браузера открывается страница help.html, находящаяся на веб-сервере (см. рис. 5, 6). Страница содержит flash-приложение, которое отображает справочную информацию по теме в виде 10-ти страничной интерактивной брошюры.

Рис. 5. Интерфейс справочной страницы (обложка)

Рис. 6. Интерфейс справочной страницы (один из разворотов)

Создано и запущено в рамках компьютерной сети лаборатории веб-приложение «Речевой тренажер». Приложение готово к размещению в сети Интернет. Для этого необходим хостинг на облачной платформе с возможностью установки ОС Red Hat Linux. Выбор этой ОС обуславливается наличием версии распознавателя Nuance Recognizer только для этого дистрибутива linux. Также для возможности предоставления общего доступа к приложению необходимо покупка коммерческой лицензии распознавателя речи Nuance Recognizer.

Новости сайта