Бюро переводов, метро Новослободская
г. Москва, ул. Долгоруковская,
д. 31 строение 3, этаж 3, офис 2
Бюро переводов Новослободская
г. Москва, ул. Долгоруковская,
д. 31 строение 3, этаж 3, офис 2

(495) 972-11-50

info@sofokl.ru

vovenarg1980

  •  5 стр.  → 3%

    10 стр. → 5%

    30 стр. → 7%

    Свыше 85 стр.

    10%

Русский язык оцифруют

8 июля 2019

Школа цифровой экономики Дальневосточного федерального университета (ШЦЭ ДВФУ) решила создать цифровой корпус русского языка. Здесь будут обучать русскому языку машины и нейросети, а также займутся разработкой синтетической личности на основе искусственного интеллекта.

Непосредственной реализацией проекта займется Лаборатория машинного обучения ШЦЭ ДВФУ, которая работает на базе магистерской образовательной программы под названием «Искусственный интеллект и большие данные».

По итогам проведенной работы одним из первых продуктов станет цифровой менеджер. Он будет представлять собой синтетическую личность, основанную на искусственном интеллекте. Менеджер будет способен поддерживать с пользователем сложные диалоги, задавать наводящие вопросы, а также находить не совсем очевидные ответы и без перерыва решать сервисные задачи. Подобный принцип в будущем может лечь в основу работы call-центров, переводчиков, систем обучения языкам, экспертных систем и систем по управлению сложными машинными механизмами.

Разработка синтетической личности уже начата. Работы ведутся в партнерстве со Сбербанком. На первом этапе создается качественно размеченная база русского языка для обучения нейросетей. Технологию цифровой разметки материала ДВФУ предоставит компания «Нейросети Ашманова», являющаяся техническим партнером ВУЗа по машинному обучению. База русского языка фактически будет представлять собой академический корпус. Подобные корпусы сейчас имеются только для английского и французского языков. Сбор аудио- материала для базы проведут через сайт и мобильное приложение. Затем его разместят в корпусе понятным для машины образом.

Следующим этапом станет оцифровка этого материала. Для этого этапа привлекут волонтеров из числа студентов ДВФУ, а также подключат профессиональных лингвистов и специалистов по компьютерной лингвистике. Собранный аудиоматериал они переведут в текст, разбив его на части речи, проставив ударения и пазы, разделив на диалоги и монологи, а также приведя произнесенные фразы к полному соответствию написанному тексту. При этом начитанные с листа тексты будут отделены от произнесенных естественным образом.

Последние новости

В Москве открылась выставка «60 лет итальянской моды»

17 июля 2019

«Союзмультфильм» выпустит мультсериал об устаревших словах

15 июля 2019

Русский язык оцифруют

8 июля 2019

Перевод на русский язык нового романа Стивена Кинга выйдет зимой

5 июля 2019

Дни «Союзмультфильма» в Германии станут ежегодными

28 июня 2019

Все новости