Бюро переводов, метро Новослободская
г. Москва, ул. Долгоруковская,
д. 31 строение 3, этаж 3, офис 2
Бюро переводов Новослободская
г. Москва, ул. Долгоруковская,
д. 31 строение 3, этаж 3, офис 2

(495) 972-11-50

info@sofokl.ru

vovenarg1980

  •  5 стр.  → 3%

    10 стр. → 5%

    30 стр. → 7%

    Свыше 85 стр.

    10%

Русский язык оцифруют

8 июля 2019

Школа цифровой экономики Дальневосточного федерального университета (ШЦЭ ДВФУ) решила создать цифровой корпус русского языка. Здесь будут обучать русскому языку машины и нейросети, а также займутся разработкой синтетической личности на основе искусственного интеллекта.

Непосредственной реализацией проекта займется Лаборатория машинного обучения ШЦЭ ДВФУ, которая работает на базе магистерской образовательной программы под названием «Искусственный интеллект и большие данные».

По итогам проведенной работы одним из первых продуктов станет цифровой менеджер. Он будет представлять собой синтетическую личность, основанную на искусственном интеллекте. Менеджер будет способен поддерживать с пользователем сложные диалоги, задавать наводящие вопросы, а также находить не совсем очевидные ответы и без перерыва решать сервисные задачи. Подобный принцип в будущем может лечь в основу работы call-центров, переводчиков, систем обучения языкам, экспертных систем и систем по управлению сложными машинными механизмами.

Разработка синтетической личности уже начата. Работы ведутся в партнерстве со Сбербанком. На первом этапе создается качественно размеченная база русского языка для обучения нейросетей. Технологию цифровой разметки материала ДВФУ предоставит компания «Нейросети Ашманова», являющаяся техническим партнером ВУЗа по машинному обучению. База русского языка фактически будет представлять собой академический корпус. Подобные корпусы сейчас имеются только для английского и французского языков. Сбор аудио- материала для базы проведут через сайт и мобильное приложение. Затем его разместят в корпусе понятным для машины образом.

Следующим этапом станет оцифровка этого материала. Для этого этапа привлекут волонтеров из числа студентов ДВФУ, а также подключат профессиональных лингвистов и специалистов по компьютерной лингвистике. Собранный аудиоматериал они переведут в текст, разбив его на части речи, проставив ударения и пазы, разделив на диалоги и монологи, а также приведя произнесенные фразы к полному соответствию написанному тексту. При этом начитанные с листа тексты будут отделены от произнесенных естественным образом.

Последние новости

Дни итальянского кино пройдут на Кипре

17 сентября 2019

В Новосибирске стартовал Российско-немецкий фестиваль современного искусства

16 сентября 2019

В Москве пройдет фестиваль Китая

2 сентября 2019

Московский кинотеатр «Пионер» примет фестиваль израильского кино

1 сентября 2019

Дни России в Мерано открылись выставкой в честь Ф.Достоевского

29 июля 2019

Все новости