В ИЯЛИ обсудили развитие национального корпуса коми языка
9 декабря 2025 г. в Институте языка, литературы и истории Коми НЦ УрО РАН состоялось обсуждение важнейшего вопроса по развитию «Национального корпуса коми языка». На мероприятии присутствовали директор Института языка, литературы и истории Коми НЦ УрО РАН д.и.н. И.Л.Жеребцов, заместитель директора по научной работе к. филол. н. А.Г. Мусанов, заведующий сектором языка к. филол. н. С.А. Сажина, младший научный сотрудник сектора языка В.А. Степанов, а также министр национальной политики Республики Коми Р.В. Носков и начальник отдела государственных языков Министерства национальной политики Республики Коми М.В. Чуяшкова.

На встрече обсуждалась возможность передачи исключительных прав на разработку Центра инновационных языковых технологий информационно-справочной системы «Национальный корпус коми языка». В корпусе, состоящим из девяти подкорпусов, представлены письменные и устные тексты на коми языке: публицистические, учебные, научные, деловые, разговорные, диалектные и т.п. Также он содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Национальный корпус предназначен для специалистов, занимающихся исследованием лексики, грамматики языка, а также изменений, происходящих в языке на протяжении сравнительно небольших периодов — от одного до двух столетий. Воспользоваться корпусом может любой желающий по ссылке komicorpora.ru.

Сотрудники ИЯЛИ предлагают фундаментальную реконструкцию и модернизацию платформы Национального корпуса коми языка с точки зрения улучшения репрезентативности имеющихся корпусов (профессиональная и качественная обработка материалов на всех уровнях языковой системы (фонетика, лексика, грамматика), создание новых корпусов (дополнение мультимедийным корпусом (видео- и аудиорядом); корпусом коми диалектов (коллекции электронных текстов, снабженных лингвистической и метатекстовой информацией), организацию новой разметки, полученной с помощью применения нейросетевых моделей.











