Национальный корпус удмуртского языка — это информационно-справочная система, основанная на собрании удмуртских текстов в электронной форме. Он зарегистрирован в Реестре баз данных Федеральной службы по интеллектуальной собственности (Роспатент), размещен на специальном сайте и доступен для пользователей.
Корпус предназначен для всех, кто интересуется вопросами, связанными с удмуртским языком: профессиональных лингвистов, преподавателей языка, школьников и студентов.
Сейчас объем Корпуса составляет около 6,2 млн словоупотреблений. Продолжается формирование корпуса современного литературного языка, а также разработка корпуса письменных памятников удмуртского языка. В планах — создание корпусов диалектных, параллельных и других текстов. Также на сайте доступны электронные версии удмуртско-русского и русско-удмуртского словарей.
В системе Национального корпуса удмуртского языка есть возможность поиска определенных словоформ и словосочетаний по всем загруженным на сайт текстам, подбора словоформ по грамматическим показателям, поиска по авторам и по годам публикаций, поиска по подкорпусам, просмотра метаинформации найденного словоупотребления, включая сведения об авторе, названии произведения, источнике, просмотра морфологического разбора слова и его перевода на русский язык. Результаты поиска можно скачать в виде электронной таблицы Excel, в которой дан набор предложений с указанием источника.
Проект реализован УдмФИЦ УрО РАН при поддержке Министерства нацполитики Удмуртии, Национальной библиотеки Удмуртской Республики, ООО «Нооматика». Дальнейшая модернизация Корпуса осуществляется также за счет средств президентского гранта по государственной поддержке молодых российских ученых.