Нацыянальны корпус беларускай мовы

14.11.2025 - Абноўлены фанетычны канвертар. Апрача ўласна канвертацыі, таксама паказваецца, якія фанетычныя працэсы адбываюцца падчас канвертавання. Праца канвертара апісаная ў артыкуле Беларускі фанетычны канвертар (BelG2P) — ад вытокаў да рэалізацыі.
10.11.2025 - Абнавілася Граматычная база - апрача шматлікіх удакладненняў і выпраўленняў памылак, дададзены пазначэнні прыставак, каранёў і інтэрфіксаў у словах, а таксама слоў з Ґ-выбухным.
30.08.2025 - У Нацыянальным корпусе беларускай мовы з’явілася новая магчымасць — пошук па аўдыя. Цяпер, падключыўшы ў фільтры тэкстаў "Аўдыякорпус", вы атрымліваеце магчымасць:

убачыць расшыфраваны ўрывак з патрэбным словам;
праслухаць аўдыязапіс гэтага фрагмента;
адкрыць поўную расшыфроўку тэксту, з якога ён узяты.

Аўдыякорпус дае ўнікальны доступ да жывой гаворкі і з’яўляецца каштоўнай крыніцай для даследчыкаў.
14.06.2025 - Дададзены "Падкорпус тэкстаў 1918–1941 гг." Новы падкорпус змяшчае тэксты, створаныя ў перыяд з 1918 па 1941 год.

больш навін >>>

10.07.2023 - У раздзеле "Фанетычны канвертар і сінтэз маўлення" з'явілася магчымасць карыстацца сінтэзатарам беларускага маўлення.
29.05.2023 - Змены ў праекце:

абноўлены інтэрфейс пошуку (цяпер можна шукаць з варыянтамі напісання, знакамі прыпынку, пры дапамозе рэгулярных выразаў)
дададзены тэксты 1920-1930х гадоў (~1,5 млн. слоў)
дададзены дыялектныя тэксты (~500 тыс. слоў)
часова прыбраны неразабраныя тэксты

28.12.2022 - Дадаўся руска-беларускі паралельны корпус (пакуль утрымлівае толькі пераклады кодэксаў Рэспублікі Беларусь).
09.09.2019 - Абноўлены Беларускі N-корпус. Дадалося ~5000 тэкстаў аб'ёмам ~12 млн. словаўжыванняў. Аб'ём Асноўнага корпусу складае ~163 млн. словаўжыванняў. Аб'ём усяго корпусу (разам з неразабранымі тэкстамі) - ~337 млн. словаўжыванняў.
05.08.2016 - Корпус папоўнены публіцыстычнымі тэкстамі ~20 млн. словаўжыванняў. Агульны аб'ём корпусу - ~80 млн. словаўжыванняў.
04.11.2021 - Вялікія змены ў праекце:

Значна папоўнены корпус тэкстаў, дададзены новыя падкорпусы, істотна абноўлены інтэрфейс корпусу. Аб'ём корпусу ~177 млн. словаўжыванняў, разам з неразабранымі тэкстамі ~1.07 млрд. словаўжыванняў.
Абноўлены інтэрфейс граматычнай базы, дадзена інфармацыя пра крыніцы слова.
Дадаўся раздзел анлайн-праверкі беларускага правапісу, а таксама модулі праверкі для розных праграм і аперацыйных сістэм.
Дадаўся фанетычны канвертар (тэставая версія), які дазваляе канвертаваць тэксты ў транскрыпцыю.
Дадаліся праекты ў распрацоўцы, створаныя на падставе граматычнай базы (тэставая версія).

29.10.2021 - У выдавецтве «Тэхналогія» выйшла электроннае выданне «Граматычнай базы беларускай мовы», падрыхтаванае сектарам камп’ютарнай лінгвістыкі Інстытута мовазнаўства.

Нацыянальны корпус беларускай мовы

Корпус тэкстаў сучаснай беларускай мовы са структурнай і граматычнай разметкай і пашпартызацыяй. Корпус складаецца з некалькіх падкорпусаў: асноўны, неразабраныя тэксты, газеты і сайты, Вікіпедыі (абодва правапісы). Аб'ём корпусу ~177 млн. словаўжыванняў, разам з неразабранымі тэкстамі ~1.07 млрд. словаўжыванняў.

Граматычная база беларускай мовы

Граматычная база ўяўляе сабой збор слоў з марфалагічнымі і іншымі паметамі. Вартасць граматычнай базы ў тым, што яна змяшчае не толькі словы, зафіксаваныя ў нарматыўных слоўніках, але і словы, якія з’явіліся ў беларускай мове за апошнія дзесяцігоддзі і ў слоўніках пакуль не адлюстраваны, што дазваляе назваць дадзеную базу базай актуальнай лексікі беларускай мовы.

Праверка правапісу +анлайн

Анлайнавы сэрвіс, які дапаможа вам пазбавіцца памылак у тэксце, напісаным па-беларуску афіцыйным правапісам. Таксама на старонцы сэрвісу вы зможаце спампаваць праграму праверкі арфаграфіі для розных браўзераў, Windows (уключна з Skype, Microsoft office і г.д.), LibreOffice/OpenOffice, Mozilla Firefox/Thunderbird.

Фанетычны канвертар і сінтэз маўлення

Анлайнавы канвертар слоў і тэкстаў беларускай мовы у фанетычную транскрыпцыю з выкарыстаннем Міжнароднага фанетычнага алфавіта (IPA) і беларускай школьнай транскрыпцыі.

Сінтэз маўлення зроблены на падставе беларускага Mozilla Common Voice.

Біблійны корпус

Беларускі Біблійны корпус змяшчае 16 перакладаў Бібліі на беларускую мову, а таксама тэксты на іншых мовах (лаціна, яўрэйская, украінская, польская і інш.) для параўнанняў і ўяўляе сабой зручны і эфектыўны інструмент для перакладчыкаў і даследчыкаў Бібліі. Пры дапамозе Біблійнага корпусу вы зможаце супаставіць тэксты перакладаў, а таксама знайсці патрэбнае слова і паглядзець варыянты яго перакладу ў розных выданнях.

Слоўнік Насовіча

Электроннае перавыданне класічнай працы Івана Насовіча «Словарь белорусского наречия» (СПб., 1870) – галоўнай крыніцы слоўнікаў беларускай мовы канца ХІХ – першай паловы ХХ ст. Яно ўтрымлівае арыгінальны і асучаснены рэестр, арыгінальны тэкст і дадаткі; дапоўнена матэрыяламі крытычнага, біяграфічнага і бібліяграфічнага характару. Выданне забяспечана магчымасцю пошуку па тэксце і па ключавых словах, падабраных да аўтарскіх расейскамоўных дэфініцый. Адрасавана мовазнаўцам, гісторыкам, этнографам, фалькларыстам і ўсім, хто цікавіцца беларускім словам.

Архіў Інстытута мастацтвазнаўства, этнаграфіі і фальклору

Лічбавы архіў, створаны на аснове Калекцыі фальклорных запісаў – найбуйнейшага і найстарэйшага фальклорнага архіва Беларусі. Тут прадстаўлены рукапісы (сканы-копіі экспедыцыйных дзённікаў і сшыткаў з тэкстамі песень, казак, замоў і інш.); фоназапісы (алічбаваныя гуказапісы беларускага фальклору); нотныя расшыфроўкі; сучасныя экспедыцыйныя фота-, гука- і відэаматэрыялы.

SlounikPlus

Праграма SloŭnikPlus створана з выкарыстаннем сучасных тэхналогій і істотна паляпшае працэс укладання слоўніка – значна павялічваецца эфектыўнасць, хуткасць і камфортнасць працы у параўнанні з больш звыклымі спосабамі (напрыклад, пры дапамозе MS Office). Дадатным бокам праграмы ёсць і тое, што яна працуе праз цэнтральны сервер, таму ўкладальнік не прывязаны да канкрэтнага камп’ютара і можа працаваць з любога месца пры наяўнасці інтэрнэт-падключэння.

Праекты ў распрацоўцы

Слоўнікі і іншыя праекты, якія створаны аўтаматычна з граматычнай базы.

Карысныя спасылкі

https://daviedka.bnkorpus.info/ - Моўная даведка Інстытута мовазнаўства (НАН Беларусі)