Жаңалықтар
Қазақ тіліндегі тілдік модельдердің автоматтандырылған формулалар кешеніне патент берілді • 18.01.2024
авторлық куәлік: «Қазақ тіліндегі тілдік модельдердің Excel форматындағы автоматтандырылған формулалар кешені (1-серия)» тақырыбында ҚР Әділет министрлігінің «Ұлттық зияткерлік меншік институтынан» авторлық құқық туралы объектісіне құқықтарды мемлекеттік тіркеу туралы куәлік алынды. (№31948, 23 қаңтар, 2023 ж. , авторы - Н.Аитова).
ғылыми мақалалар:
ҚР БҒМ Білім және ғылым саласында сапаны қамтамасыз ету комитеті ұсынған журналда 2 мақала (1-еуі баспа, 1-еуі қолжазба), халықаралық конгресте 1 мақала, халықаралық конференция материалдарында 1 мақала, барлығы 4 мақала жарияланды:
1. Кадирхан А. К., Төкенқызы Г. Лингвистикалық корпус мәтініндегі ауызекі сөйлеу тілі элементтерінің стильдік қырлары/ Павлодар мемлекеттік университеті хабаршысы №3, 2023 ж. 110-121 бб.
2. Aitova N., Ospanova D. «VERB-BASED EMOTIVE STRUCTURES IN THE LINGUISTIC CORPUS BASE» тақырыбындағы корпус базасы негізінде жазылған ғылыми мақаласы Павлодар мемлекеттік университеті хабаршысына жіберіліп, 2023 жылдың 4-нөміріне шығатын болып қабылданды.
3. Аитова Н.Н. Грамматикалық омонимия: жетістік пе, кемшілік пе (Ұлттық корпус материалдары негізінде)// Х Түркология конгресі материалдары жинағы. 17-19 қазан, Түркістан, 2023 ж.
4. Аитова Н.Н. Оқу корпусын жасау және мектеп терминологиясын зерттеуді оңтайландыру// «Мектеп оқулықтары: пән терминдерін жетілдіру және біріздендіру» республикалық ғылыми-әдістемелік конференция материалдары. Электрондық жинақ / Ш.Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығы. – Астана, 2023. 8-12 б.
Биыл ғылыми бағыттағы ішкорпус қосылды • 13.01.2024
Қазақ тілінің ұлттық корпусының кіші корпустарының тармағын кеңейту және әзірлеу
Бұрын әзірленгені 2 кіші корпус: Публицистикалық мәтіндер кіші корпусы және Ауызекі сөйлеу тілі кіші корпусы, бұлардың механизмі жетілдірілді. Ғылыми мәтіндер кіші корпусын платформаға қосу бойынша сайтқа моделі енгізілді, контенті жинақталды.
Омоним сөздерді ажырату бойынша механикалық белгіленім жасалынды • 03.01.2024
Қолданыстағы корпус базасындағы контенттің лингвистикалық белгіленімін жасауды және өңдеу жұмыстарын жалғастыру:
Биыл мәтіндердің лингвистикалық өңделуін оңтайландыру бағытында барлығы 5 608992 сөзқолданыстың (8770 мәтін) омонимиясы алынды.
5 миллион аса сөзқолданыс енгізілді • 03.01.2024
Корпус базасын жаңа контентпен қамтамасыз ету бойынша: Жинақталатын контент тізімі қалыптастырылды. Контент өндіру бойынша жұмыс толық орындалды.
Публицистикалық мәтін бойынша 5899 мақала, 5 103 431 сөзқолданыс;
Ғылыми мәтін бойынша 2032 мақала, 5 014 923 сөзқолданыс;
Ауызекі мәтін бойынша 891 мақала 294446 сөзқолданыс.
Барлығы 8822 мақала, 10 412 800 сөзқолданыс өңделіп, қабылданды.
Корпус 5000 құжатпен толықты • 25.08.2021
Жаңадан басылымдардың материалдарымен толықтырылды