О проекте

Деятельность по разработке подкорпусов направлена на развитие новой технологической платформы национального корпуса казахского языка. Систематизация и использование современной информации становится доступной в условиях цифровизации. Основные цели создания корпуса - сбор естественных языковых ресурсов, нормализация и систематизация языка, предоставление результатов широкому потребителю для рационального использования.

«Разработка публицистического подкорпуса национального корпуса казахского языка» -  важный проект, продолжающийся на основе национального проекта «Ұлттық рухани жаңғыру». Проект выполнен Национальным научно-практическим центром «Тіл-Қазына» имени Шайсултана Шаяхметова по государственному заданию Комитета языковой политики Министерства образования и науки Республики Казахстан. Руководитель проекта –  кандидат филологических наук, доцент Аитова Н.Н., руководитель по техническому сопровождению –  М.Бахытқызы. В работе проекта приняли участие ученые-филологи, специалисты отрасли из следующих отечественных вузов и научных организаций:

  • Институт языкознания имени А. Байтурсынова;
  • Казахский национальный университет имени Аль-Фараби;
  • Евразийский национальный университет имени Л. Н. Гумилева;
  • Назарбаев Университет;
  • Казахский национальный женский педагогический университет;
  • Актюбинский региональный университет имени К. Жубанова;
  • Баишев университет;
  • ТОО "Minialgo";
  • ТОО "Издательство Qazkitap".

Подкорпус публицистических текстов содержит оцифрованные республиканские печатные материалы с метаразметкой и лингвистической разметкой. В частности, тексты, собранные в первый год выполнения проекта, были взяты из газет «Егемен Қазақстан», «Ана тіл», «Қазақ әдебиеті», «Түркістан», «Заң» и др. В дальнейшем предусматривается охват и других внутренних жанров публицистического стиля, а также увеличения по периодам издания и расширения по названиям источников.

Составлено 12-20 параметрических метаразметок (автор текста, заголовок текста, стиль текста, жанр, тип текста, хронотоп, источник, срок публикации и т.д.) к тексту.

База подкорпуса публицистических текстов ежегодно пополняется контентом. Также в рамках проекта ежегодно будет предлагаться и добавляться один из видов подкорпуса. Объем текстовой базы проекта, который будет продолжен как "Пять подкорпусов национального корпуса казахского языка", планируется довести до 40 миллионов слов.

Национальный корпус - это не только база всех интегрированных в систему языковых материалов казахского языка, но и механизм расширения функционирования, семантического пространства государственного языка в виртуальном пространстве, увеличения информационного распространения, массового доступа к языковым ресурсам. Данная информационно-справочная открытая система, отражающая базу текстов на казахском языке в виде оцифрованной системы, аккумулирует и предоставляет потребителю все виды стилей литературного языка, языковых применений на определенном этапе (или этапах) существования национального языка.

УЧАСТНИКИ ПРОЕКТА

  • Аитова Нурлыхан Нуруллаевна – кандидат филологических наук, ассоциированный профессор
  • Динаева Бекзат Бегалыкызы  – кандидат филологических наук, ассоциированный профессор
  • Ермекова Тыныштык Нурдаулетовна – доктор филологических наук, профессор
  • Жубаева Орынай Сағынгалиевна – доктор филологических наук, профессор
  • Мухамади Куралай Толегенкызы – кандидат филологических наук, ассоциированный профессор
  • Садирова Күлзат Каниевна – доктор филологических наук, профессор
  • Сапина Сабира Минатаевна – кандидат филологических наук, ассоциированный профессор
  • Абдуманапова Джулдызай – магистр гуманитарных наук
  • Баекеева Айнур Толыбаевна - докторант
  • Бакытқызы Молдир – магистр филологических наук
  • Кадырхан Алмажан Кадырханкызы – магистр гуманитарных наук
  • Камаш Акбота – магистр филологических наук, переводчик
  • Кожахмет Айгерим – докторант
  • Кұлтанбаева Нургүл Калдыгуловна – докторант
  • Купжанов Мерей Ерсайынулы – докторант
  • Оспанова Дана – докторант
  • Хабашева Актоты Маликовна– магистр гуманитарных наук
  • Шамишева Айбану Жанибековна – магистр языкознания
  • Избасаров Данияр Ерболович – докторант

ЭКСПЕРТЫ:

  • Салкынбай Анар  Бекмырзакызы – доктор филологических наук, профессор
  • Оразалиева Эльмира Нурлановна – доктор филологических наук, профессор
  • Eргеш Бану Жантуганкызы – PhD
  • Институт языкознания имени А.Байтурсынулы