Мемлекеттік тіл жайлы сөз болғанда пуризм элементі көрініс тауып жатады
Қазіргі техника мен технология қарыштап дамып отырған қоғамда кез келген тілге жаңа сөздердің, терминдердің күн санап еніп отыруы – заңдылық. Мұндай терминдердің басым бөлігі орыс тілі арқылы қабылданып отырғанын, ғылым салаларындағы кейбір атауларға тіліміздегі сөздердің мағынасын жаңғырту арқылы балама табылса, көбінің калька тәсілі арқылы аударылып алынып, тіпті орыс тіліндегі жазылуы, айтылуы бойынша қабылданып отырғанын жоққа шығара алмаймыз. Мемлекеттік тілдің өз деңгейінде қызмет атқаруы үшін ғылым тілінің қазақша сөйлеуі басты талап болуы қажет екені белгілі. Осы ретте қазақ терминологиясын автоматтандыру мәселесі бір жолға қойылды ма? Бұл бағытта қандай жұмыстар атқарылып жатыр? деген сауалдар төңірегінде Qaz365.kz тілшісі Ахмет Байтұрсынұлы атындағы Тіл білімі институты Терминология орталығының жетекшісі, филология ғылымдарының кандидаты Құлманов Сәрсенбай Қуантайұлымен тілдесті.
- Ғылым мен техниканың дамуы тілге, оның ішінде терминологияға әсер ететіні түсінікті. Бұл тұрғыда лингвистика цифрлық технология кезінде қалай ілгерілейді?
- Орынды сауал. Қазақ тіл білімінде терминология саласы ғылыми тұрғыдан қалыптасып, мақтанып айтатын деңгейде. Алайда терминологияның практикалық жағына, яғни терминдердің қолданысына қатысты сыни пікір көп. Терминдерді топтастыру, жүйелеу, семантикалық өзгерістерін айқындау, біріздендіру, жаңа ұғымдарға атау беру мәселесі оңай жұмыс емес. Әсіресе мемлекеттік тілге халықаралық терминдерді енгізу мәселесі көп талқыланады.
Ахмет Байтұрсынұлы атындағы Тіл білімі институтындағы көпжылдық тәжірибелі мамандар тілге қатысты мәселерді негізінен дәстүрлі ғылыми тәсілдермен зерттеп келе жатыр. Сондай-ақ қазіргі ғылым мен техника дамыған уақытта IT-технология негізінде жасалған тіл біліміндегі қолданбалы цифрлық әзірлемелер қолға алынып, нәтижесін бере бастағанын баса айтуымыз керек. Мәселен, күні бүгінге дейін автоматтандыру ісі бойынша түрлі лингвистикалық құралдар әзірленді. Айталық, ономастикалық атауларға арналған Atau платформасы, емле ережелері мен сөздердің дұрыс жазылуына арналған Emle.kz цифрлық платформасы, ресми құжаттарға қол жеткізуге, оларды жолдауға не өңдеуге арналған Qujat платформасы, қазақ тіліндегі сөздер мен сөз тіркестері базасынан тұратын Sozdikqor.kz онлайн-сөздігі жас ғалымдар мен лингвистерге, осы сала бойынша білім алып жатқан студенттерге таптырмас көмекші құрал. Бұдан басқа кең қолданыстағы көпке таныс қазақ-орыс тілдеріндегі салалық терминологиялық қорға арналған Termin.com терминологиялық дерекқоры; қазақ тілін оқытуға арналған Til-Qural, TilMedia онлайн платформалары, зерттеушілер мен тілдік мәтінді өңдеу саласындағы әзірлемешілерге арналған «Алматы қазақ тілінің корпусы» қазақ тіліндегі мәтіндер жиыны; лингвистикалық зерттеулер мен әзірлемелерге, жалпы көпшіліктің қолдануына арналған «Қазақ тілінің ұлттық корпусы» осы саланы жандандыруға жасалып жатқан ауқымды жұмыстар деуге болады. Бұдан шығатын қорытынды мынау: цифрлық технология дамыған уақытта лингвистика саласы кенже қалып отырған жоқ.
- Қазақ тілінің мәртебесін көтеру әлі күнге дейін күн тәртібінде тұрғаны белгілі. Соның ішінде терминологиядағы тартысты мәселелердің себебі неде деп ойлайсыз?
- Қазақ тілінің мәртебісін көтерудің негізгі бір жолы ғылым салаларын қазақша сөйлету деп жоғарыда айтып өткен болатынмын. Ал қазақ тілін ғылым тіліне айналдыру дегеніміз – терминологияны дамыту екендігі өзінен-өзі түсінікті. Қазақ ғылыми терминологиясын дамытудың себептерін қысқаша айтып өтсек, олар: біріншіден, қазақ терминология ғылымы жекелеген ғалымдардың гранттық зерттеулері және диссертациялық еңбектер түрінде ғана зерттеліп келеді. Екіншіден, қазақ тілінде жазылған салалық ғылыми еңбектердің аздығы. Олардың негізгі бөлігі орыс тілінде жазылса, қазіргі кезде заман талабына сай ағылшын тіліндегі еңбектердің саны көбейіп отыр. Әсіресе мектеп терминологиясына байланысты бұрын жазылған жекелеген мақалаларды есепке алмағанда, қазіргі кезде мектеп оқулықтарында қолданылатын терминдерге (жүйелеуге, біріздердіруге, нормалауға) қатысты ғылыми, әдістемелік еңбектер жоқтың қасы.
Бұл терминология саласының ғылыми мәселелеріне қатысты жағдай.
Ендігі үлкен мәселе – терминологияның практикалық қолданысы. Қазақ тілінде жазылған ғылыми зерттеулерде, ғылым мен білім беру саласына қатысты еңбектерде де, нормативтік құқықтық құжаттарда да терминдерді қолдануда бірізділіктің сақталмай отырғаны жасырын емес.
Қазақ тілінің терминологиялық қорын жүйелеу мен біріздендіруде Республикалық терминология комиссиясы қызметінің маңызы зор екендігін айта кеткім келеді. Алайда бұл ұйымның атқарып жатқан қыруар ісі дәл осы нәзік мәселеде теңіздің тамшысындай ғана болып көрінеді. Алайда бұл ұйым бекіткен терминдерді қолдануды міндеттейтін заңды тетік жоқ. Қазіргі кезде заңнамалық құжаттарда, ғылыми еңбектерде, БАҚ-та терминдердің түрліше қолданылып жүргендігі сондықтан. Терминдерді қалыптастыру – бір реттік бекітілген, сол күйі қалатын жұмыс емес, ол үнемі қадағалап отыратын, толықтыруды қажет ететін күрделі іс. Сол себепті де бірізділік, жүйелілік, реттілік мәселесі жиі көтеріледі, айтыла да береді.
- Сөзіңіздің басында Тіл білімі институты әзірлеп жатқан «Қазақ тілінің ұлттық корпусын» атап өттіңіз. Сол туралы кеңірек білсек.
«Қазақ тілінің ұлттық корпусы» негізгі және бірнеше ішкорпустан тұрады. Негізгі корпус – көркем әдебиет, ғылыми, публицистикалық, ісқағаз, сөйлеу тілі стилі мәтіндерінің ғылыми зерттеу және оқыту IT-ресурсы ретіндегі электронды жиынтығы. Корпус негізінен сөз және сөз түрленімі бойынша іздеу жүйесінен морфологиялық, сөзжасамдық, семантикалық, лексикалық, фонетика-фонологиялық белгіленім түрлерінен тұрады. Оған енгізілген мәтіндерге автор, дереккөз, стиль, таралым типі, аудитория жасы, жынысы сияқты 10 параметрден тұратын метамәтіндік белгіленім қойылған. Негізгі корпустың мәтіндер базасы көркем әдебиет бойынша – 7167348; поэзия – 1000000; оқулық мәтіндері – 2000000; публицистикалық – 11950995; ғылыми – 7779000; іскери – 2208448; сөйлеу – 1000000 сөз қолданыстардан тұрады.
Ал Ахмет Байтұрсынұлы ішкорпусында – ақын-зерттеушінің өлеңдері мен әңгімелері, мақалалары, оқу құралдары мәтіндерінің электронды дерекқоры толық орналасты. Бұған 132 000 сөзқолданыс енгізіліп отыр. Бұдан бөлек ауызша, диалектілік, лингвомәдени, тарихи, жанамалық, ономастикалық, параллель ішкорпустар бар. Арнайы түсіндірмесі берілген электрондық базадағы сөзқолданыстар, аудио, бейнежазбалар, транскрибациялар көпшілікке қолжетімді. Яғни бұл әрдайым толықтырылып, жетілдіріліп отыратын жүйе.
- Әңгімеміз термин жайлы болғандықтан, терминология саласын автоматтандыру ісінде қандай жұмыстар жасалып жатқанын айтып өтсеңіз.
- Қазіргі кезде терминологиялық ішкорпус әзірленіп жатыр. Бұл ішкорпусты әзірлеу бірнеше кезеңнен тұрады. Бірінші кезеңде корпусқа енгізілетін материалды жинақтау. Небәрі бір жылдың ішінде әртүрлі ғылым салаларына арналған еңбектерден 4 миллионға жуық сөзқолданыстан тұратын қазақ тіліндегі ғылыми мәтін сұрыпталып, жүйеленіп, техникалық өңдеуден өткізілді.
Екіншіден, осы мәтіндерге метамәтіндік белгіленімдер қойылды. Атап айтсақ, ғылыми мәтіннің Дереккөзі; монография, оқулық, оқу құралы, мақала, тезис, реферат, аңдатпа, түйіндеме, баяндама, пікір сияқты Мәтін типі, Мәтіннің тақырыбы, Стилі, Кілт сөздері, Ғылым саласы көрсетіледі. Сонымен қатар бірқатар қосымша мәліметтер беріледі. Мысалы, Терминологиялық ішкорпусқа қазіргі кезде қазақ тіліндегі ғылыми мәтіндер енгізіліп жатқандықтан, Мәтін тілі деген бағанға «қазақ» деп көрсетілді. Болашақта басқа тілдерді қамту және параллель корпуспен байланыстыру көзделеді. Сондай-ақ мәтінді толыққанды сипаттау үшін Мәтіннің бет саны, Мәтін графикасы, Сөзқолданыс саны, Аудитория жасы, Субкорпус, Мәтіннің енгізілген уақыты, Белгілеуші деген тармақтар енгізілді.
Үшіншіден, терминологиялық ішкорпусқа енгізілген әртүрлі ғылым салаларының терминдеріне толық лингвистикалық сипаттама беру үшін терминнің қазақ және орыс тілдеріндегі нұсқасы беріліп, терминнің этимологиясы және оның қазақ тіліндегі баламасы, әрбір терминнің қазақ тіліндегі анықтамасы көрсетіледі, терминнің анықтамасы алынған дереккөз, терминнің қолданылатын саласы (салалары), терминнің авторы, терминнің құрамы, терминнің бекітілген нұсқасы, жылы, терминнің салалық терминологиялық сөздіктердегі аудармасы, терминнің заңнамадағы қолданысы (аудармасы және нұсқалары) сияқты терминологиялық белгіленімдер қойылады.
- Осы жасап жатқан жұмыстарыңыздың тіл біліміне, жалпы қоғамға тигізер пайдасына тоқталсаңыз.
- Тіл білімі институты әзірлеп жатқан әрбір әдістемелік құралдың немесе еңбектің мақсаттары түрліше. Мысалы, терминологиялық ішкорпус терминолог зерттеушілерге тілдік материал жинау барысында уақытын үнемдеуге, зерттеу көлемі мен тиімділігін арттыруға, түрлі жанрдағы мәтіндерден терминдерді іздеп табуға, синтаксистік және семантикалық анализ жасауға, ғылым салалары бойынша зерттеулер жүргізуге мүмкіндік береді. Ең бастысы, күнделікті тілдік қолданыс тілінде, оқулықтар мен оқу құралдарында, білім беру жүйесінің терминологиясын біріздендіруге әсер етеді. Мемлекеттік тілдің этносаралық қарым-қатынасты күшейтетін инновациялық, ақпараттық-зияткерлік базасы ретінде қолданылады.
Ал институт атқаратын негізгі миссияның екінші жұмысы – лингвист-ғалымдарға, оқулық авторлары мен әдіскерлерге, студенттер мен оқытушыларға, мұғалімдер мен мектеп оқушыларына ғылыми-практикалық, әдістемелік құрал ретінде ғана емес, жалпы көпшіліктің ғылыми, тілдік санасын жаңғыртуға ықпал етеді. Мәселен, мәшинелік оқыту бойынша, сондай-ақ компьютер жадын қазақ орфограммаларына қатысты жүйелі білімдермен, терминологиялық базамен толықтыруға септігін тигізеді.
- Уақыт бөліп сұхбат бергеніңізге рахмет!