Тікелей эфир
Тікелей эфир
МАҢЫЗДЫ
  • Біздің сұхбат
  • 08 Тамыз, 2023

Өркен Мамырбаев: Жасанды интеллектімен қазақша сөйлескім келеді

Ғылымдағы ІТ маман, ҚР БҒМ ҒК «Ақпараттық және есептеу технология­лары институты» РМК бас директорының орынбасары Өркен Мамырбаев қазақ тіліндегі дыбыстық хабарламаны танып қана қоймай, мәтінге айналдыратын жүйе ойлап тапқанынан жұртшылық хабардар. Аталған жүйе бір мезетте екі дауысты ажыратып, жазбаша үлгісін автоматты түрде екі арнаға түсіреді. Бұл жүйе Kazakh ASR атауымен әлеуметтік желілерде чат-бот ретінде жұмыс істейді. Бірақ бірде құлап, бірде қайта іске қосылып, әрең тұр. Негізгі мәселе – қаржының жетіспеуінен жүйенің дамымауы. 
Қазіргі уақытта қазақ тілінде айтылған сөзді ажырата білу, тану технологиясын Philips компаниясының өніміне енгізуге келісімшарт жасалған. Қазақстан нарығына арналған коллаборация аясында айтылған сөзді автоматты түрде мәтінге айналдыратын Philips-тің дыбыс тану мүмкіндігі бар Smart Mike Duo микрофоны ұсынылады. Жасанды интеллектіні қазақ тілінде сөйлетуге қызмет етіп жүрген ғалыммен ғылымдағы жаңалықтары, негізгі мәселелері мен болашағы туралы әңгімелестік. 

– Өркен Жұмажанұлы, әңгімемізді еліміздегі жасанды интеллектіден бастайықшы: даму жағдайы мен түйткілді мәселелері қандай?
– Жасанды интеллект қазіргі кезде барлық өндірісте те, қолданысымызға да еніп келе жатыр. Бір ғана мысал, ол сіздің қарапайым күнделікті әрекетіңізге болжам жасап отырады. Былайша айтқанда, сіз әлеуметтік желіге кіріп, бір затты іздесеңіз, ертеңіне сол туралы ақпарат аяқ астынан сізге шығып тұрады немесе сіз Алиса, Siri сияқты жүйелермен сөйлесіп, қажетіңізді жүзеге асыра аласыз. Әрине, бұл жүйелерде қазір қазақ тілі жоқ. Бұл ағылшын, орыс тілі сияқты көп ресурсты тілдердің жұмысына көмектесіп отыр. Сол сияқты, медицинада да бар: МРТ, УЗИ-ге түсесіз. Осының бәрі жасанды интеллект немесе соның моделдері, интеллектуалды жүйелері. Қазір өндірістің өзінде де автоматтандырылған роботтар қолданылып жатыр. Ол роботтардың жұмыс барысы жасанды интеллектпен тікелей байланысты. Жасанды интеллект көптеген жұмыс орындарына кіріп, өмірімізді болашақта түрлендіреді. Қазірдің өзінде Илон Маск Тесла машинасын ойлап тапты. Бұл көлік жүргізушісіз карта бойынша жүріп отырады. Шетелде барлық жерді картаға цифрландырып енгізіп қойған. Бізде қаланың кейбір бөліктері ғана сондай жүйеге енді. Ана жолы бір ауылдың шет жағына қарай шығып бара жатсам, Яндекс компаниясы сондай картаны цифрландырып жатыр екен, қанша жылдамдықпен кетіп бара жатыр, бәрін бақылауда ұстап отыр. Болашақта мұндай машиналар қала сыртында да еркін жүре бастайды деген сөз. Мұның бәрі – жасанды интеллект. Қазір қауіпсіздік саласында, смартфонда бет-әлпетті тану арқылы немесе «дыбыстық сөйлесеміз» деген жүйе шығады. Мұның бәрі біздің өмірге келіп жатқан жағымды өзгерістер. Ол бір жағынан пайдалы, ал екінші жағынан күрделі мәселелерді туындатады. 
– Мәселелері неде?
– Мәселелері қазір жұмыс орындары автоматтандырылса, жұмысшылардың жұмыссыз қалу мәселесі туындайды. Көптеген мамандықтардың түрленуіне және мамандардың керексіз болып қалуына алып келеді. Мысалы, халықтың саны артқанымен, жұмыс орны азайса, мәселе көбейеді. Бірақ адамзат соны бірге дамытып, өмірімізде кейбір жайтты өзгертіп, трансформация жасайтын болса, жасанды интелектпен үйлесіп өмір сүретін болсақ, онда мұндай түйткіл туындамайды деп ойлаймын. 
– Енді Kazakh ASR өнімі туралы айтыңызшы. Идея қалай туындады? Жасанды интеллектіде неге тіл саласын таңдадыңыз?
– Бала кезден бағдарлама құруға қызығып, информатика пәні бойынша халықаралық олимпиадаға қатысып жүрдім. Бұл салаға келгеннен кейін осы логикалық бағдарламалауда жүрдім. Кейін осы институтқа келген кезде, тақырыбымды жасанды интеллект бағыты бойынша берді, яғни сөйлеу-тану процесі. Осы бойынша ізденуді бастадым. Ұстазым Токио қаласындағы инженерлік техникалық университеттегі профессор Кейлан Алимхан есімді азамат болды. Өзі Қытайдың қазағы екен, маған осы сала бойынша көп ілім үйретті. Келген соң тоқтап қалған жоқпын, ізденісімді жалғастырып, диссертациялық жұмысыммен Әзербайжанға бардым, Тегеран университетіне барып зерттеу жұмысын жүргіздім. Осыған байланыс­ты әртүрлі жүйелерді зерттеп көрдім. Осының бәрі іс-тәжірибе болып келгеннен кейін, қарап отырсам, қырғыз, өзбек, түркімен және қазақтың жасанды интеллектіде тану процесі жоқ. Сосын ғылыми жоба ұсынып, «тілдің даму жүйесін жасайықшы» дедім. 2018 жылы ғылыми жобаны бастадым, жетілдіре түстім. Осыдан бастап тілге еніп кеттік. Тілдегі мәселелерді зерттедік. Бір қызығы, зерттеу барысында мамандар қазір қазақ тілінде диалект жоқ дейді. Интернеттен қарасам, диалект көп. Сосын «диалект бар» деп мақала жазып шықтым. Өйткені ауызекі сөйлеуде көп кездеседі. Мысалы, «ожау бере салшы» деген сияқты, бәрібір білініп, көрініп тұрады. Оңтүстік жақта басқаша, сол­түстік, батыс аймақта бөлек дегендей. 
– Жасанды интеллектіге де тіл керек, компьютерге де қазақ тілін ен­гіздік. Дегенмен жасанды интеллек­тідегі қазақ тілі әлі де ақсап тұр? Неге?
– Өйткені жасанды интеллект ойланады. Оны үйретесің. Белгілі бір де­ректерді оқи отырып, соған байланыс­ты шешім қабылдайды. Соны үйрету үшін барынша көп ақпарат керек болады. Дамыған елдер, АҚШ, Қытай, Ресей елдері халқының саны да көп, тілдік ресурсы да мол. Сол ресурстарды көптеп алып, жасанды интеллекті оқытып, дамытуға еркін кіріседі. Ал біз аз ресурсты тілдер қатарына жатамыз. Сондықтан ресурс жетпегендіктен жасанды интеллектіні жасауға мүмкіндік жоқ боп тұрады. Жасаған күннің өзінде ол ресурстық қоры жетпей, көптеген корпусты, көптеген жұмысты талап ететін болып тұр. Осы мәселе бойын­ша қазақ тілін техника, технологияларда тікелей қолдану үшін әрбір ғылыми орталықтар қазір өз корпусын құрып жатыр. Ол корпустың кейбірі мемлекеттік стандартқа сай келеді, кейбірі мемлекеттік стандартқа сай емес. Егер мемлекеттік стандартқа келмейтін болса, ол корпусты әлемдегі өнеркәсіптер қолдана алмайды. Бір мысал келтірейін. Назарбаев университеті қазақ тіліне байланысты бір корпус жасады. Оны ашық түрде қоя алады, оны барлық ел көріп, зерттеу жасай алады. Мысалы, қазір байқағаным, қазір қазақ тіліне қытайдың ғалымдары көп көңіл бөліп отыр. Ол қазақ, ұйғыр, өзбек, түркімен тілдері, яғни түркітілдес тілдерді зерттеп жатыр. Менің мақа­лама қытай елі ғалымдарының 21 сілтемесі келді. Бұл мәселеде Қытайдың екі көзқарасы болуы мүмкін. «Біріншісі, өзін байыту, қазақ тілін енгізіп, біздің нарыққа шығу мәселесі, ал екіншісі өзінің ішкі мәселелеріне қолданып кете ме?» деген күдік бар. Біз қазір ашық түрде қоя алмаймыз. Оның себебі, сату жүйесіне қарай көшудеміз. Сондықтан біз Philips компаниясына өзіміздің жасаған өнімді енгіздік, енді оны ашық түрде қоя алмаймыз. Ал керек болып жатса, онда бізден басқа ұйымдар сұрайтын болса, онда келісімшартпен бере аламыз. Ақылы емес, тек арнайы келісім болуы керек. «Егер сіз тілді зерттеп, соған пайдамыз тиеді десеңіз, келісімшартпен, іште ғана қолданыңыз» деймін. Басқа жаққа ашудың қажеті жоқ. Өйткені өзіміздің коммерциялық жоспарларымыз бар. Ресейдің фирмалары сату туралы бізге ұсыныспен байланысқа шықты. «Мен сатпаймын, бірақ бірге жұмыс істеп, дамытайық» дедім. Ол өзімізге пайдалы емес па?Мысалы, қазір Ахмет Байтұрсынұлы атындағы Тіл білімі институтымен, Тіл-қазына ұлттық ғылыми-практикалық орталығымен жұмыс істеп жатырмыз. 
– Жасанды  интеллектіге тілді енгізу дұрыс. Ал негізгі мәселелердің бірі ауызекі тіл деп ойлаймын. Сондай-ақ өзіңіз айтқан диалект кез­деседі. Қазақ тілін толық енгізе алмай отырғанда, аймақтық диалектіні пайдалану мәселесі қалай болып жатыр?
– Тілге келген кезде, үлкен мәселелер туындады. Сіз диалект туралы айтып отырсыз ғой, ал мен қызығын айтайын. Сөйлеудің ең негізгі бөлшегі фонема ғой. Сонымен, танитын болсақ, онда тану сапасы өте жоғары болады. Демек, фонетикалық бай мәтін құруымыз қажет. Ол 700 сөзден тұруы керек және ол сөздер фонетикалық бай болуы әрі қайталанбауы қажет. Осы нәрсені құрған кезде үлкен мәселе туындады. «Фонеманың өзі нақтыланбаған» дүние болып кетті. Екінші деңгейі буын бойынша екен. Буын бойынша зерттеп келсем, сингармонизм заңына жолығады екенмін. Ал үндестік заңы кеңестік кезде зерттелген де, одан ары қарай зерттелмей қалған. Осы кезде тағы бір мәселе туындады. Буын бойынша тани алмай қалды. «Жақсы, онда шетелдіктер тағы қандай жолмен жұмыс істеп жатыр екен?» деп қарасам, олар таңба бойынша таниды екен. Мысалы, әріптер. «Онда таңба бойынша таниық» деп, өзіміздің сөйлеу корпусын құрдық. Сөйлеу корпусын құрған кезде, оны жай ғана құра салмау керек . «Ер адам сөйлеп жатыр ма, әйел сөйлеп жатыр ма, соны анықтайық» дедік. Екінші, ол қазақ тілінде ме, ағылшын тілінде сөйлеп жатыр ма, болашақта параллель корпус құруға болады ғой. Сондықтан «дауысты дауыстан аударуға келейік» дедік. Осы мәселені де ескердік. Одан кейін барып ол ер адам ба, әйел ме, жас аралығы қанша, қай аймақтан, оңтүстік пе, солтүстік пе, сөйлеудің ерекшелігі болады ғой. Осы базаны құрғанда соны да таңбалауымыз керек болды. Осылардың бәрін ескере отырып, біз өз корпусымызды құрдық. Соның нәтижесінде бірнеше мәселені қатарынан шеше аламыз. Біздің микрофон қай тілде сөйлеп жатыр, ер ме, әйел ме, қанша жас аралығында, қай аймақтан екенін анықтап бере алады. Ал осы корпусты құру мәселесіне келгенде, «мәліметті қайдан аламыз?» деген сауал туындады. Мәліметті ең бірінші бұқаралық ақпарат құралдарынан алдық. Әртүрлі жаңа­лық­тардан, газеттерден жинақ­тадық, дауыспен жа­зыл­ған дүниені қиып алдық. Одан кейінгі мәселе қалай сөйлесе, мәтіннің солай шығуы болды. Ал біздің заңдылығымыз тану ғана. Біз осы дүниені жасап шықтық. Телефондағы екі адамның сөйлесіп отырған ауызекі сөйлеу сөйлемін жасадық. Бұл жүйені жасағаннан кейін әлеуметтік желіге шығардық. Елге танымал еттік. Ал оны әлеуметтік желіге қойғаннан кейін арнайы сервер керек. Ол серверге қосылатын адамдардың саны артқан сайын сервер де, бот та істемей қалады. Серверді дамытып отыру үшін де әрине алдымен қаржы керек. Мысалы, біз өндірістік компания болатын болсақ, онда мысалы, Google компания­сы серверді өсіріп отырады. Ал біздің қуатымыз жетпей қала береді. Енді қазір пайдаланушылар саны 16 мыңнан асып кетті. Сондықтан сервер жиі құлап қала береді. Көбісі «бот істемей қалды» дейді, қайта жүктейміз, қайтадан істейді. Адам саны қайта артқанда, тағы да құлап қалады. Ең алаңдайтыны, осындай мәселелер туындап тұр. 
– Ал әлеуметтік желідегі ботта неге адам санына шектеу қойып отырсыз? Бұл қаржыға тікелей байланысты ма?
– Адам санының шектеулі болып отыр­ған себебі, құ­рылғылар керек болады. Сер­верлерді жо­баға алған кезде, жобаға көп ақша берілмейді. Аз ақшаның өзі зерттеуге ғана беріледі. Ғылыми зерттеу және нәтиже бар. Бұл өте күрделі жол. Оның ғылыми жағын, іргелі зерттеуін жүргізіп алғаннан кейін, сол модельдің негізінде жаңа қолданбалы затты жасап шығасың. Іргетасын құйып, керегесін қалап, шатырын жабуың керек дегендей. Сосын оны патенттеп, «міне мынау менікі» деп нақтылауың керек. Соның өзі ғылымға грантпен бөлінген қаражатты жұтып қояды, қаржы жетпей қалады. Ол үшін сен қайтадан жобаға қатысып, қайта күтуің керек. Ол жобаға бөлінген ақша аз болды да, сол үшін әлсіздеу сервер алуға тура келді. Ол жоғарыда айтқандай, мың адамдық қолданыста тұрған дүниені сақтап тұрады. Ақпарат түседі, шығады. Сол кезде шамасы жетпей, құлап қала береді. Оны тағы күшейтсең, адамдардың саны тағы артады. Анығы, қолданушысы көбейген сайын, серверді күшейтіп отыруың керек. 
– Нидерландық Philips компаниясымен келісімшарт жасапсыздар. Бұл қаржы мәселесін шешпей ме?
– Біз серверді әлеуметтік желіге қой­ғанда, Philips компаниясы байланысқа шықты. «Бізде ағылшын, қытай, орыс тілі бар. Диктофонның мыңнан аса түрі бар. Соған сіздер өздеріңіздікін енгізсеңіздер, біз сата береміз, сіздерге пайдасын береміз. Біздің мүмкіндікті пайдаланып осы елге сатсаңыз да болады», – деді. Олар бізге аппаратын ашып берді, біз бағдарламамызды қойып, аппаратпен байланыстырып, өз патентімізді көрсеттік. Осы жүйені енгізіп бергеннен кейін олар біздің нарыққа шығып жатыр. Бірақ бізде жиналыс орысша өтеді, орысша жазып, оны қазақшаға аударып, формальды түрде ғана қолданады. Сондықтан біздің жұмысты апарсаң, кішкене қарайды да, «орыс тілі бар ма?» дейді «Бар» десең, жеке-жеке ала алмаймыз, екі тілде сөйлейтін дүние керек» дейді. «Орысша-қазақша сөйлеп отырғанда аударады» дейді. Ал оны бөлек дамытып, жетілдіру керек қой. Ол үшін бөлек қаражат сұрауымыз керек. Ал ол дүниені Яндекс компаниясы еркін алып кете алады, олар қазір «шала қазақша» дүние жасап жатыр. Бізден мәлімет сұрайды. Осындай мәселе көп. 
Бұл жүйені біз Премьер-министрдің канцеляриясына да көрсеттік. Олар­дың жиналыстары ашық және жабық өтетіндіктен, «серверді бізге қойып бер» дейді. Жеке-жеке емес, екі тілде сөйлейтінін сұрайды. «Қаражат бөле­сіздер ме?» десек, сұрақ жауапсыз қалады. Мемлекеттік ұйымдар да осылай. Ал жеке компанияларды айтсақ, «қазақ тілінде керек» деп бір-екеуі алды, ал қалғандары қажет етпеді. Бірақ біз­дің жұмыс мұнымен тоқтап қалған жоқ. 
– Демек, ұсыныс бар ғой?
– Иә. Мүмкіндігі шектеулі жандар «Алиса», «Siri» қазақша жүйе жасауы-мызды сұраған. Қазір соның жолын іздеп, жұмыс істеп жатырмыз. Бұл біздің мүмкіндігімізді тоқтатпайды. Менің ойымша, бұл мәселенің көтерілуінің өзі жақсы. Қолданыстағы дүние болашақта дамып, үлкен өзгеріске ұшырайды деп сенеміз. Бұған дейін де Google жүйесінде қазақша аударма жоқ еді, қазір бар. Windows -та қазақша синтез жоқ еді, қазір пайда болды. Енді менің мемлекеттен сұрап отырғаным, бізге Windows жүйесін ашып берсе, біз тану процесін енгізер едік. Синтез бар, сөйлеу процесі бар, өте жақсы емес пе? Енді Windows, Apple жүйесіне енгізуге мүмкіндік берсе, қазақ тілінің қолдану аясы кеңейе түсер еді. 
– Журналист диктофондағы сұхбатын сағаттап қағазға түсіріп отырады. Өзгелер секілді бірден Word парақшасына түсіретін мүмкіндік жақын арада туа ма?
– Оның мүмкіндігі өте оңай. Тек жоғарыда айтқанымдай, бізге Windows жүйесін ашып берсе, біз қазақ тіліндегі бағдарламамызды салып берер едік. Онда сіз Word парақшасын ашып, бір кнопкамен аудионы мәтінге түсіре аласыз. Бізде дайын дерек бар. Сол деректі құйып берер едік. Қазір біздегі дайын деректің өзін пайдалана алмай отырмыз. Бізге байланыс керек. Синтез жасалып тұр, мәзірі де қазақшаланған, тек қолданып жатқан жоқпыз. Жоғарыда айтқанымдай, мемлекеттен қолдау болса екен дейміз. 
– Айналып келгенде, осының бәрі мемлекеттік тілдің деңгейін көрсетеді емес пе? Жалпы қазақ тілінің мемле­кеттік деңгейіне көңіліңіз тола ма?
– Қарап тұрсаңыз, мемлекеттік тілдің қолдану аясы әлі де төмен. Өйткені жиналыс толығымен орысша жүреді, хаттамалар орысша толтырылады. Ұйымдарды қараңыз, түгел орысша. Қазақша хаттамалар толтырылмайды. Сондықтан жоғары жақтан бастап талап етілуі керек. «Міне, мынаны тек қана қазақша істеңдер, орысша керек пе, өздері аударып алсын» деген талап болғаны дұрыс. Бұған негізі біздің қоғам мәжбүрлеп алып келе жатыр. Қарап отырсаңыз, қазақтың балаларының саны өсіп, мектепте қазақ тілінде оқытуды талап ете бастадық. Тіл сұраныс бар кезде дамиды. Ал сұраныс қай кезде туады? Мысалы, халықтың саны 300 миллионға жеткен кезде сұраныс өзінен-өзі пайда болады, экономикалық сұраныс, тілдік сұраныс. Сол кезде тілің де еркін дамиды. 
– Ғылым үнемі жетілуді талап етеді, ал бұл интеллектуалды жүйенің нәтижесі не болмақ? Алда қандай жоспарыңыз бар?
– Болашақта адам сияқты тыңдап, сөзді ұғып, қайтадан жауап бере алатындай интеллектуалдық жүйе жасағым келеді. Ол – менің арманым. Мен қазір не айтып отырмын, соның бәрін ол мәтінге айналдырып отыр. Енді қарасаңыз, осы мәтінді сұрақ сияқты қойып, диалог жасауға мүмкіндік бар. Мына жерде менің сөзіме оған жауап құрастыруға болады. Сосын жауапты қайтадан дауысқа айналдыруға мүмкіндік бар. Біз осы үш модельдің екеуін жасай аламыз: дауыс тани алатын және мәтінді дауысқа айналдыра алатын. Соны интеллектуалдық диалогқа айналдырсақ, онда мен адаммен диалог құрай алатын интеллектуалдық жүйе жасай аламын. Егер ол қазақ тілінде осылай сөйлей алатын болса, «мен қазақша сөйлеп, қытайша айтыңызшы» десем, аударып, қытайша сөйлеп береді. Сол кезде екі тілде сөйлесу арқылы аударма жасайды. Мен оны жүйеге орната аламын. Мысалы, «Siri», «Алиса» сияқты мобильдік жүйеге қоя аламын. Соны істеуді армандаймын. Қазіргі кезде тағы бір бағыт, яғни медицина саласына көңіл бөліп жатырмын. Медицина саласында МРТ, томографияда өте көп сурет бар. Мысалы, көзге сәуле шашу арқылы сөйлесу және көздің моделін жасауға болады. Осы модель бойынша көздегі патологияларды анықтауға мүмкіндік бар. Қазір көз аурулары институымен бірге жұмыс істеп жатырмыз. Ол жерде көзді түсіретін 12 аппарат бар. Сол жерде әртүрлі аурудың түрін анықтауға мүмкіндік беретін эксперттік жүйе жасауға көштім. Оны америкалықтар ELSA дейді, бұл да сол сияқты жүйе болады. Бас дәрігер отырады, сіздің суретіңізді алып, компьютерге салған кезде параметрлерін анықтап береді. Сосын архив ретінде оның тарихын сақтап отырады. Созылмалы ауру болатын болса, асқынып бара жатыр ма, асқынып бара жатса, тезірек шешім қабылдау керек деп нұсқау береді. Осылай телемедицина жүйесін дамытып жатырмыз. Бұл аймақта тұратын адам үшін де оңтайлы, ол жерде әрине, маман жоқ. Қолындағы суретті мобильдік қосымша арқылы түсіреді де, ол сервермен дәрігерге келіп түседі. Дәрігер аурудың себебін анықтап, қажетті ем-шара жазып жібереді. Қазір осылай телемедицина саласымен жұмыс істеп жатырмын. 
– Жасанды интеллект қайда бара жатыр? Даму тенденциясы қандай?
– Қазір жасанды интеллект біздің өмірімізге тікелей еніп, күнделікті тіршілік үдерісімізді жеңілдетуге көмектесіп жатыр. Бұл болашақта бізге талдау жасап, оңтайлы шешім қабылдауға мүмкіндік береді. Болашақта көптеген процестерді өзіндік басқаруға мүмкіндік беретін жағдайға жетеді деп ойлаймын. 
– Әңгімеңізге рақмет!

Сұхбаттасқан
Ақбота МҰСАБЕКҚЫЗЫ

1097 рет

көрсетілді

0

пікір

Біздің Telegram каналына жазылыңыз

алдымен сізді қызықтыратын барлық жаңалықтарды біліңіз